
在科技的浩瀚世界中,一场引人注目的演化正在展开。OpenAI正在增强其人工智能模型ChatGPT,使其能够以前所未有的方式感知和互动。通过赋予其声音和图像处理的新能力,OpenAI正在改变我们与人工智能互动的方式。我们有必要揭开这一巨大飞跃的层层面纱,理解它对我们日常与人工智能互动的影响。
“正如维克多·雨果所说,‘就像大海中有人类无法到达的深处,宇宙中也有人类无法触及的高度。’但是通过这次新的升级,我们似乎将抛下锚更深,扬起桅杆更高。
重新定义对话:声音伴侣的力量
对于那些经常手忙脚乱或更喜欢人类语言的节奏的人来说,OpenAI推出了其迄今为止最前卫的功能,即与ChatGPT进行语音对话。是的,你没有看错。现在你可以通过声音进行双向对话,这是一种科幻概念,现在已经在现实中得以实现。
要体验这一听觉革命,只需在移动应用的“设置”中选择“新功能”,并加入声音对话。然后点击右上角的耳机图标,选择你喜欢的五种不同声音风格之一。
支撑这些对话的音乐智能的基础是OpenAI的文本转语音模型,它可以从纯文本片段生成惟妙惟肖的人类音频。这一过程得益于Whisper,OpenAI的开源语音识别系统,它将你的口头表达转录成文本格式。
请听一下下面示例对话中的美妙演绎:
“在一个宁静的森林里,有一只名叫莉拉的毛茸茸的猫妈妈。一个阳光明媚的日子,她和她的顽皮小猫米洛躲在一颗古老橡树的阴影下。
“米洛,”莉拉轻柔而温和地说,“你将很快有一个新的玩伴。”
米洛的耳朵立刻竖起,满怀好奇。“一个新的玩伴?”
莉拉咕噜咕噜地说:“是的,一个妹妹。”
米洛兴奋地瞪大了眼睛。“妹妹?她会像我一样追逐尾巴吗?”
莉拉笑了笑。“哦,她会有自己的特点。你会教她,对吗?”
米洛迫不及待地点头,已经在梦想着他们将会分享的冒险。”
交换思维和像素:ChatGPT的视觉
通常,单靠文字无法完全捕捉一个时刻。现在,你可以向ChatGPT展示图片并解开它们的内涵。解决一个固执的电器问题,探索你冰箱里的潜在食谱,或者分析工作中的复杂图表从未如此简单。
只需点击照片按钮,即可开始讨论一张或一组图片。如果你想专注于图像的特定部分,可以在移动应用中使用绘图工具。
在幕后,揭示图像智慧的力量来自多模式GPT-3.5和GPT-4,这些模型展现出了能够跨越各种图像,从照片到截图,以及包含文本和图像混合的文件的语言推理能力。
安全实施,逐步扩展
为了构建既安全又有益的通用人工智能,OpenAI正在逐步部署这些创新。这是一种精心平衡用户价值、学习、创新速度和安全性的策略。这一方法在涉及声音和视觉处理的系统升级中变得尤为重要。
解决担忧:声音幻象和视觉幻觉
与任何技术一样,将AI合成声音的潜力开启了无数可能性,同时也可能使恶意行为者为可疑目的操纵声音成为可能。
OpenAI正在有意地利用这些能力用于特定用途,并与合作伙伴如Spotify合作。例如,他们的“语音翻译”功能旨在无缝扩展播客的语言影响力。
关于视觉能力的发展道路同样充满了困难。人工智能产生幻觉以及其解释的风险,特别是在高风险领域,都是合理的担忧。OpenAI通过与多样化的评估组合进行各种测试阶段,帮助确定了可接受的使用规范。
视觉:一种赋能工具
OpenAI已经采取措施确保视觉成为一种有助于而不侵犯隐私的功能。用户反馈和真实世界的使用对于帮助OpenAI提高这些保障措施以保持其实用性至关重要。
与“Be My Eyes”等组织的紧密合作,这是一款帮助视力障碍和低视力用户的应用程序,使OpenAI更多地了解人工智能视觉在日常情况下的价值,以及它的局限性所在。
承认模型的局限性:信任的前提
将AI托付以专业任务的决定,无疑是数字时代的明智之举。然而,当前的模型也有其局限性。虽然它们在转录英文文本和处理常见任务方面可能表现出色,但在处理非罗马字母脚本或在某些技术领域的未知领域时,它们可能会出现问题。OpenAI对这些局限性非常了解,并建议用户在没有适当验证的情况下不要依赖ChatGPT进行涉及重大风险的任务。
踏上无限的征程:未来的扩展
这些开创性的能力仅仅是一个开始。ChatGPT的声音和图像功能将很快提供给Plus和Enterprise用户,计划将这些功能扩展到其他用户群体和开发者。这不仅仅是一个升级;这是迈向缩小人类与人工智能世界之间差距的一大步,使我们能够更深入、更直观地与数字伙伴互动。
正如阿尔伯特·爱因斯坦所说:“智慧的真正标志不是知识,而是想象力。”在ChatGPT的案例中,这是知识与想象力的融合;已知世界变得更具导航性,而想象的世界也更加具体。
在这些更深入的与ChatGPT互动的新方法中制定一条航线。探索潜力并了解限制。当我们踏入这个AI新时代时,愿人类体验与数字世界之间的界限继续模糊。
本报告基于OpenAI的官方公告。您可以在他们的原始文章中了解更多关于OpenAI的安全方法、与“Be My Eyes”的合作以及其他详细信息。