OpenAI 更新 ChatGPT:支持图片和语音输入

近来 OpenAI

宣告

推出新版 ChatGPT,添加了两项新功用:语音输入和图画输入。OpenAI 称,新功用将在未来两周内向 ChatGPT Plus 订阅用户推出,其他人也将“很快”能够运用这些功用。

语音输入功用类似于手机上的语音帮手,用户只需按下一个按钮,说出自己的问题,ChatGPT 就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。OpenAI 表明,这样的交互办法愈加天然和快捷,并且因为 LLM 的技术优势,答案的质量也会更高。OpenAI 还开发了一种新的文本转语音模型,能够依据几秒钟的样本语音,生成与之类似的人声。用户能够从五种选项中挑选 ChatGPT 的声响,并且这种模型还有更多的潜在用处。例如,OpenAI 正在与 Spotify 协作,将播客翻译成其他言语,一起保存播客主持人的声响。不过,这种模型也存在一些危险,比方或许被歹意利用来假充大众人物或进行欺诈。因而,OpenAI 表明,这种模型不会被广泛敞开,而是会遭到严厉的操控和约束。

图画输入功用则类似于 Google Lens,用户能够拍照自己感兴趣的事物,并上传到 ChatGPT 中。ChatGPT 会测验辨认用户想要问询的内容,并给出相应的答复。用户还能够用运用中的绘图东西来协助表达自己的问题,或许合作语音或文本输入来进行沟通。ChatGPT 的优势在于它能够进行多轮对话,而不是一次性查找。假如用户对答案不满意或想要更多信息,能够持续向 ChatGPT 发问,然后得到更精确和全面的答案。当然,图画查找也有一些潜在问题。例如,在处理人物图片时,OpenAI 表明他们约束了 ChatGPT 对人物进行剖析和直接点评的才能,既为了确保精确性,也为了维护隐私,这意味着上传一个人的相片就能知道他 / 她是谁还无法完成。

自从 2022 年头推出 ChatGPT 以来,OpenAI 一直在尽力为其机器人添加更多功用和才能,一起防止形成新的问题呈现。经过这次更新,该公司企图在这条界线上寻觅平衡点,经过有意识地约束其新模型能做什么来完成这一方针。可是这种办法并不是长久之计,跟着越来越多的人运用语音操控和图画查找,以及 ChatGPT 逐步成为一个真实的多模态、有用的虚拟帮手,要坚持安全和合理的鸿沟会变得越来越困难。

返回资讯列表