CA888亚洲城·(中国)集团 - OpenAI 更新 ChatGPT：支持图片和语音输入

近来 OpenAI

宣告

推出新版 ChatGPT，添加了两项新功用：语音输入和图画输入。OpenAI 称，新功用将在未来两周内向 ChatGPT Plus 订阅用户推出，其他人也将“很快”能够运用这些功用。

语音输入功用类似于手机上的语音帮手，用户只需按下一个按钮，说出自己的问题，ChatGPT 就会将其转换为文本，然后生成答案，再将答案转换为语音，播放给用户。OpenAI 表明，这样的交互办法愈加天然和快捷，并且因为 LLM 的技术优势，答案的质量也会更高。OpenAI 还开发了一种新的文本转语音模型，能够依据几秒钟的样本语音，生成与之类似的人声。用户能够从五种选项中挑选 ChatGPT 的声响，并且这种模型还有更多的潜在用处。例如，OpenAI 正在与 Spotify 协作，将播客翻译成其他言语，一起保存播客主持人的声响。不过，这种模型也存在一些危险，比方或许被歹意利用来假充大众人物或进行欺诈。因而，OpenAI 表明，这种模型不会被广泛敞开，而是会遭到严厉的操控和约束。

图画输入功用则类似于 Google Lens，用户能够拍照自己感兴趣的事物，并上传到 ChatGPT 中。ChatGPT 会测验辨认用户想要问询的内容，并给出相应的答复。用户还能够用运用中的绘图东西来协助表达自己的问题，或许合作语音或文本输入来进行沟通。ChatGPT 的优势在于它能够进行多轮对话，而不是一次性查找。假如用户对答案不满意或想要更多信息，能够持续向 ChatGPT 发问，然后得到更精确和全面的答案。当然，图画查找也有一些潜在问题。例如，在处理人物图片时，OpenAI 表明他们约束了 ChatGPT 对人物进行剖析和直接点评的才能，既为了确保精确性，也为了维护隐私，这意味着上传一个人的相片就能知道他 / 她是谁还无法完成。

自从 2022 年头推出 ChatGPT 以来，OpenAI 一直在尽力为其机器人添加更多功用和才能，一起防止形成新的问题呈现。经过这次更新，该公司企图在这条界线上寻觅平衡点，经过有意识地约束其新模型能做什么来完成这一方针。可是这种办法并不是长久之计，跟着越来越多的人运用语音操控和图画查找，以及 ChatGPT 逐步成为一个真实的多模态、有用的虚拟帮手，要坚持安全和合理的鸿沟会变得越来越困难。

资讯详情

相关推荐

2024 年大众 ID.4 和 ID.5 获得更快、更直观的软件

至高 5 万美元，Instagram 想用高额奖金挖角 TikTok 创作者

腾讯起诉今日头条，要求后者索赔 1 元并道歉

58 同城旗下二手交易平台转转完成 3 亿美元 B 轮融资

苹果或在 2020 年前为 Apple Watch 增加睡眠监测功能

雷蛇 CEO 陈民亮：香港投资者仍需加强对科技公司了解