OpenAI发布旗舰生成式AI模型GPT-4o,所有用户都可免费使用
原标题:OpenAI发布旗舰生成式AI模型GPT-4o 所有用户都可免费使用
作者:智通财经许然
题图来源 | pexels
智通财经 APP 获悉,周一,OpenAI 的首席技术官 Muri Murati 介绍说,GPT-4o 在保持 GPT-4 级别的智能的同时,对文本、视觉和音频功能进行了改进,所有用户均可免费使用,而付费用户的容量限制是免费用户的五倍。
Murati 在 OpenAI 办公室的一次主题演讲中提到,GPT-4o 跨越了语音、文本和视觉的多个领域。OpenAI 将推出桌面版 ChatGPT 及全新用户界面。
GPT-4 是 OpenAI 之前的领先模型,它集成了图像和文本功能,能够分析图像和文本,完成从提取图像中的文本到描述图像内容等任务。而 GPT-4o 在此基础上增加了语音功能。
这一改进带来了哪些新功能?包括但不限于以下几点:
GPT-4o 显著提升了 ChatGPT 的使用体验,ChatGPT 是 OpenAI 的人工智能聊天机器人。虽然 ChatGPT 长期支持语音模式,将 ChatGPT 的文本转为语音,但 GPT-4o 在此基础上进行了优化,使用户能够更像与助手互动一样自然地使用 ChatGPT。
例如,用户现在可以在 ChatGPT 回答问题时中断它,而 OpenAI 表示,新模型能够提供“实时”响应,甚至能够捕捉到用户声音中的情感,并以不同的情感风格生成语音。
GPT-4o 还增强了 ChatGPT 的视觉功能。通过照片或屏幕截图,ChatGPT 现在可以迅速回答相关问题,从“这段代码是做什么用的”到“这个人穿的是什么品牌的衬衫”。
从即日起,GPT-4o 将在 ChatGPT 的免费版本中提供,而 OpenAI 的高级版本 ChatGPT Plus 和 Team 用户则可享有“五倍消息限制”的优势,企业选项也将“即将推出”(当用户达到使用阈值时,系统将自动转为使用 GPT-3.5)。OpenAI 表示,计划在下月左右为 Plus 用户推出改良后的 GPT-4o 语音体验。
OpenAI 还表示,GPT-4o 的多语言功能得到了增强,在 50 种不同的语言中表现更佳。在 OpenAI 的 API 中,GPT-4o 的处理速度是 GPT-4(特别是 GPT-4 Turbo)的两倍,价格则是 GPT-4 Turbo 的一半,同时拥有更高的速率限制。
用户只需发出简单的“嘿,ChatGPT”语音提示,即可获得代理的口语回应。然后,用户可以用口语提交查询,并在必要时附上文字、音频或视觉效果,后者可包括照片、手机摄像头的实时画面或代理能“看到”的任何其他内容。
在音频输入方面,人工智能的平均响应时间为 320 毫秒,与人类的对话响应时间类似。
目前,GPT-4o 的应用程序接口中尚未为所有客户提供语音功能。鉴于滥用风险,OpenAI 计划在未来几周内首先向“一小部分可信赖的合作伙伴”推出对 GPT-4o 新音频功能的支持。
其他方面,OpenAI 将在网络上发布全新的 ChatGPT UI,新的主屏幕和消息布局“更具对话性”,同时还将发布桌面版的 ChatGPT for Mac,用户可以通过键盘快捷键向 ChatGPT 提问,也可以通过打字或说话截图并进行讨论(从今天开始,Plus 用户将首先获得访问权限,Windows 版本的应用程序将于今年晚些时候推出)。此外,ChatGPT 的免费用户现在还可以访问 GPT Store(OpenAI 基于其人工智能模型构建的第三方聊天机器人库)。
GPT-4o 的文本和图像功能已经开始向付费的 ChatGPT Plus 和 Team 用户推出,企业用户也即将推出。免费用户也将开始使用,但有使用限制。
语音版 GPT-4o 将“在未来几周内”开始提供。开发人员将能够使用 GPT-4o 的文本和视觉模式,并在未来几周内向“一小部分值得信赖的合作伙伴”提供音频和视频功能。
文章信息来自于智通财经App ,不代表白鲸出海官方立场,内容仅供网友参考学习。对于因本网站内容所引起的纠纷、损失等,白鲸出海均不承担侵权行为的连带责任。如若转载请联系原出处
友情提醒:白鲸出海目前仅有微信群与QQ群,并无在Telegram等其他社交软件创建群,请白鲸的广大用户、合作伙伴警惕他人冒充我们,向您索要费用、骗取钱财!