OpenAI 发布 GPT-4o 大模型:免费开放使用,语音对话媲美真人
在今天凌晨的OpenAI发布会上,最新升级的大模型GPT-4o正式发布。
GPT-4o的“o”代表“omni”。该词意为“全能”,源自拉丁语“omnis”,在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。
GPT-4o可以实时对音频、视觉和文本进行推理,能处理超过50种不同的语言,并且速度和质量大大提升。
此前GPT-3.5语音对话的平均延迟为2.8秒、GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,无法识别笑声、歌唱声和情感表达等。
而GPT-4o可以在232毫秒内对音频输入做出反应,甚至还能随意打断,与人类在对话中的反应时间相近,彻底颠覆了以往的“语音助手”。
GPT-4o在现场充当实时翻译也是相当的丝滑,意大利语和英语即听即翻。
最重要的是,GPT-4o还可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,人机交互更加自然、全面了。
GPT-4o的能力还会向免费用户开放,不过会限制数量,免费用户达到数量之后,会自动跳回GPT-3.5。
GPT-4o还将开放相应API给GPT的开发者,价格是GPT-4-turbo的一半,速度却是GPT-4-turbo的两倍,速率限制也高5倍。
官方表示,GPT-4o将会在未来几周内陆续开放。
此外,OpenAI还推出了ChatGPT的桌面版应用,不过目前只有MacOS版本,Windows版要稍晚一些亮相。
本文经快科技授权发布,原标题:OpenAI发布GPT-4o:可免费开放使用 语音对话媲美真人,文章内容仅代表作者观点,与本站立场无关,未经允许请勿转载。
哆喵呜
校验提示文案
弗兰肯斯坦的汉堡
校验提示文案
寂夜挽歌
校验提示文案
第一男神的春天
校验提示文案
Sipar
校验提示文案
闻宝
校验提示文案
把示君
校验提示文案
潇潇暮雨子
校验提示文案
lerv
校验提示文案
肯富犹慎
校验提示文案
红三剁
校验提示文案
realpk
校验提示文案
值友8253265488
校验提示文案
xiaonan2016
校验提示文案
耿翊嘉
校验提示文案
流星蜚语
校验提示文案
酱油
校验提示文案
值友3668324756
校验提示文案
南极冬414
校验提示文案
HILT
校验提示文案
值友7357827036
校验提示文案
流水式冲锋
校验提示文案
xHusky
校验提示文案
beautifuleyes
校验提示文案
没见过世面的样
校验提示文案
iamnio
校验提示文案
cola丿六芒星
校验提示文案
值友4780865261
校验提示文案
stsuperman
校验提示文案
白日梦不醒
校验提示文案
李上网来V
校验提示文案
smxxy
校验提示文案
我要来买买买
校验提示文案
值友9618427826
校验提示文案
不二魔王
校验提示文案
后海没有海
校验提示文案
中国人不打中国人
校验提示文案
jy84848
校验提示文案
栅桥人
校验提示文案
懒人御龙
校验提示文案