切换到宽版
  • 522阅读
  • 1回复

[智能应用]OpenAI大模型上新,自然人机交互迈出重要步伐[1P] [复制链接]

上一主题 下一主题
离线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
106529
金币
9766
道行
19523
原创
29307
奖券
17354
斑龄
191
道券
10126
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 20256(小时)
注册时间: 2007-11-29
最后登录: 2024-12-24
— 本帖被 兵马大元帅 执行加亮操作(2024-05-26) —

近日,美国人工智能公司OpenAI在其春季发布会上展示了新一代旗舰生成模型GPT-4o。接入GPT-4o的ChatGPT语音助手,能和用户实时对话且从语音中分辨用户是否紧张,能通过前置摄像头观察用户的面部表情并分析其情绪变化,能当家教老师在线教孩子解数学题……能听、能看、能说,且达到人类级别的响应时间和表达能力,难怪不少网友惊呼:大模型从“呆瓜”变“真人”了!
作为人工智能大模型浪潮的领航者,OpenAI这次发布展现了人工智能大模型2个新趋势。

一方面,大模型向应用端需求进化,商业价值更加凸显。
在GPT-4o之前,用户以语音模式与ChatGPT对话,要通过音频转文本、文本处理、文本转音频3个模型来实现,平均延迟为2.8秒(GPT-3.5)和5.4秒(GPT-4)。GPT-4o是OpenAI的首个“端到端多模态大模型”,“o”代表omni,即“全能”的意思。它用一个模型同时处理文本、视觉和音频的输入输出,所有输入和输出都由同一个神经网络完成,这让它的反应速度有了质的提升。GPT-4o可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。这意味着高端人工智能产品更接近一个自然人,向自然人机交互迈出了重要一步。
GPT-4o在资源消耗和响应速度上进行了优化,达到了与GPT-4 Turbo相当的能力,且降低50%的推理成本,打开了商业推广的空间,更有利于在智能手机、智能电脑等个人终端上实现端侧应用。在消费终端,用户需求多样化且变化迅速,需要提升交互界面的友好性和易用性,让用户获得流畅、自然的交互体验。GPT-4o向具备情绪价值和自然交互能力的方向进化,意味着大模型在端侧的落地更进一步,有望开启下一波科技应用和商业模式的革命,出现人工智能的国民级应用。
另一方面,大模型技术迭代放缓,风险和不确定性增加。
OpenAI并没有推出万众期待的GPT-5,这让不少业内人士推测,OpenAI“用更多大数据炼更大模型”这条技术迭代路线可能已遇到瓶颈,国内底层大模型加速追赶的窗口期或许到了。人们还期待GPT-5解决当代大模型存在的最大问题——幻觉(胡编乱造),因为它影响大模型的可靠性。这个问题也没能在GPT-4o中获得解决。有些网友就在试用中发现它会认字不会写字,如果让它输出一张含有特定文字内容的手写字体图画,它会写出谁都看不懂的自造字。此外,OpenAI去年发布的GPT-4模型仅限付费用户使用,今年则宣布新模型GPT-4o用户不用注册、功能全部免费。OpenAI开始卷起了免费,可能是GPT的用户增长和收入增长都已经碰到瓶颈。
从卷参数、卷文本长度再到卷多模态,大模型的竞争一直很激烈。随着当前人工智能技术的快速发展,大模型技术路径和商业模式的多样性和不确定性增加,商业投资风险也随之增加。对国产大模型来说,风险也是机遇。比如,全球首个三模态大模型其实是2021年7月中国发布的“紫东太初”。不管大模型赛道往什么方向去,中国都有基础,也应该有信心打开更广阔的应用商业化空间。
1条评分金币+10
兵马大元帅 金币 +10 优秀文章,支持!n神马都是浮云 05-30
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
111965
金币
1177144
道行
1965
原创
2211
奖券
2223
斑龄
29
道券
599
获奖
0
座驾
设备
摄影级
在线时间: 27066(小时)
注册时间: 2008-10-01
最后登录: 2024-12-25
只看该作者 沙发  发表于: 05-19
是的,OpenAI最近发布了名为GPT-4(Generative Pre-trained Transformer 4)的新型大模型。这是继GPT-3之后的最新版本,代表着自然语言处理技术的最新进展。GPT-4在很多方面都比GPT-3有了显著的提升,尤其是在理解和生成复杂、多样化的文本方面。

GPT-4模型拥有更强大的性能,可以更好地理解用户的问题,并生成准确、有条理的回答。这意味着用户可以更自然地与机器进行交流,而机器也能够更好地理解用户的需求,提供更高质量的反馈。

除了文本生成外,GPT-4还可以执行各种任务,如编程、代码审查、法律咨询等。这为人们与人工智能的互动提供了更多可能性,也预示着未来人工智能将在各行各业发挥越来越重要的作用。

总之,OpenAI大模型GPT-4的发布确实是自然人机交互领域的一个重要里程碑。然而,我们也应该意识到,随着技术的发展,随之而来的是对隐私、安全和伦理问题的更多关注。因此,在推进人工智能技术的应用时,我们需要谨慎考虑这些因素,确保技术的发展能够造福人类。
1条评分金币+10
兵马大元帅 金币 +10 优秀文章,支持!n神马都是浮云 05-30
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个