GPT-5 为啥不 “胡说” 了?OpenAI 新论文讲透了
来源:腾讯科技公众号 爱 好奇 20小时前 15浏览 0评论
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
来源:腾讯科技公众号 爱 好奇 20小时前 15浏览 0评论
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。 大模型会有幻觉,这几乎已经成为一个常识,让每一个严肃使用大模型的人都不得不谨慎小心。Open...
来源:数字生命卡兹克公众号 爱 好奇 4周前(08-17) 140浏览 0评论
GPT-5和“还我GPT-4o”的风波,闹得沸沸扬扬。 今天,奥特曼还有一次认怂了,不仅调了UI,还把o3这些老模型还了回来。 这些其实都是产品层面的,但是我自己的心中,其实一直好奇另一个问题。 为什么GPT-5在变可靠幻觉率变得极低了之后,他的情商...
来源:腾讯科技公众号 爱 好奇 7个月前(02-18) 522浏览 0评论
郭晓静 腾讯科技《AI未来指北》特约作者 DeepSeek系列模型在很多方面的表现都很出色,但“幻觉”问题依然是它面临的一大挑战。 在Vectara HHEM人工智能幻觉测试(行业权威测试,通过检测语言模型生成内容是否与原始证据一致,从而评估模型的幻...
来源:DeepTech深科技公众号 爱 好奇 8个月前(01-13) 614浏览 0评论
人们对以 GPT 为代表的自回归大模型的“幻觉”问题认识已久。图灵奖得主、Meta 首席科学家杨立昆(Yann LeCun)就曾公开对大模型的发展提出质疑。 他指出一个根本性问题:自回归模型的错误概率会随着输出长度的增加而指数叠加,从而导致模型的幻觉...