GPT-5 为啥不 “胡说” 了?OpenAI 新论文讲透了
来源:腾讯科技公众号 爱 好奇 13小时前 14浏览 0评论
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
来源:腾讯科技公众号 爱 好奇 13小时前 14浏览 0评论
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。 大模型会有幻觉,这几乎已经成为一个常识,让每一个严肃使用大模型的人都不得不谨慎小心。Open...
来源:真格基金公众号 爱 好奇 7个月前(03-01) 495浏览 0评论
大家好,我是 Monica.im 的产品合伙人张涛。 相信大家和我一样,整个春节期间几乎都在抱着手机刷信息。白天看国内的反应,晚上看美国的反应。整个春节就这样度过了。春节后这一周,大家已经在各种微信公众号和其他平台上刷了大量关于 R1 的分析文章,从...
来源:36氪 爱 好奇 7个月前(02-21) 374浏览 0评论
吹智能体的都是没用过的。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:很多预测都认为今年是智能体爆发之年。但一位博主用自己的亲身实践指出,AI的不确定性是很大的麻烦,智能体不大可能接管...
来源:钛媒体公众号 爱 好奇 8个月前(01-31) 490浏览 0评论
从技术格局来看,尽管DeepSeek的成果缩小了中美在人工智能技术上的差距,但中美人工智能整体格局尚未被撼动。 图片图片来源:the Verge 眼下科技圈最关注的莫过于Deepseek事件。网络上充斥着各种技术与财务分析。在此,我愿分享一些个人见解...
来源:腾讯科技公众号 爱 好奇 8个月前(01-29) 1378浏览 1评论
比技术更重要的是愿景。 腾讯新闻科技主笔 张小珺 编辑 马龙 DeepSeek-R1以始料未及的速度引发了全球AI社区的狂热,但有关DeepSeek的高质量信息相对匮乏。 2025年1月26日,拾象创始人兼CEO李广密,组织了一场关于 DeepSee...