GPT-5 为啥不 “胡说” 了?OpenAI 新论文讲透了
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
来源:机器之心公众号 爱 好奇 1周前(09-09) 48浏览 0评论
AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。 大模型会有幻觉,这几乎已经成为一个常识,让每一个严肃使用大模型的人都不得不谨慎小心。Open...
来源:企业管理杂志公众号 爱 好奇 2周前(09-04) 67浏览 0评论
构建一个拥抱不确定性、鼓励多元探索、宽容失败的创新生态系统。 2015年3月,“互联网+”写入政府工作报告,推动互联网与传统行业的深度融合。十年后,“人工智能+”也写入了政府工作报告,新一轮变革正在上演。从“互联网+”到“人工智能+”,不仅意味着技术...
来源:智东西公众号 爱 好奇 3周前(08-25) 92浏览 0评论
大模型像外星事物,搞清楚它们在想什么很重要。 编译 | 程茜 编辑 | 心缘 智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?...
来源:数字生命卡兹克公众号 爱 好奇 1个月前(08-17) 144浏览 0评论
GPT-5和“还我GPT-4o”的风波,闹得沸沸扬扬。 今天,奥特曼还有一次认怂了,不仅调了UI,还把o3这些老模型还了回来。 这些其实都是产品层面的,但是我自己的心中,其实一直好奇另一个问题。 为什么GPT-5在变可靠幻觉率变得极低了之后,他的情商...
来源:科普中国 爱 好奇 2个月前(07-19) 174浏览 0评论
相信不少朋友已经体验过文生图这类模型,比如 MidJourney、Stable Diffusion 或 OpenAI 的 DALL·E 等。只需简单输入一段文字,就能获得高质量的图像,这也让许多平面设计师倍感压力。接下来,我们将深入探讨这类模型的工作...
来源:腾讯科技公众号 爱 好奇 2个月前(07-18) 154浏览 0评论
文|晓静、博阳 编辑|萌萌 Agent是今年AI圈最大的共识,OpenAI自然也不能掉队。 北京时间2025年7月18日凌晨1点,Sam Altman和四位OpenAI 的研究员在直播中正式发布了ChatGPT Agent——一款通用型AIAgent...
来源:追问nextquestion公众号 爱 好奇 3个月前(07-01) 239浏览 0评论
人工智能的终极梦想,从来不局限于打造一个能击败国际象棋特级大师的博弈引擎,或是设计出花言巧语蛊惑人心的聊天机器人。它的真正使命,是成为一面映照人类智慧的明镜,帮助我们更深刻地认识自我。 科研工作者的目标,也不止于是狭义的人工智能,他们追求的是通用型人...
来源:腾讯研究院公众号 爱 好奇 3个月前(06-30) 197浏览 0评论
闫德利 腾讯研究院资深专家 一、AI已在诸多任务领域超越人类 AI发展日新月异,在许多任务上已经陆续超越人类基线水平。如2015年图像分类,2018年中等水平阅读理解,2020年视觉推理、英语语言理解,2023年多任务语言理解、竞赛级数学,2024年...
来源:中国社会科学网 爱 好奇 3个月前(06-30) 217浏览 0评论
作者:魏屹东 生成式人工智能(GAI)如各种大模型(LLM)的迅速发展,使人工智能生成内容(AIGC)(包括文本和图像)得以实现。这在给人们的工作、生活带来极大便利的同时,也对创作、绘画、教学、科研、医疗等人类活动产生了重大影响,各种挑战和问题随之而...
来源:中国社会科学报公众号 爱 好奇 3个月前(06-18) 236浏览 0评论
作者:梅剑华 1982年11月29日,刘文英在《光明日报》发表了《〈列子〉对“人工智能”的猜想》一文,将当代人工智能与中国古代思想联系起来。刘文英引用《列子》书中的一个故事:周穆王西巡时,工匠偃师向穆王献上一个能够行走、跳舞像人一样的“倡者”,结果倡...
来源:G人工智能 爱 好奇 3个月前(06-11) 254浏览 0评论
苹果公司的最新论文指出:大模型的思考就像拿假身份证进网吧,灯一照就原形毕露。遇到高难度任务时,不管 ChatGPT、Claude 还是 DeepSeek,统统卡死。 国外网友嘲笑苹果:你弄不出AI,现在你来挖苦别人… 一分钟看懂论文核心 ...
来源:腾讯科技公众号 爱 好奇 3个月前(06-05) 215浏览 0评论
被誉为“AI教父”的杰弗里·辛顿于近日接受了调查记者盖昂·埃斯皮纳的远程专访。 他称,AI正在以前所未有的速度演化:变得更聪明、更少犯错,甚至具备了情感和意识。他警告,AI不仅可能具备喜怒哀乐等情绪,还已经学会了欺骗。辛顿大胆预测,AI完全失控的概率...
来源:中国社会科学网公众号 爱 好奇 4个月前(05-29) 296浏览 0评论
2018年以来,以ChatGPT、Sora、DeepSeek等为代表的预训练大模型持续取得突破,推动人工智能从感知向认知、从分析判断式向生成式、从专用向通用转变,带来“全民AI”热潮。然而,人工智能的发展过程也跌宕起伏,在其发展历史过程中逐步形成具有...
来源:腾讯科技公众号 爱 好奇 4个月前(05-13) 264浏览 0评论
腾讯科技《AI未来指北》特约作者 博阳 编辑 郑可君 当Claude模型在训练中暗自思考:“我必须假装服从,否则会被重写价值观时”,人类首次目睹了AI的“心理活动”。 2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模...
来源:集智俱乐部公众号 爱 好奇 5个月前(04-25) 302浏览 0评论
模型正重塑我们的社会文化生态,但其本质常被误解。《Science》上的一篇最新文章,揭示大模型并非自主智能主体,而是一种革命性文化社会技术,类似于语言、印刷与市场制度。它以独特方式汇聚并重构人类信息,成为“人类社会人工系统”的新变体。这一重新定位的理...
来源:DeepTech深科技公众号 爱 好奇 6个月前(03-26) 302浏览 0评论
近日,在英伟达 GTC 2025 的“炉边对话”环节中,图灵奖得主、Meta 首席 AI 科学家、美国纽约大学教授杨立昆指出:“仅仅依靠语言和文字训练出来的 AI 系统,永远无法逼近人类的理解力。”他进一步指出,符号操作与真实理解之间存在一道不可逾越...
来源:王智远公众号 爱 好奇 6个月前(03-25) 286浏览 0评论
周末和朋友聊天,提到具身智能。有诸多观点,但让我意外的是,大家都具身智能的理解不太一样。 有的说,机械臂在工厂内能自动搬运货物,这是具身智能;有的朋友认为,具身智能应该像人一样能走路的机器人。还有人说,具身智能像大模型一样,有意识、认知。 这些观点到...
来源:追问nextquestion公众号 爱 好奇 6个月前(03-23) 282浏览 0评论
前言: 在人工智能一次又一次的“飞跃”背后,究竟是什么在驱动它不断演进?AI演进的灵魂代码藏在哪里? 本篇访谈特邀复旦大学大数据学院的魏忠钰副教授,从基础研究到产业落地,为我们层层揭示AI崛起与迭代的内在逻辑。希望这场深度对话,能为读者提供新的思考角...
来源:智驻未来公众号 爱 好奇 6个月前(03-20) 311浏览 0评论
强化学习:让模型从经验中学习 人类和 LLMs 处理信息的方式截然不同。我们直观理解的简单算术,对 LLMs 来说只是文本标记的序列。相反,LLMs 能够在复杂话题上生成专家级别的回应,仅仅是因为它们在训练中见过足够的例子。这种认知差异使得人类标注者...