17万条推理轨迹扒出AI推理的真相:有劲儿,但用错了地方|哈佛新论文解读
《AI未来指北》论文解读专栏,以一线视角和最易懂的语言拆解顶会顶刊精华。 文|博阳 编辑|郑可君 站在2025年的尾巴上回望,这绝对是 AI 历史上最具割裂感的一年。 一方面,Google 刚刚发布的 Gemini 3 再次以一种近乎暴力美学的方式验...
《AI未来指北》论文解读专栏,以一线视角和最易懂的语言拆解顶会顶刊精华。 文|博阳 编辑|郑可君 站在2025年的尾巴上回望,这绝对是 AI 历史上最具割裂感的一年。 一方面,Google 刚刚发布的 Gemini 3 再次以一种近乎暴力美学的方式验...
来源:腾讯科技公众号 爱 好奇 2周前(11-19) 266浏览 0评论
文 |博阳 编辑 |郑可君 在经历了GPT-5、Grok 4和Claude Sonnet小升级后,2025年下半年,AI领域陷入了阶段性平淡。 直到今天,Gemini 3的发布彻底打破了平淡。 跃进式的得分提升、强大的多模态理解力、更加多样化的UI、...
来源:追问nextquestion公众号 爱 好奇 3周前(11-15) 120浏览 0评论
近年来,AI的迅猛发展也使科研范式发生了根本性变革。谷歌基于Gemini 2.0的多智能体系统“co-scientist”在48小时内便独立复现并扩展了人类研究者历时十年才确立的超级细菌耐药机制假设,甚至提出了额外且合理的全新理论;而DeepMind...
来源:New Economist 公众号 爱 好奇 3周前(11-14) 106浏览 0评论
LLM只是“黑暗中的文字匠”?李飞飞:AI的下一个战场是“空间智能” 美国当地时间11月10日,“AI教母”李飞飞亲自撰文,生成AI的下一个战场是“空间智能”(Spatial Intelligence)。她首次系统性地解释了什么是空间智能?它为什么如...
来源:集智俱乐部公众号 爱 好奇 4周前(11-08) 143浏览 0评论
导语 意识,作为我们主观体验的核心,仍然是科学最深奥的谜题之一。随着人工智能的迅速发展,理解意识已不仅是哲学讨论,而成为紧迫的科学与伦理议题。这篇10月30日由认知神经科学家 Anil K. Seth、Axel Cleeremans 与 Liad M...
来源:腾讯科技公众号 爱 好奇 4周前(11-07) 134浏览 0评论
文|博阳 编辑|可君 2025年6月,Shopify CEO Tobi Lütke 和 AI 大神 Andrej Karpathy 在 X 上提出了一个新概念——上下文工程。Karpathy 将其定义为”一门微妙的艺术与科学,旨在填入恰到...
来源:DeepTech深科技公众号 爱 好奇 1个月前(10-22) 147浏览 0评论
在“AGI 近在咫尺”的热潮中,这位 AI 领域的核心人物选择踩下了刹车。Andrej Karpathy,曾任特斯拉 AI 总监、OpenAI 创始成员的硅谷顶尖技术专家,近日在 Dwarkesh Patel 的播客中发表了一场长达两个多小时的深度对...
来源:腾讯科技公众号 爱 好奇 2个月前(10-18) 185浏览 0评论
文|博阳 编辑|郑可君 最近一段时间,AI界掀起了一场关于LLM能否通向AGI的激烈争论。 一边是以OpenAI、Google等为代表的企业界,他们坚信当前的模式和Scaling Law(扩展定律)能够实现人工通用智能(AGI);另一边是以强化学习之...
来源:学术头条公众号 爱 好奇 2个月前(10-12) 168浏览 0评论
思维链(CoT)提示技术已被证明能提升大语言模型(LLM)在各类任务中的表现。采用该方法时,LLM 似乎会先生成类似人类的推理步骤(即 CoT 推理),再给出最终答案,这往往让人觉得 LLM 正在进行深思熟虑的推理过程。 然而,亚利桑那州立大学团队在...
来源:果壳公众号 爱 好奇 2个月前(10-09) 184浏览 0评论
这是10月7日在瑞典斯德哥尔摩拍摄的2025年诺贝尔物理学奖公布现场。 在量子物理的世界里,常常会发生一些违反直觉的事情:粒子能穿过墙壁、能量像硬币一样一枚一枚地发放、一个系统能同时处在两个状态之中。这样的现象看似只存在于微观世界,远离我们的日常经验...
来源:学术头条公众号 爱 好奇 2个月前(10-03) 193浏览 0评论
在日前参加的一个访谈中,强化学习之父、图灵奖得主 Richard Sutton 语出惊人:大语言模型(LLM)是一个错误的起点,是一条死胡同。 在 Sutton 看来,真正的智能源自经验学习,通过行动、观察与反馈持续修正行为,实现目标;相比之下,大语...
来源:阿里巴巴公众号 爱 好奇 2个月前(09-26) 174浏览 0评论
9月24日,2025云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主旨演讲,他认为实现通用人工智能AGI已是确定性事件,但这只是起点,终极目标是发展出能自我迭代类的超级人工智能ASI。 吴泳铭首次系统阐述了通往ASI的三阶段演...
来源:腾讯科技公众号 爱 好奇 3个月前(09-15) 178浏览 0评论
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
来源:机器之心公众号 爱 好奇 3个月前(09-09) 262浏览 0评论
AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。 大模型会有幻觉,这几乎已经成为一个常识,让每一个严肃使用大模型的人都不得不谨慎小心。Open...
来源:智东西公众号 爱 好奇 3个月前(08-25) 240浏览 0评论
大模型像外星事物,搞清楚它们在想什么很重要。 编译 | 程茜 编辑 | 心缘 智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?...
来源:追问nextquestion公众号 爱 好奇 5个月前(07-01) 458浏览 0评论
人工智能的终极梦想,从来不局限于打造一个能击败国际象棋特级大师的博弈引擎,或是设计出花言巧语蛊惑人心的聊天机器人。它的真正使命,是成为一面映照人类智慧的明镜,帮助我们更深刻地认识自我。 科研工作者的目标,也不止于是狭义的人工智能,他们追求的是通用型人...
来源:腾讯研究院公众号 爱 好奇 5个月前(06-30) 317浏览 0评论
闫德利 腾讯研究院资深专家 一、AI已在诸多任务领域超越人类 AI发展日新月异,在许多任务上已经陆续超越人类基线水平。如2015年图像分类,2018年中等水平阅读理解,2020年视觉推理、英语语言理解,2023年多任务语言理解、竞赛级数学,2024年...
来源:中信书院公众号 爱 好奇 5个月前(06-24) 342浏览 0评论
凯文·凯利,被奉为“互联网教父”的科技先知,1994年就在《失控》一书中“看见”了我们的今天——云计算、分布式网络、物联网雏形、Web 2.0的共享经济、以及我们每天离不开的“屏读”生活。 今天,这位洞穿时代迷雾的观察者,再次带来震撼新作《2049》...
来源:徐德文科学频道公众号 爱 好奇 6个月前(06-03) 356浏览 0评论
5月27日,麻省理工蒋业明团队在顶级专刊《焦耳》发表重磅研究,宣布发明了一种全新的钠-空气燃料电池,能量密度高达1200 Wh/kg,是目前电动车锂电池的4倍以上!更令人震惊的是,这种电池不仅能让飞机”喝空气就能飞”,运行成本...
来源:腾讯科技公众号 爱 好奇 6个月前(05-25) 455浏览 0评论
《AI未来指北》特约作者|博阳 木木 编辑|萌萌 超级省流版: 1)速览本次大会发布十余款新品: 基础模型: Gemini 2.5 Flash 新版:毫秒级推理、稀疏 MoE 路由,性能更强。 Gemini 2.5 Pro + Deep Think ...