思维链CoT再遭质疑!三大证据实锤,真正可泛化推理还很远?
来源:学术头条公众号 爱 好奇 3周前(10-12) 111浏览 0评论
思维链(CoT)提示技术已被证明能提升大语言模型(LLM)在各类任务中的表现。采用该方法时,LLM 似乎会先生成类似人类的推理步骤(即 CoT 推理),再给出最终答案,这往往让人觉得 LLM 正在进行深思熟虑的推理过程。 然而,亚利桑那州立大学团队在...
来源:学术头条公众号 爱 好奇 3周前(10-12) 111浏览 0评论
思维链(CoT)提示技术已被证明能提升大语言模型(LLM)在各类任务中的表现。采用该方法时,LLM 似乎会先生成类似人类的推理步骤(即 CoT 推理),再给出最终答案,这往往让人觉得 LLM 正在进行深思熟虑的推理过程。 然而,亚利桑那州立大学团队在...
来源:36氪 爱 好奇 4周前(10-06) 129浏览 0评论
十大逻辑谬误解析。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:逻辑谬误是指存在缺陷的推理。本文列出了十大最常见的逻辑谬误,包括其其含义、示例和规避方法。本文来自编译,希望对您有所启发...
来源:老胡说科学公众号 爱 好奇 7个月前(03-24) 350浏览 0评论
从小学开始,我们被教导科学方法论:观察、研究、假设、实验、分析、得出结论。看上去完美无缺,逻辑自洽。然而,现实中的科学家很少这样工作。科学界的两大推理方式——归纳与演绎,才是科学方法的真正主角,而它们的较量,至今未分高下。 回到17世纪,英国哲学家弗...
来源:腾讯研究院公众号 爱 好奇 9个月前(02-18) 641浏览 0评论
访谈主持人 王强 腾讯研究院前沿科技研究中心主任 徐一平 腾讯研究院高级研究员 以生成式AI为代表的新技术浪潮日新月异,正带来一场深刻的技术、商业与社会变革,推动人类社会从信息社会向智能社会转变。全世界热切期待AI到来的同时,也非常关心人工智能将带来...
来源:追问nextquestion公众号 爱 好奇 9个月前(02-12) 486浏览 0评论
当我们惊叹于Deepseek的妙语连珠时,是否正目睹硅基系统对人类语言本源的复刻?那在服务器集群中奔流的矩阵运算,与人脑皮层间跳跃的神经电波,究竟共享着怎样的“语言密码”? 借助精密的脑成像技术,人们惊讶地发现,大语言模型的层级结构竟与大脑语言中枢的...
来源:腾讯科技公众号 爱 好奇 9个月前(01-26) 580浏览 0评论
【编者按】课代表系列-AI大事儿的最快、最全解读,本文关注DeepSeek-R1在技术上最重要的突破——用纯深度学习的方法让AI自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产生深刻影响。 腾讯科技《AI未来指北》特约作者 郝博阳 编辑 ...
来源:追问nextquestion公众号 爱 好奇 9个月前(01-26) 514浏览 0评论
从计算机诞生以来,人类就一直在想象如何让它们变得像科幻电影里那样聪明。从《2001:太空漫游》中的 HAL 9000,到《流浪地球》中的 Moss,人工智能在屏幕中往往高效、理性、逻辑缜密,给人留下深刻的印象。 现如今,大语言模型和深度学习让我们对“...
爱 好奇 1年前(2024-10-28) 648浏览 0评论
编辑:Aeneas 好困 【新智元导读】Transformer解决了三体问题?Meta研究者发现,132年前的数学难题——发现全局李雅普诺夫函数,可以被Transformer解决了。「我们不认为Transformer是在推理,它可能是出于对数学问题的...
来源:AI科技评论公众号 爱 好奇 1年前(2024-10-23) 469浏览 0评论
小模型干大事,DeepMind重新审视Transformer推理能力。 作者丨刘洁 编辑丨岑峰 DeepMind闷声干大事,悄悄训练了一个大小只有270M的Transformer模型,居然不需要搜索,就能实现大师级的下棋水平。 这几天的推特因为这篇2...