思维链CoT再遭质疑!三大证据实锤,真正可泛化推理还很远?
来源:学术头条公众号 爱 好奇 3周前(10-12) 109浏览 0评论
思维链(CoT)提示技术已被证明能提升大语言模型(LLM)在各类任务中的表现。采用该方法时,LLM 似乎会先生成类似人类的推理步骤(即 CoT 推理),再给出最终答案,这往往让人觉得 LLM 正在进行深思熟虑的推理过程。 然而,亚利桑那州立大学团队在...
来源:学术头条公众号 爱 好奇 3周前(10-12) 109浏览 0评论
思维链(CoT)提示技术已被证明能提升大语言模型(LLM)在各类任务中的表现。采用该方法时,LLM 似乎会先生成类似人类的推理步骤(即 CoT 推理),再给出最终答案,这往往让人觉得 LLM 正在进行深思熟虑的推理过程。 然而,亚利桑那州立大学团队在...
来源:果壳公众号 爱 好奇 4周前(10-09) 115浏览 0评论
这是10月7日在瑞典斯德哥尔摩拍摄的2025年诺贝尔物理学奖公布现场。 在量子物理的世界里,常常会发生一些违反直觉的事情:粒子能穿过墙壁、能量像硬币一样一枚一枚地发放、一个系统能同时处在两个状态之中。这样的现象看似只存在于微观世界,远离我们的日常经验...
来源:学术头条公众号 爱 好奇 1个月前(10-03) 125浏览 0评论
在日前参加的一个访谈中,强化学习之父、图灵奖得主 Richard Sutton 语出惊人:大语言模型(LLM)是一个错误的起点,是一条死胡同。 在 Sutton 看来,真正的智能源自经验学习,通过行动、观察与反馈持续修正行为,实现目标;相比之下,大语...
来源:阿里巴巴公众号 爱 好奇 1个月前(09-26) 119浏览 0评论
9月24日,2025云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主旨演讲,他认为实现通用人工智能AGI已是确定性事件,但这只是起点,终极目标是发展出能自我迭代类的超级人工智能ASI。 吴泳铭首次系统阐述了通往ASI的三阶段演...
来源:腾讯科技公众号 爱 好奇 2个月前(09-15) 131浏览 0评论
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
来源:机器之心公众号 爱 好奇 2个月前(09-09) 197浏览 0评论
AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。 大模型会有幻觉,这几乎已经成为一个常识,让每一个严肃使用大模型的人都不得不谨慎小心。Open...
来源:企业管理杂志公众号 爱 好奇 2个月前(09-04) 192浏览 0评论
构建一个拥抱不确定性、鼓励多元探索、宽容失败的创新生态系统。 2015年3月,“互联网+”写入政府工作报告,推动互联网与传统行业的深度融合。十年后,“人工智能+”也写入了政府工作报告,新一轮变革正在上演。从“互联网+”到“人工智能+”,不仅意味着技术...
来源:智东西公众号 爱 好奇 2个月前(08-25) 182浏览 0评论
大模型像外星事物,搞清楚它们在想什么很重要。 编译 | 程茜 编辑 | 心缘 智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?...
来源:摩登中产公众号 爱 好奇 2个月前(08-22) 227浏览 0评论
挣脱肉身。 一 银灰色的电缆插入后颈,绿色数字倾泻而下,基努里维斯惊诧睁大双眼。 21世纪的故事以《黑客帝国》开篇,无人料到,那是一个漫长的伏笔。 26年后,今年8月,OpenAI宣布进军脑机接口领域,同月,苹果的脑机接口协议发布,而一个多月前,马斯...
来源:数字生命卡兹克公众号 爱 好奇 3个月前(08-17) 252浏览 0评论
GPT-5和“还我GPT-4o”的风波,闹得沸沸扬扬。 今天,奥特曼还有一次认怂了,不仅调了UI,还把o3这些老模型还了回来。 这些其实都是产品层面的,但是我自己的心中,其实一直好奇另一个问题。 为什么GPT-5在变可靠幻觉率变得极低了之后,他的情商...
来源:科普中国 爱 好奇 4个月前(07-19) 274浏览 0评论
相信不少朋友已经体验过文生图这类模型,比如 MidJourney、Stable Diffusion 或 OpenAI 的 DALL·E 等。只需简单输入一段文字,就能获得高质量的图像,这也让许多平面设计师倍感压力。接下来,我们将深入探讨这类模型的工作...
来源:腾讯科技公众号 爱 好奇 4个月前(07-18) 249浏览 0评论
文|晓静、博阳 编辑|萌萌 Agent是今年AI圈最大的共识,OpenAI自然也不能掉队。 北京时间2025年7月18日凌晨1点,Sam Altman和四位OpenAI 的研究员在直播中正式发布了ChatGPT Agent——一款通用型AIAgent...
来源:返朴公众号 爱 好奇 4个月前(07-14) 299浏览 0评论
近期,多个品牌充电宝厂家因电芯存在安全风险实施召回,而此前国家市场监督管理总局已撤销或暂停了多个充电宝及电芯厂家 3C 认证。6月26日,民航局发布紧急通知,自 6 月 28 日起禁止旅客携带没有 3C 标识、3C 标识不清晰、被召回型号或批次的充电...
来源:吴晓波频道公众号 爱 好奇 4个月前(07-12) 226浏览 0评论
“全球加速推动稳定币立法的背后,是希望利用稳定币来巩固美元主导地位的美国,和尝试‘去美元化’的其他国家。” 文 / 巴九灵 最近,身边很多人都在讨论一个新东西:稳定币。 尤其进入5月,中美欧好像排练好了一样,先后抛出稳定币监管重磅文件。 5月20日,...
来源:追问nextquestion公众号 爱 好奇 4个月前(07-01) 357浏览 0评论
人工智能的终极梦想,从来不局限于打造一个能击败国际象棋特级大师的博弈引擎,或是设计出花言巧语蛊惑人心的聊天机器人。它的真正使命,是成为一面映照人类智慧的明镜,帮助我们更深刻地认识自我。 科研工作者的目标,也不止于是狭义的人工智能,他们追求的是通用型人...
来源:腾讯研究院公众号 爱 好奇 4个月前(06-30) 259浏览 0评论
闫德利 腾讯研究院资深专家 一、AI已在诸多任务领域超越人类 AI发展日新月异,在许多任务上已经陆续超越人类基线水平。如2015年图像分类,2018年中等水平阅读理解,2020年视觉推理、英语语言理解,2023年多任务语言理解、竞赛级数学,2024年...
来源:中国社会科学网 爱 好奇 4个月前(06-30) 306浏览 0评论
作者:魏屹东 生成式人工智能(GAI)如各种大模型(LLM)的迅速发展,使人工智能生成内容(AIGC)(包括文本和图像)得以实现。这在给人们的工作、生活带来极大便利的同时,也对创作、绘画、教学、科研、医疗等人类活动产生了重大影响,各种挑战和问题随之而...
来源:中信书院公众号 爱 好奇 4个月前(06-24) 286浏览 0评论
凯文·凯利,被奉为“互联网教父”的科技先知,1994年就在《失控》一书中“看见”了我们的今天——云计算、分布式网络、物联网雏形、Web 2.0的共享经济、以及我们每天离不开的“屏读”生活。 今天,这位洞穿时代迷雾的观察者,再次带来震撼新作《2049》...
来源:格致论道讲坛公众号 爱 好奇 4个月前(06-21) 259浏览 0评论
大家好,我叫袁岚峰,来自中国科学技术大学。我今天演讲的题目是:什么是真正的自信。 中国的科技地位,越来越成为现在大家关注的一个热点话题。例如2018年4月的中兴芯片事件,令很多人痛心疾首,而2018年11月中国的核聚变装置EAST达到一亿度,又令很多...
来源:中国社会科学报公众号 爱 好奇 5个月前(06-18) 304浏览 0评论
作者:梅剑华 1982年11月29日,刘文英在《光明日报》发表了《〈列子〉对“人工智能”的猜想》一文,将当代人工智能与中国古代思想联系起来。刘文英引用《列子》书中的一个故事:周穆王西巡时,工匠偃师向穆王献上一个能够行走、跳舞像人一样的“倡者”,结果倡...