大语言模型为什么能像人一样说话和思考?
作者:李航,张少华,林苑 我们每天都在使用大语言模型(Large Language Model,LLM)。一个明显的感受是,它们似乎真的能够理解我们的语言,虽然有时也会出现幻觉。另一方面,观察 LLM 输出的思维链,也就是其推理过程的语言表示,我们...
作者:李航,张少华,林苑 我们每天都在使用大语言模型(Large Language Model,LLM)。一个明显的感受是,它们似乎真的能够理解我们的语言,虽然有时也会出现幻觉。另一方面,观察 LLM 输出的思维链,也就是其推理过程的语言表示,我们...
世界模型(World Model),想必你已经在很多场合听过这个术语了。它有时出现在视频生成领域,有时又出现在具身智能领域;它们的含义还有所差别,甚至看起来像是完全不同的概念。 为什么会出现这样的分歧?答案藏在这个词的历史里。 近日,MoE Capi...
来源:追问nextquestion公众号 爱 好奇 3周前(04-26) 109浏览 0评论
米尔在 1978 年指出,心理学中的理论此起彼伏,却鲜有累积性的进展。我们认为,这一评估在今天依然成立——近年来愈发常见的观点同样印证了这一点:心理学正面临一场“理论危机”,心理学家应当在理论建构上投入更多精力。 本文主张,这场理论危机的根本原因在于...
来源:数学家公众号 爱 好奇 4周前(04-20) 134浏览 0评论
专栏作家 Natalie Wolchover 审视了这场关于弦理论能否描述世界的“永恒之战”的最新进展。 Quanta Magazine|来源 数学家编译小组|编译 慧玲|校对 体验:探索好奇之处的随笔 在首次提出五十八年后,弦理论仍然是“万有理论”...
来源:腾讯科技公众号 爱 好奇 1个月前(04-19) 135浏览 0评论
文|博阳 编辑|徐青阳 进入 2026 年 4 月,才火了两个月的 OpenClaw (俗称“龙虾”)就迎来了它的挑战者。Hermes Agent 连续数周占据 GitHub Trending 榜首,狂揽 22,000 颗星。 它火到什么程度呢?连 ...
【新智元导读】Anthropic联创Jack Clark一句话,让硅谷编程圈炸锅了:别再死磕套路化编程,这家造出Claude的公司,核心价值观是一位哲学博士写的,工程师70%时间已不再从零写码。 别再死磕套路化编程了! 在本周Semafor世界经济峰...
来源:机器之心公众号 爱 好奇 1个月前(04-14) 129浏览 0评论
编译 | 泽南 本文作者 Sebastian Raschka 是 AI 领域的知名学者,曾任威斯康星大学麦迪逊分校的统计学教授。 在本文中,我将探讨编码智能体(coding agents)及其智能体编排(agent harnesses)的整体设计:它...
来源:腾讯科技公众号 爱 好奇 1个月前(04-13) 160浏览 0评论
文|博阳 编辑|徐青阳 随着任务的复杂度提升,Agent(智能体)的上下文在无限膨胀。在无穷的历史对话、工具调用输出、中间步骤以及报错信息中,模型迷糊了,于是开始跳步、忽视、绕道。 这就是一直以来,大家对于上下文给长程任务带来困难的解读。问题在于太长...
来源:36氪 爱 好奇 1个月前(04-12) 151浏览 0评论
对AI意识的讨论,不能脱离生物学。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:人工智能可以做很多事,但它永远无法成为一个 “人”。本文来自编译,希望对您有所启发。 布莱克·莱莫因事件...
来源:腾讯科技公众号 爱 好奇 1个月前(04-11) 180浏览 0评论
文|Lambda 编辑|晓静 4月初,Hermes Agent 火了。这个名字直接让人联想到奢侈品牌爱马仕,所以也被戏称为“爱马仕Agent”。 它由 Nous Research 在 2 月发布,定位是「The agent that grows wi...
来源:腾讯科技公众号 爱 好奇 1个月前(04-10) 171浏览 0评论
文|晓静 编辑|徐青阳 近期,一个叫“同事.skill”的GitHub项目5天收获超过6600颗星,冲上热搜。紧接着,“前任.skill”“老板.skill”“父母.skill”十余个衍生项目接连涌现。网友辣评:“同事,散是Token,聚是Skill...
来源:腾讯科技公众号 爱 好奇 1个月前(04-08) 166浏览 0评论
文|苏扬 编辑|徐青阳 一周前遭遇泄露,且被Anthropic定义为绝密模型的Claude Mythos揭开了面纱。 4月8日凌晨,Anthropic正式公开Claude Mythos预览版的核心信息。根据介绍,这个原本旨在提升逻辑推理的模型,在没有...
来源:机器之心公众号 爱 好奇 1个月前(04-05) 392浏览 0评论
在 2026 年 4 月的这几天,科技圈的目光被 GitHub 上一场诡异的开源狂欢所吸引。随着大模型技术的进一步普及,一种以 .skill 为后缀的项目如雨后春笋般涌现,并以前所未有的速度在各大社交平台上引发裂变。 起初,这似乎只是程序员群体中常见...
来源:腾讯科技公众号 爱 好奇 2个月前(04-02) 202浏览 0评论
文|Yousa 博阳 编辑|徐青阳 2026年第一季度,大模型应用层最具统治力的热词,绝对是「Harness」。 今年三月,LangChain 发布了一篇题为《The Anatomy of an Agent Harness》的实证文章,彻底点燃了所有...
来源:腾讯科技公众号 爱 好奇 2个月前(04-02) 228浏览 0评论
文丨苏扬 编辑丨徐青阳 美国东部时间4月1日18时35分,阿尔忒弥斯II从佛罗里达州肯尼迪航天中心升空。四名宇航员坐上“猎户座”飞船,飞向月球。 上一次人类走到这么远的地方,还是1972年。那一年,阿波罗17号落在月球表面,带走了最后一批月岩样本。 ...
来源:腾讯研究院公众号 爱 好奇 2个月前(03-30) 158浏览 0评论
张鸿茹 腾讯研究院研究员 2026年3月15日,央视315晚会揭开了一条令人不安的产业链1。业内人士在电商平台花几十元购买了一款名叫“力擎GEO”的优化软件,输入这款纯属虚构的“Apollo-9智能手环”的信息,系统自动生成了十余篇软文,包括8篇专家...
来源:机器之心公众号 爱 好奇 2个月前(03-29) 146浏览 0评论
「AI的发展,已经进入决赛圈。决赛圈比拼的,是AI自进化的加速度」 —— 项目负责人 DeepMind 德米斯·哈萨比斯曾用一句话定义他毕生的使命:「先解决智能问题,然后用它来解决其他一切问题。」 这句话背后藏着一个极其深刻的逻辑——智能,是打开人类...
来源:腾讯科技公众号 爱 好奇 2个月前(03-28) 148浏览 0评论
郝博阳|文 徐青阳|编辑 过去两年,AI 研究界有一个牢固的共识,认为推理链是事后叙事。模型先做了决定,再编一段看起来合理的推理过程。 2023 年 Turpin 团队发现 CoT 会被选项顺序悄悄影响,但推理链绝口不提;Anthropic 的 La...
来源:机器之心公众号 爱 好奇 2个月前(03-27) 136浏览 0评论
本周四晚,前阿里千问大模型负责人林俊旸(Junyang Lin)在离职阿里千问后的首度公开发声,立刻在 AI 科技圈引发了关注。 自三周前自宣离开后,林俊旸这次并没有谈论个人的职业规划或离职内幕,而是发表了一篇题为《From “Reaso...
来源:腾讯科技公众号 爱 好奇 2个月前(03-24) 146浏览 0评论
文|博阳 编辑|徐青阳 当 AI 说”我很开心”的时候,它的内部到底有没有开心的迹象? 这不是一个哲学思想实验。如果你去翻一个大语言模型的”大脑”——它的隐藏层激活——你能不能找到一个方向,它亮起来的时...