Harness 刚火,可能就要成为过去时了|Hao好聊论文
来源:腾讯科技公众号 爱 好奇 14小时前 13浏览 0评论
文|博阳 编辑|徐青阳 随着任务的复杂度提升,Agent(智能体)的上下文在无限膨胀。在无穷的历史对话、工具调用输出、中间步骤以及报错信息中,模型迷糊了,于是开始跳步、忽视、绕道。 这就是一直以来,大家对于上下文给长程任务带来困难的解读。问题在于太长...
来源:腾讯科技公众号 爱 好奇 14小时前 13浏览 0评论
文|博阳 编辑|徐青阳 随着任务的复杂度提升,Agent(智能体)的上下文在无限膨胀。在无穷的历史对话、工具调用输出、中间步骤以及报错信息中,模型迷糊了,于是开始跳步、忽视、绕道。 这就是一直以来,大家对于上下文给长程任务带来困难的解读。问题在于太长...
对AI意识的讨论,不能脱离生物学。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:人工智能可以做很多事,但它永远无法成为一个 “人”。本文来自编译,希望对您有所启发。 布莱克·莱莫因事件...
文|Lambda 编辑|晓静 4月初,Hermes Agent 火了。这个名字直接让人联想到奢侈品牌爱马仕,所以也被戏称为“爱马仕Agent”。 它由 Nous Research 在 2 月发布,定位是「The agent that grows wi...
文|苏扬 编辑|徐青阳 一周前遭遇泄露,且被Anthropic定义为绝密模型的Claude Mythos揭开了面纱。 4月8日凌晨,Anthropic正式公开Claude Mythos预览版的核心信息。根据介绍,这个原本旨在提升逻辑推理的模型,在没有...
来源:AI产品白皮书公众号 爱 好奇 6天前 39浏览 0评论
51万行代码的AI编程工具里,藏着18种宠物的抽卡系统。 源码中有一条对主代理的编排纪律:「Never delegate understanding」——主代理不能把「理解」这件事推给子代理。 AI 需要搜索代码时,不靠模型自己的记忆去猜,而是调用一...
来源:机器之心公众号 爱 好奇 1周前(04-05) 106浏览 0评论
在 2026 年 4 月的这几天,科技圈的目光被 GitHub 上一场诡异的开源狂欢所吸引。随着大模型技术的进一步普及,一种以 .skill 为后缀的项目如雨后春笋般涌现,并以前所未有的速度在各大社交平台上引发裂变。 起初,这似乎只是程序员群体中常见...
来源:爱AI的大刘公众号 爱 好奇 1周前(04-04) 83浏览 0评论
7个场景、8套模板,复制粘贴就能用。但这篇文章真正要教你的,是模板背后那个“想清楚”的过程。 ✍️ 作者: 大刘 📝 编辑: 大刘 🎨 排版: 大刘 2026年了,用...
来源:泽平宏观公众号 爱 好奇 1周前(04-03) 145浏览 0评论
3月26日23:00,任泽平年度预测“2026十大趋势:AI改变世界”圆满收官,全网超4000万观看。 *以下为年度预测的演讲精华整理: 尊敬的各位来宾,女士们,先生们,大家好!我是任泽平! 我坚持每年看100多家公司,出国3-5次,看50多本书。到...
来源:腾讯科技公众号 爱 好奇 2周前(04-02) 111浏览 0评论
文|Yousa 博阳 编辑|徐青阳 2026年第一季度,大模型应用层最具统治力的热词,绝对是「Harness」。 今年三月,LangChain 发布了一篇题为《The Anatomy of an Agent Harness》的实证文章,彻底点燃了所有...
来源:爱AI的大刘公众号 爱 好奇 2周前(04-01) 119浏览 0评论
OpenClaw 和 Claude Code 到底啥区别?Skills 是否可以互相用?一文解决 ✍️ 作者: 大刘 📝 编辑: 大刘 🎨 排版: 大刘 读完这篇,可以获得: 1. 对 Op...
来源:爱AI的大刘公众号 爱 好奇 2周前(04-01) 58浏览 0评论
我想,对你的意义,是每个工作场景,都可以用上它。 ✍️ 作者: 大刘 📝 编辑: 大刘 🎨 排版: 大刘 是的,世界是巨大的草台班子。 全世界最强的 AI 编程工具 Claude Code,...
来源:腾讯研究院公众号 爱 好奇 2周前(03-30) 62浏览 0评论
张鸿茹 腾讯研究院研究员 2026年3月15日,央视315晚会揭开了一条令人不安的产业链1。业内人士在电商平台花几十元购买了一款名叫“力擎GEO”的优化软件,输入这款纯属虚构的“Apollo-9智能手环”的信息,系统自动生成了十余篇软文,包括8篇专家...
来源:机器之心公众号 爱 好奇 2周前(03-29) 72浏览 0评论
「AI的发展,已经进入决赛圈。决赛圈比拼的,是AI自进化的加速度」 —— 项目负责人 DeepMind 德米斯·哈萨比斯曾用一句话定义他毕生的使命:「先解决智能问题,然后用它来解决其他一切问题。」 这句话背后藏着一个极其深刻的逻辑——智能,是打开人类...
来源:腾讯科技公众号 爱 好奇 2周前(03-28) 68浏览 0评论
郝博阳|文 徐青阳|编辑 过去两年,AI 研究界有一个牢固的共识,认为推理链是事后叙事。模型先做了决定,再编一段看起来合理的推理过程。 2023 年 Turpin 团队发现 CoT 会被选项顺序悄悄影响,但推理链绝口不提;Anthropic 的 La...
来源:腾讯科技公众号 爱 好奇 3周前(03-24) 72浏览 0评论
文|博阳 编辑|徐青阳 当 AI 说”我很开心”的时候,它的内部到底有没有开心的迹象? 这不是一个哲学思想实验。如果你去翻一个大语言模型的”大脑”——它的隐藏层激活——你能不能找到一个方向,它亮起来的时...
来源:AGI HUNT公众号 爱 好奇 3周前(03-23) 119浏览 0评论
Anthropic 为什么叫 Anthropic?Claude 又为什么叫 Claude? 这两个名字背后,各藏着一条线索。一条通向宇宙学和哲学,另一条通向信息论的奠基人。而把这两条线串起来的,是一个从百度实习生到 AI 安全领袖的创始人故事。 先说...
来源:学术头条公众号 爱 好奇 4周前(03-18) 108浏览 0评论
作者:陈恺(上海人工智能实验室青年科学家,大模型中心负责人) 序章:越过奇点:从“副驾驶”到独立的“执行主体” 过去三年,我们习惯把 AI 当作一种更聪明的软件。我们给它加上副驾驶的头衔,在这种模式下,依然是人类在紧握方向盘,AI 只是在副驾上给点建...
来源:数字生命卡兹克公众号 爱 好奇 4周前(03-17) 105浏览 0评论
这是一篇,写了两天,可能会有一点长的文章。 也是我从一个10年经验的用户体验设计师和一个30人公司的创始人的视角,来聊一聊,这个时代,我对软件、对Agent、对组织的一些些看法。 也试图理清我自己的一些思路。 很多东西不一定对,但是确实是我想表达的。...
来源:新智元公众号 爱 好奇 1个月前(03-12) 190浏览 0评论
【新智元导读】今天,Anthropic登上时代封面了。他们承认:内部已观察到「递归自我改进」的早期迹象,完全自动化的AI研究,可能在一年内就能实现! ASI时代,Anthropic是真正的独领风骚。 就在刚刚,Anthropic登上《时代》周刊封面,...
来源:机器之心公众号 爱 好奇 1个月前(03-11) 133浏览 0评论
一、前言:LLM 推理很强, 但 “想多想少” 一直是个问题 近年来,大语言模型在数学推理、指令跟随、智能规划等任务上取得了惊人的进展,展现出 “会思考” 的强大能力。然而,当这些模型真正走向落地部署时,一个越来越现实的问题逐渐浮出水面:推理的计算成...