DeepMind再登Nature:AI Agent造出了最强RL算法!
来源:学术头条公众号 爱 好奇 3周前(10-28) 120浏览 0评论
人工智能(AI)的主要目标之一,是设计出能够像人类一样在复杂环境中自主预测、行动、最终实现目标的智能体(Agent)。智能体的训练离不开强化学习(RL),相关研究也已经持续了几十年,但让智能体自主开发高效的 RL 算法的目标始终难以实现。 针对这一痛...
来源:学术头条公众号 爱 好奇 3周前(10-28) 120浏览 0评论
人工智能(AI)的主要目标之一,是设计出能够像人类一样在复杂环境中自主预测、行动、最终实现目标的智能体(Agent)。智能体的训练离不开强化学习(RL),相关研究也已经持续了几十年,但让智能体自主开发高效的 RL 算法的目标始终难以实现。 针对这一痛...
来源:DeepTech深科技公众号 爱 好奇 4周前(10-22) 119浏览 0评论
在“AGI 近在咫尺”的热潮中,这位 AI 领域的核心人物选择踩下了刹车。Andrej Karpathy,曾任特斯拉 AI 总监、OpenAI 创始成员的硅谷顶尖技术专家,近日在 Dwarkesh Patel 的播客中发表了一场长达两个多小时的深度对...
来源:腾讯科技公众号 爱 好奇 4个月前(07-18) 273浏览 0评论
文|晓静、博阳 编辑|萌萌 Agent是今年AI圈最大的共识,OpenAI自然也不能掉队。 北京时间2025年7月18日凌晨1点,Sam Altman和四位OpenAI 的研究员在直播中正式发布了ChatGPT Agent——一款通用型AIAgent...
来源:36氪 爱 好奇 8个月前(03-15) 329浏览 0评论
首批专业级智能体已问世 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:当搜索引擎时代渐入尾声,AI研究革命正拉开帷幕。本文深入剖析了人工智能领域两大技术支柱——推理模型与智能体的协同进化...
来源:极客公园公众号 爱 好奇 8个月前(03-13) 589浏览 0评论
机器人行业,也在期待自己的「ChatGPT 时刻」。 作者|周永亮 编辑|靖宇 3 月 7 日晚,智元机器人联合创始人「稚晖君」(彭志辉)在微博上扔下了一颗「预告炸弹」——「下周有好东西发布」。短短一句话,迅速引爆全网,阅读量飙升至 10 万+。 结...
来源:极客公园公众号 爱 好奇 8个月前(03-12) 584浏览 0评论
离用户最近,做出最好的 AI Agent 作者|shiyun 张勇毅 编辑|靖宇 2025 年是 AI Agent 元年——这句话,在北京时间 3 月 6 日凌晨,得到了应验。 「DeepSeek 之后,又一个科技圈的不眠之夜。」 不少用户在社交媒体...
来源:36氪 爱 好奇 9个月前(02-21) 448浏览 0评论
吹智能体的都是没用过的。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:很多预测都认为今年是智能体爆发之年。但一位博主用自己的亲身实践指出,AI的不确定性是很大的麻烦,智能体不大可能接管...
来源:智驻未来公众号 爱 好奇 9个月前(02-15) 662浏览 0评论
导读 今天我们来聊聊一个听起来可能有点技术宅,但实际上超级酷的话题——强化学习。想象一下,你正在玩一款新游戏,没有教程,没有攻略,你只能靠自己摸索,通过不断尝试和犯错来学会游戏规则,逐渐成为高手。这个过程,其实就是强化学习的核心思想。 1、强化学习的...
来源:科学杂志1915公众号 爱 好奇 12个月前(11-25) 690浏览 0评论
本文从基本概念出发,介绍和解释ChatGPT用到的一系列关键技术,如机器学习、神经网络、大模型、预训练+微调范式、Scaling Law……并对ChatGPT未来可能应用领域的多模态智能体(agent)进行展望。希望帮助读者更为深入地了解和使用以Ch...