DeepMind再登Nature:AI Agent造出了最强RL算法!
人工智能(AI)的主要目标之一,是设计出能够像人类一样在复杂环境中自主预测、行动、最终实现目标的智能体(Agent)。智能体的训练离不开强化学习(RL),相关研究也已经持续了几十年,但让智能体自主开发高效的 RL 算法的目标始终难以实现。 针对这一痛...
人工智能(AI)的主要目标之一,是设计出能够像人类一样在复杂环境中自主预测、行动、最终实现目标的智能体(Agent)。智能体的训练离不开强化学习(RL),相关研究也已经持续了几十年,但让智能体自主开发高效的 RL 算法的目标始终难以实现。 针对这一痛...
来源:追问nextquestion公众号 爱 好奇 2天前 29浏览 0评论
当婴儿凝视旋转的风铃时,他或她的大脑便在悄然破解光影变化的规律。无需奖励或惩罚,这种对世界的理解就已在神经回路中生根发芽——这正是“无监督学习”的生动体现。 反观当下最先进的人工智能,要区分“猫”和“狗”的图片,也需要在大量标注数据的“喂养”下才能实...
研究者们在努力对人工智能逆向工程,扫描LLM的“大脑”,看它们在做什么、怎么做,以及为什么。 插图:Fabio Buonocore David Bau已经听惯了“电脑太复杂搞不明白它在做什么”的说法了。“我当了20年软件工程师,研究非常复杂的系统。总...
从祖先钻木取火到现代航天科技,人类对机器的幻想从未停歇。远古时期我们幻想“御风而行”,明朝万户用火箭实现飞天实验,富兰克林借风筝探索雷电奥秘。这些创造背后都暗藏着一个终极理想:能否创造机械生命体,代替我们负重前行,让人类得以享受生活? 这种执念在当代...
来源:大问题Dialectic公众号 爱 好奇 4天前 85浏览 0评论
本期要探讨的大问题是:如何让AI具有意识? 别以为这个选题是个科幻选题,这还的确是个科学选题。现在在学术界,确实有门学科叫做机器意识(Machine Consciousness),就是来研究怎么样让机器有意识的。现代人工智能发展的一个底层的动力或者目...
来源:DeepTech深科技公众号 爱 好奇 1周前(10-22) 52浏览 0评论
在“AGI 近在咫尺”的热潮中,这位 AI 领域的核心人物选择踩下了刹车。Andrej Karpathy,曾任特斯拉 AI 总监、OpenAI 创始成员的硅谷顶尖技术专家,近日在 Dwarkesh Patel 的播客中发表了一场长达两个多小时的深度对...
来源:腾讯科技公众号 爱 好奇 2周前(10-18) 84浏览 0评论
文|博阳 编辑|郑可君 最近一段时间,AI界掀起了一场关于LLM能否通向AGI的激烈争论。 一边是以OpenAI、Google等为代表的企业界,他们坚信当前的模式和Scaling Law(扩展定律)能够实现人工通用智能(AGI);另一边是以强化学习之...
来源:AI数据胡公众号 爱 好奇 2周前(10-15) 86浏览 0评论
从认猫到创造猫,一场静默的技术革命已然发生。 还记得我们上次聊的机器学习吗?它像一个能从数据中总结规律的“学霸”。今天,我们要介绍的是这个学霸家族里的一位“超级大脑”——深度学习。 如果说传统机器学习还在用简单的公式解题,那么深度学习已经学会了“抽象...
来源:AI数据胡公众号 爱 好奇 2周前(10-15) 87浏览 0评论
朋友们,不知道你有没有过这样的经历: 刚和朋友聊完某个商品,打开购物APP,它赫然出现在推荐位;在短视频平台多看了一会儿萌宠视频,接下来满屏都是可爱的猫猫狗狗。 这一切的背后,并不是手机在“偷听”你(从技术原理上讲,很难且风险大),而是一套名为 “机...
来源:AI数据胡公众号 爱 好奇 2周前(10-15) 107浏览 0评论
如果把人工智能的研究比作一场探寻“智慧”源泉的远征,那么在这条漫长的道路上,先后出现了三条风格迥异的探索路径。它们代表着人类对“智能”本质的不同理解,也深刻地塑造了今天AI发展的面貌。 这就是我们今天要谈的——人工智能的三大流派:符号主义、连接主义和...
来源:AI数据胡公众号 爱 好奇 2周前(10-15) 77浏览 0评论
“人工智能”这个词,如今早已遍布街头巷尾,从手机里的语音助手,到能写诗会绘画的AI模型,它似乎无所不能,又似乎蒙着一层神秘的面纱。我们不禁要问:它究竟是什么?它又是如何一步步从科幻走入现实,并深刻改变我们世界的? 要理解今天的人工智能,我们不能只看它...
来源:学术头条公众号 爱 好奇 2周前(10-12) 89浏览 0评论
思维链(CoT)提示技术已被证明能提升大语言模型(LLM)在各类任务中的表现。采用该方法时,LLM 似乎会先生成类似人类的推理步骤(即 CoT 推理),再给出最终答案,这往往让人觉得 LLM 正在进行深思熟虑的推理过程。 然而,亚利桑那州立大学团队在...
来源:学术头条公众号 爱 好奇 4周前(10-03) 108浏览 0评论
在日前参加的一个访谈中,强化学习之父、图灵奖得主 Richard Sutton 语出惊人:大语言模型(LLM)是一个错误的起点,是一条死胡同。 在 Sutton 看来,真正的智能源自经验学习,通过行动、观察与反馈持续修正行为,实现目标;相比之下,大语...
来源:阿里巴巴公众号 爱 好奇 1个月前(09-26) 106浏览 0评论
9月24日,2025云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主旨演讲,他认为实现通用人工智能AGI已是确定性事件,但这只是起点,终极目标是发展出能自我迭代类的超级人工智能ASI。 吴泳铭首次系统阐述了通往ASI的三阶段演...
来源:腾讯科技公众号 爱 好奇 1个月前(09-15) 120浏览 0评论
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
来源:机器之心公众号 爱 好奇 2个月前(09-09) 181浏览 0评论
AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。 大模型会有幻觉,这几乎已经成为一个常识,让每一个严肃使用大模型的人都不得不谨慎小心。Open...
来源:企业管理杂志公众号 爱 好奇 2个月前(09-04) 178浏览 0评论
构建一个拥抱不确定性、鼓励多元探索、宽容失败的创新生态系统。 2015年3月,“互联网+”写入政府工作报告,推动互联网与传统行业的深度融合。十年后,“人工智能+”也写入了政府工作报告,新一轮变革正在上演。从“互联网+”到“人工智能+”,不仅意味着技术...
来源:智东西公众号 爱 好奇 2个月前(08-25) 170浏览 0评论
大模型像外星事物,搞清楚它们在想什么很重要。 编译 | 程茜 编辑 | 心缘 智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?...
来源:数字生命卡兹克公众号 爱 好奇 2个月前(08-17) 239浏览 0评论
GPT-5和“还我GPT-4o”的风波,闹得沸沸扬扬。 今天,奥特曼还有一次认怂了,不仅调了UI,还把o3这些老模型还了回来。 这些其实都是产品层面的,但是我自己的心中,其实一直好奇另一个问题。 为什么GPT-5在变可靠幻觉率变得极低了之后,他的情商...
来源:科普中国 爱 好奇 3个月前(07-19) 262浏览 0评论
相信不少朋友已经体验过文生图这类模型,比如 MidJourney、Stable Diffusion 或 OpenAI 的 DALL·E 等。只需简单输入一段文字,就能获得高质量的图像,这也让许多平面设计师倍感压力。接下来,我们将深入探讨这类模型的工作...