图灵奖-好奇网

强化学习之父：大语言模型是一个错误的起点

在日前参加的一个访谈中，强化学习之父、图灵奖得主 Richard Sutton 语出惊人：大语言模型（LLM）是一个错误的起点，是一条死胡同。在 Sutton 看来，真正的智能源自经验学习，通过行动、观察与反馈持续修正行为，实现目标；相比之下，大语...

来源：量子位公众号爱好奇 1年前（2025-03-07） 687浏览 0评论

白交梦晨发自凹非寺量子位 | 公众号 QbitAI 计算机最高奖图灵奖揭晓！强化学习先驱Andrew Barto与Richard Sutton共同获奖，他们被评价为“引领基础AI技术开发的研究人员”。值得一提的是，两位是师徒关系，Rich...