强化学习之父:大语言模型是一个错误的起点
来源:学术头条公众号 爱 好奇 1个月前(10-03) 127浏览 0评论
在日前参加的一个访谈中,强化学习之父、图灵奖得主 Richard Sutton 语出惊人:大语言模型(LLM)是一个错误的起点,是一条死胡同。 在 Sutton 看来,真正的智能源自经验学习,通过行动、观察与反馈持续修正行为,实现目标;相比之下,大语...
来源:学术头条公众号 爱 好奇 1个月前(10-03) 127浏览 0评论
在日前参加的一个访谈中,强化学习之父、图灵奖得主 Richard Sutton 语出惊人:大语言模型(LLM)是一个错误的起点,是一条死胡同。 在 Sutton 看来,真正的智能源自经验学习,通过行动、观察与反馈持续修正行为,实现目标;相比之下,大语...
来源:量子位公众号 爱 好奇 8个月前(03-07) 522浏览 0评论
白交 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 计算机最高奖图灵奖揭晓! 强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为“引领基础AI技术开发的研究人员”。 值得一提的是,两位是师徒关系,Rich...