强化学习之父:大语言模型是一个错误的起点
在日前参加的一个访谈中,强化学习之父、图灵奖得主 Richard Sutton 语出惊人:大语言模型(LLM)是一个错误的起点,是一条死胡同。 在 Sutton 看来,真正的智能源自经验学习,通过行动、观察与反馈持续修正行为,实现目标;相比之下,大语...
在日前参加的一个访谈中,强化学习之父、图灵奖得主 Richard Sutton 语出惊人:大语言模型(LLM)是一个错误的起点,是一条死胡同。 在 Sutton 看来,真正的智能源自经验学习,通过行动、观察与反馈持续修正行为,实现目标;相比之下,大语...