谷歌刚掀了模型记忆的桌子,英伟达又革了注意力的命|Hao好聊论文
文|博阳 编辑|徐青阳 近期,谷歌的 Nested Learning 引发了一场模型界的记忆地震。 很多人重新意识到,大模型不必永远是「训练完就封存」的只读权重,它也可以在推理过程中继续变化。在 Nested Learning 里,当模型读到新的上下...
文|博阳 编辑|徐青阳 近期,谷歌的 Nested Learning 引发了一场模型界的记忆地震。 很多人重新意识到,大模型不必永远是「训练完就封存」的只读权重,它也可以在推理过程中继续变化。在 Nested Learning 里,当模型读到新的上下...