ChatGPT发展史:从基础神经元到多模态智能体
来源:科学杂志1915公众号 爱 好奇 1年前(2024-11-25) 752浏览 0评论
本文从基本概念出发,介绍和解释ChatGPT用到的一系列关键技术,如机器学习、神经网络、大模型、预训练+微调范式、Scaling Law……并对ChatGPT未来可能应用领域的多模态智能体(agent)进行展望。希望帮助读者更为深入地了解和使用以Ch...
来源:科学杂志1915公众号 爱 好奇 1年前(2024-11-25) 752浏览 0评论
本文从基本概念出发,介绍和解释ChatGPT用到的一系列关键技术,如机器学习、神经网络、大模型、预训练+微调范式、Scaling Law……并对ChatGPT未来可能应用领域的多模态智能体(agent)进行展望。希望帮助读者更为深入地了解和使用以Ch...
来源:AI科技评论公众号 爱 好奇 1年前(2024-10-23) 542浏览 0评论
小模型干大事,DeepMind重新审视Transformer推理能力。 作者丨刘洁 编辑丨岑峰 DeepMind闷声干大事,悄悄训练了一个大小只有270M的Transformer模型,居然不需要搜索,就能实现大师级的下棋水平。 这几天的推特因为这篇2...