梦想从来不是遥不可及的星辰,而是脚下一步一个脚印的征程,跨越山海的跋涉,终会与星辰相遇。

标签:大语言模型

Anthropic 和 Claude 名字的由来
信息大爆炸

Anthropic 和 Claude 名字的由来

来源:AGI HUNT公众号 爱 好奇 1周前(03-23) 53浏览 0评论

Anthropic 为什么叫 Anthropic?Claude 又为什么叫 Claude? 这两个名字背后,各藏着一条线索。一条通向宇宙学和哲学,另一条通向信息论的奠基人。而把这两条线串起来的,是一个从百度实习生到 AI 安全领袖的创始人故事。 先说...

别再让大模型“想太多”了!最新研究揭示 LLM 推理效率的关键瓶颈
科技大爆炸

别再让大模型“想太多”了!最新研究揭示 LLM 推理效率的关键瓶颈

来源:机器之心公众号 爱 好奇 3周前(03-11) 102浏览 0评论

一、前言:LLM 推理很强, 但 “想多想少” 一直是个问题 近年来,大语言模型在数学推理、指令跟随、智能规划等任务上取得了惊人的进展,展现出 “会思考” 的强大能力。然而,当这些模型真正走向落地部署时,一个越来越现实的问题逐渐浮出水面:推理的计算成...

智能的基石是空间还是语言?一场关于AGI未来的“创世神话”之争
科技大爆炸

智能的基石是空间还是语言?一场关于AGI未来的“创世神话”之争

来源:AIGC产业观澜 爱 好奇 1个月前(02-26) 128浏览 0评论

2026年的今天,我们正漂浮在人工智能的“第三次浪潮之巅”。或者,用更时髦的话说,我们正集体泡在由大语言模型(LLM)熬制的热水里,水温不断升高,每个人都感觉自己快要被煮熟,并升华为AGI(通用人工智能)了。从OpenAI到谷歌,从Anthropic...

从AlphaGo到DeepSeek R1,推理的未来将走向何方?
科技大爆炸

从AlphaGo到DeepSeek R1,推理的未来将走向何方?

来源:机器之心公众号 爱 好奇 1个月前(02-24) 143浏览 0评论

如果把人生看作一个开放式的大型多人在线游戏(MMO),那么游戏服务器在刚刚完成一次重大更新的时刻,规则改变了。 自 2022 年 ChatGPT 惊艳亮相以来,世界已经发生了深刻变化。在短短几年内,人工智能正从模仿语言的统计机器,迈向理解与操纵逻辑的...

自然·机器智能:AI智能体时代的科学发现新范式
科技大爆炸

自然·机器智能:AI智能体时代的科学发现新范式

来源:集智俱乐部公众号 爱 好奇 4个月前(12-11) 285浏览 0评论

导语 科学发现的轨迹,如同交织在人类历史中的璀璨织锦,经历了一系列范式的演进。早期的探索,主要依赖于由直觉、反复试验或机缘巧合驱动的经验发现。随后,以牛顿力学为代表的理论框架,为我们洞察自然现象的基本原理提供了基石。高性能计算的崛起,则开启了跨学科、...

AI模型首次实现与人类专家等同的语言分析能力
信息大爆炸

AI模型首次实现与人类专家等同的语言分析能力

来源:集智俱乐部公众号 爱 好奇 4个月前(12-07) 298浏览 0评论

摘要 当 OpenAI 的 o1 模型在无训练语料的虚构语言中,表现出精准绘制句法树、破解中心递归、厘清单句歧义并自主发现音系规则的能力后,语言学家不得不重新回答那个古老问题:如果语言曾被视为人类最后的“专属领地”,人类再次追问语言的独特性究竟还剩多...

一文看懂AI大模型的并行训练方式(DP、PP、TP、EP)
好奇一下

一文看懂AI大模型的并行训练方式(DP、PP、TP、EP)

来源:鲜枣课堂公众号 爱 好奇 4个月前(12-01) 332浏览 0评论

大家都知道,AI计算(尤其是模型训练和推理),主要以并行计算为主。 AI计算中涉及到的很多具体算法(例如矩阵相乘、卷积、循环层、梯度运算等),都需要基于成千上万的GPU,以并行任务的方式去完成。这样才能有效缩短计算时间。 搭建并行计算框架,一般会用到...

AI“涌现”神话终结:2506.11135号论文,为何让巨头彻夜难眠?
信息大爆炸

AI“涌现”神话终结:2506.11135号论文,为何让巨头彻夜难眠?

来源:漫步的图灵公众号 爱 好奇 4个月前(11-18) 359浏览 0评论

忘记你听过的一切,关于AI“涌现”的童话。 那种认为你只要不断堆叠数据、不断扩大参数,模型就会在某个神秘的时刻,突然“叮”的一声,自动获得推理、幽默、甚至意识的“魔法”。 这个故事,很迷人。它支撑了过去几年千亿美金的狂热。 但现在,这个神话的根基,正...

>