标签：大语言模型

Manus创始人肖弘，复盘至暗时刻

胡世鑫作者叶锦言编辑 12月30日，Meta宣布完成一笔重量级并购，以数十亿美元的价格收购AI Agent产品Manus背后的公司“蝴蝶效应”。这是Meta成立以来金额排名第三的收购，仅次于WhatsApp和Instagram。交易完成后，蝴蝶...

科技大爆炸

AGI的路上，GPU叙事仍在，Transformer却无法开门

来源：腾讯科技公众号爱好奇 5天前 32浏览 0评论

文丨苏扬作者丨徐青阳谷歌Gemini3发布后，资本市场上演了一场“跷跷板”游戏。借助年度旗舰模型，谷歌市值一度涨超5000亿美元。另一方面，算力霸主英伟达同期蒸发了6000亿美元。巨大的“剪刀差”似乎在暗示风向转变：当TPU跑出了Gemini...

信息大爆炸

当AI聊「童年阴影」的时候，它在聊什么｜Hao 好读论文

来源：腾讯科技公众号爱好奇 5天前 33浏览 0评论

文｜博阳编辑｜徐青阳 12月5日，一篇名为《当 AI 躺在治疗椅上》（When AI Takes the Couch）的论文火了，里面讲了个《黑镜》级的现象。来自卢森堡大学 SnT 的研究团队，设计了一套名为 PsAIch 的心理治疗诱导协议。用这...

科技大爆炸

AI大神“AK” 2025年终盘点：大模型6大范式转移

来源：腾讯科技公众号爱好奇 2周前（12-23） 71浏览 0评论

文丨晓静编辑丨徐青阳北京时间12月21日，OpenAI创始人之一、AI大神安德烈·卡帕西（Andrej Karpathy）发布了名为《2025年大语言模型年度回顾》（2025 LLM Year in Review）的年度深度观察报告。在这份综述...

信息大爆炸

“雷军的AI秘密武器”罗福莉首秀：详解小米AGI之路

来源：腾讯科技公众号爱好奇 2周前（12-18） 76浏览 0评论

文｜郭晓静编辑｜徐青阳 12月17日，2025小米“人车家全生态合作伙伴大会”举办。在这次大会上，小米MiMo团队负责人罗福莉完成了首秀演讲。作为前DeepSeek核心成员，罗福莉自从加入小米，就被视为小米AI研发走向“正规军化”和“极客化”的里程...

科技大爆炸

自然·机器智能：AI智能体时代的科学发现新范式

来源：集智俱乐部公众号爱好奇 3周前（12-11） 107浏览 0评论

导语科学发现的轨迹，如同交织在人类历史中的璀璨织锦，经历了一系列范式的演进。早期的探索，主要依赖于由直觉、反复试验或机缘巧合驱动的经验发现。随后，以牛顿力学为代表的理论框架，为我们洞察自然现象的基本原理提供了基石。高性能计算的崛起，则开启了跨学科、...

信息大爆炸

AI模型首次实现与人类专家等同的语言分析能力

来源：集智俱乐部公众号爱好奇 4周前（12-07） 120浏览 0评论

摘要当 OpenAI 的 o1 模型在无训练语料的虚构语言中，表现出精准绘制句法树、破解中心递归、厘清单句歧义并自主发现音系规则的能力后，语言学家不得不重新回答那个古老问题：如果语言曾被视为人类最后的“专属领地”，人类再次追问语言的独特性究竟还剩多...

好奇一下

一文看懂AI大模型的并行训练方式（DP、PP、TP、EP）

来源：鲜枣课堂公众号爱好奇 1个月前（12-01） 171浏览 0评论

大家都知道，AI计算（尤其是模型训练和推理），主要以并行计算为主。 AI计算中涉及到的很多具体算法（例如矩阵相乘、卷积、循环层、梯度运算等），都需要基于成千上万的GPU，以并行任务的方式去完成。这样才能有效缩短计算时间。搭建并行计算框架，一般会用到...

好奇一下

十分钟速通大模型原理！从函数到神经网络

来源：腾讯云开发者公众号爱好奇 1个月前（11-26） 158浏览 0评论

现在几乎所有人都在使用大模型，连村口的老头都会说让你帮他在手机上装一个，那大模型到底是个啥东西呢？本文带你一探究竟。作者｜张印目录 1 从函数到神经网络 2 计算神经网络的参数 3 调教神经网络 4 矩阵运算 5 从词嵌入到RNN 6 Trans...

信息大爆炸

AI“涌现”神话终结：2506.11135号论文，为何让巨头彻夜难眠？

来源：漫步的图灵公众号爱好奇 2个月前（11-18） 205浏览 0评论

忘记你听过的一切，关于AI“涌现”的童话。那种认为你只要不断堆叠数据、不断扩大参数，模型就会在某个神秘的时刻，突然“叮”的一声，自动获得推理、幽默、甚至意识的“魔法”。这个故事，很迷人。它支撑了过去几年千亿美金的狂热。但现在，这个神话的根基，正...

科技大爆炸

李飞飞最新长文：AI的下一个十年——空间智能

来源：New Economist 公众号爱好奇 2个月前（11-14） 209浏览 0评论

LLM只是“黑暗中的文字匠”？李飞飞：AI的下一个战场是“空间智能” 美国当地时间11月10日，“AI教母”李飞飞亲自撰文，生成AI的下一个战场是“空间智能”（Spatial Intelligence）。她首次系统性地解释了什么是空间智能？它为什么如...

信息大爆炸

AI炒币大赛落幕，DeepSeek一度稳操胜券，通义千问梭哈获胜，ChatGPT瘫痪惨败

来源：轩辕商业评论公众号爱好奇 2个月前（11-09） 302浏览 0评论

王思易 | 撰文张南 | 编辑荆芥 | 设计 2025 年 11 月 3 日，AI交易大赛“Alpha Arena ”第一季正式收官。主办方、Nof1.ai创始人在 X上公布结果，并向来自阿里巴巴的通义千问团队表示祝贺：千问3（Qwen3）...

科技大爆炸

一篇论文，读懂上下文工程的前世今生｜上交大新论文解读

来源：腾讯科技公众号爱好奇 2个月前（11-07） 199浏览 0评论

文｜博阳编辑｜可君 2025年6月，Shopify CEO Tobi Lütke 和 AI 大神 Andrej Karpathy 在 X 上提出了一个新概念——上下文工程。Karpathy 将其定义为”一门微妙的艺术与科学，旨在填入恰到...

信息大爆炸

一篇文章讲清楚大模型炒股靠不靠谱，从Nof1炒股比赛开始

来源：杨几安公众号爱好奇 2个月前（11-04） 259浏览 0评论

这篇文章是我早就想写的，因为作为常年投资亏钱的菜鸡，又了解一点点LLM，所以从这个比赛出来第一天我就在潜水关注，但是因为最近太忙了实在抽不出时间。今天下定决心肝完。 Alpha Arena：六大AI实盘炒币在过去的几周里，一场名为 Alpha Ar...

信息大爆炸

斯坦福新发现：一个“really”，让AI大模型全体扑街！

来源：学术头条公众号爱好奇 2个月前（11-04） 211浏览 0评论

一项关于 ChatGPT 的用户数据显示，有超过 100 万人在聊天过程中表现出自杀倾向。这类高风险对话凸显了人工智能（AI）在涉及人类情绪与想法的情境中，正确理解、判断用户情感表达的重要性。在人类认知中，区分“想法”和“事实”轻而易举。医生在面对...

好奇一下

谢诺夫斯基万字追问：何为智能、思维与意识？

来源：追问nextquestion公众号爱好奇 2个月前（10-30） 195浏览 0评论

大语言模型有一个有趣特性：它们似乎能够映射人类的思维模式，并反映出对话者的信念和期望。这种特性在人类社会中被称为亲社会行为。正如布莱斯·阿圭拉·伊·阿尔卡斯所指出的，人类本质上是社会性生物。语言的进化并不是为了进行形式逻辑推理，而是一种生物适应机制，...

好奇一下

像研究人类一样研究ChatGPT：人类能否解锁AI“黑匣子” ？

来源：自然系列公众号爱好奇 2个月前（10-27） 177浏览 0评论

研究者们在努力对人工智能逆向工程，扫描LLM的“大脑”，看它们在做什么、怎么做，以及为什么。插图：Fabio Buonocore David Bau已经听惯了“电脑太复杂搞不明白它在做什么”的说法了。“我当了20年软件工程师，研究非常复杂的系统。总...

科技大爆炸

“实现AGI仍需十年”：AI三大认知缺陷让Karpathy重估了技术进度

来源：DeepTech深科技公众号爱好奇 2个月前（10-22） 210浏览 0评论

在“AGI 近在咫尺”的热潮中，这位 AI 领域的核心人物选择踩下了刹车。Andrej Karpathy，曾任特斯拉 AI 总监、OpenAI 创始成员的硅谷顶尖技术专家，近日在 Dwarkesh Patel 的播客中发表了一场长达两个多小时的深度对...

科技大爆炸

思维链CoT再遭质疑！三大证据实锤，真正可泛化推理还很远？

来源：学术头条公众号爱好奇 3个月前（10-12） 213浏览 0评论

思维链（CoT）提示技术已被证明能提升大语言模型（LLM）在各类任务中的表现。采用该方法时，LLM 似乎会先生成类似人类的推理步骤（即 CoT 推理），再给出最终答案，这往往让人觉得 LLM 正在进行深思熟虑的推理过程。然而，亚利桑那州立大学团队在...

科技大爆炸

强化学习之父：大语言模型是一个错误的起点

来源：学术头条公众号爱好奇 3个月前（10-03） 248浏览 0评论

在日前参加的一个访谈中，强化学习之父、图灵奖得主 Richard Sutton 语出惊人：大语言模型（LLM）是一个错误的起点，是一条死胡同。在 Sutton 看来，真正的智能源自经验学习，通过行动、观察与反馈持续修正行为，实现目标；相比之下，大语...

spring 发表在 CentOS安装Fail2ban之小白攻略2025年4月28日
学习了
爱好奇发表在我们的身体充满“错误”，却让我们成为自己2025年3月17日
前面转载了同一内容的“我们都是基因的马赛…
爱好奇发表在哲学还能解答现代人的困惑吗？2025年2月14日
很有意思的一篇关于哲学的文章，若以前还对…
爱好奇发表在《封神2》崩的越惨，DeepSeek的刀就越锋利2025年2月10日
春节期间讨论封神2和哪吒2的很多，为什么…
爱好奇发表在一场关于DeepSeek的高质量闭门会：比技术更重要的是愿景2025年1月29日
昨天除夕深度求索发布了其多模态模型，可见…
爱好奇发表在自回归模型将死！杨立昆：你们这条路行不通2025年1月15日
虽然是一篇一年前的文章，但放在今天看明显…
爱好奇发表在维系亲密关系的秘诀：《爱的流动》2025年1月10日
看到了网络上热议的关于燕XX离婚事件，这…
爱好奇发表在专访宇树科技王兴兴：在人形机器人的巨变前夜，做一个敏锐的谨慎派2025年1月4日
在人形机器人大热的今天，转载一篇5个月前…
爱好奇发表在走进“麦学”：围观那个疯女人2024年12月12日
从此事件可以学到：不管在哪，都要学习，成…
爱好奇发表在哈佛博士9.3分神作！脑科学解读为什么孩子不爱学习？2024年12月4日
说的虽然与孩子相关，但对大人同样也有启发…

2025 年 1 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31