标签：大语言模型

大佬深度解析：Coding Agent的底层运行逻辑是什么？

编译 | 泽南本文作者 Sebastian Raschka 是 AI 领域的知名学者，曾任威斯康星大学麦迪逊分校的统计学教授。在本文中，我将探讨编码智能体（coding agents）及其智能体编排（agent harnesses）的整体设计：它...

科技大爆炸

当你的AI说”我很开心”的时候，它是真的在开心

来源：腾讯科技公众号爱好奇 4个月前（03-24） 284浏览 0评论

文｜博阳编辑｜徐青阳当 AI 说”我很开心”的时候，它的内部到底有没有开心的迹象？这不是一个哲学思想实验。如果你去翻一个大语言模型的”大脑”——它的隐藏层激活——你能不能找到一个方向，它亮起来的时...

信息大爆炸

Anthropic 和 Claude 名字的由来

来源：AGI HUNT公众号爱好奇 4个月前（03-23） 702浏览 0评论

Anthropic 为什么叫 Anthropic？Claude 又为什么叫 Claude？这两个名字背后，各藏着一条线索。一条通向宇宙学和哲学，另一条通向信息论的奠基人。而把这两条线串起来的，是一个从百度实习生到 AI 安全领袖的创始人故事。先说...

信息大爆炸

深度解读315曝光的“GEO乱象” ：AI的回答是如何“被操控”的？

来源：腾讯科技公众号爱好奇 5个月前（03-16） 293浏览 0评论

AI安全专家、BraneMatrix公司CEO 李光辉丨文陆屿丨编辑 3月15日晚间，“315晚会”曝光了AI大模型被“投毒”的问题，矛头直指GEO（生成式引擎优化）技术。这项技术原本用于优化信息发布、提升内容曝光效率，却被一些公司开发成了“操控...

科技大爆炸

别再让大模型“想太多”了！最新研究揭示 LLM 推理效率的关键瓶颈

来源：机器之心公众号爱好奇 5个月前（03-11） 367浏览 0评论

一、前言：LLM 推理很强，但 “想多想少” 一直是个问题近年来，大语言模型在数学推理、指令跟随、智能规划等任务上取得了惊人的进展，展现出 “会思考” 的强大能力。然而，当这些模型真正走向落地部署时，一个越来越现实的问题逐渐浮出水面：推理的计算成...

科技大爆炸

智能的基石是空间还是语言？一场关于AGI未来的“创世神话”之争

来源：AIGC产业观澜爱好奇 5个月前（02-26） 365浏览 0评论

2026年的今天，我们正漂浮在人工智能的“第三次浪潮之巅”。或者，用更时髦的话说，我们正集体泡在由大语言模型（LLM）熬制的热水里，水温不断升高，每个人都感觉自己快要被煮熟，并升华为AGI（通用人工智能）了。从OpenAI到谷歌，从Anthropic...

科技大爆炸

从AlphaGo到DeepSeek R1，推理的未来将走向何方？

来源：机器之心公众号爱好奇 5个月前（02-24） 348浏览 0评论

如果把人生看作一个开放式的大型多人在线游戏（MMO），那么游戏服务器在刚刚完成一次重大更新的时刻，规则改变了。自 2022 年 ChatGPT 惊艳亮相以来，世界已经发生了深刻变化。在短短几年内，人工智能正从模仿语言的统计机器，迈向理解与操纵逻辑的...

信息大爆炸

Manus创始人肖弘，复盘至暗时刻

来源：深网腾讯新闻爱好奇 7个月前（12-31） 468浏览 0评论

胡世鑫作者叶锦言编辑 12月30日，Meta宣布完成一笔重量级并购，以数十亿美元的价格收购AI Agent产品Manus背后的公司“蝴蝶效应”。这是Meta成立以来金额排名第三的收购，仅次于WhatsApp和Instagram。交易完成后，蝴蝶...

科技大爆炸

AGI的路上，GPU叙事仍在，Transformer却无法开门

来源：腾讯科技公众号爱好奇 7个月前（12-29） 463浏览 0评论

文丨苏扬作者丨徐青阳谷歌Gemini3发布后，资本市场上演了一场“跷跷板”游戏。借助年度旗舰模型，谷歌市值一度涨超5000亿美元。另一方面，算力霸主英伟达同期蒸发了6000亿美元。巨大的“剪刀差”似乎在暗示风向转变：当TPU跑出了Gemini...

信息大爆炸

当AI聊「童年阴影」的时候，它在聊什么｜Hao 好读论文

来源：腾讯科技公众号爱好奇 7个月前（12-29） 483浏览 0评论

文｜博阳编辑｜徐青阳 12月5日，一篇名为《当 AI 躺在治疗椅上》（When AI Takes the Couch）的论文火了，里面讲了个《黑镜》级的现象。来自卢森堡大学 SnT 的研究团队，设计了一套名为 PsAIch 的心理治疗诱导协议。用这...

科技大爆炸

AI大神“AK” 2025年终盘点：大模型6大范式转移

来源：腾讯科技公众号爱好奇 7个月前（12-23） 799浏览 0评论

文丨晓静编辑丨徐青阳北京时间12月21日，OpenAI创始人之一、AI大神安德烈·卡帕西（Andrej Karpathy）发布了名为《2025年大语言模型年度回顾》（2025 LLM Year in Review）的年度深度观察报告。在这份综述...

信息大爆炸

“雷军的AI秘密武器”罗福莉首秀：详解小米AGI之路

来源：腾讯科技公众号爱好奇 7个月前（12-18） 420浏览 0评论

文｜郭晓静编辑｜徐青阳 12月17日，2025小米“人车家全生态合作伙伴大会”举办。在这次大会上，小米MiMo团队负责人罗福莉完成了首秀演讲。作为前DeepSeek核心成员，罗福莉自从加入小米，就被视为小米AI研发走向“正规军化”和“极客化”的里程...

科技大爆炸

自然·机器智能：AI智能体时代的科学发现新范式

来源：集智俱乐部公众号爱好奇 8个月前（12-11） 450浏览 0评论

导语科学发现的轨迹，如同交织在人类历史中的璀璨织锦，经历了一系列范式的演进。早期的探索，主要依赖于由直觉、反复试验或机缘巧合驱动的经验发现。随后，以牛顿力学为代表的理论框架，为我们洞察自然现象的基本原理提供了基石。高性能计算的崛起，则开启了跨学科、...

信息大爆炸

AI模型首次实现与人类专家等同的语言分析能力

来源：集智俱乐部公众号爱好奇 8个月前（12-07） 466浏览 0评论

摘要当 OpenAI 的 o1 模型在无训练语料的虚构语言中，表现出精准绘制句法树、破解中心递归、厘清单句歧义并自主发现音系规则的能力后，语言学家不得不重新回答那个古老问题：如果语言曾被视为人类最后的“专属领地”，人类再次追问语言的独特性究竟还剩多...

好奇一下

一文看懂AI大模型的并行训练方式（DP、PP、TP、EP）

来源：鲜枣课堂公众号爱好奇 8个月前（12-01） 487浏览 0评论

大家都知道，AI计算（尤其是模型训练和推理），主要以并行计算为主。 AI计算中涉及到的很多具体算法（例如矩阵相乘、卷积、循环层、梯度运算等），都需要基于成千上万的GPU，以并行任务的方式去完成。这样才能有效缩短计算时间。搭建并行计算框架，一般会用到...

好奇一下

十分钟速通大模型原理！从函数到神经网络

来源：腾讯云开发者公众号爱好奇 8个月前（11-26） 498浏览 0评论

现在几乎所有人都在使用大模型，连村口的老头都会说让你帮他在手机上装一个，那大模型到底是个啥东西呢？本文带你一探究竟。作者｜张印目录 1 从函数到神经网络 2 计算神经网络的参数 3 调教神经网络 4 矩阵运算 5 从词嵌入到RNN 6 Trans...

信息大爆炸

AI“涌现”神话终结：2506.11135号论文，为何让巨头彻夜难眠？

来源：漫步的图灵公众号爱好奇 8个月前（11-18） 511浏览 0评论

忘记你听过的一切，关于AI“涌现”的童话。那种认为你只要不断堆叠数据、不断扩大参数，模型就会在某个神秘的时刻，突然“叮”的一声，自动获得推理、幽默、甚至意识的“魔法”。这个故事，很迷人。它支撑了过去几年千亿美金的狂热。但现在，这个神话的根基，正...

科技大爆炸

李飞飞最新长文：AI的下一个十年——空间智能

来源：New Economist 公众号爱好奇 9个月前（11-14） 439浏览 0评论

LLM只是“黑暗中的文字匠”？李飞飞：AI的下一个战场是“空间智能” 美国当地时间11月10日，“AI教母”李飞飞亲自撰文，生成AI的下一个战场是“空间智能”（Spatial Intelligence）。她首次系统性地解释了什么是空间智能？它为什么如...

信息大爆炸

AI炒币大赛落幕，DeepSeek一度稳操胜券，通义千问梭哈获胜，ChatGPT瘫痪惨败

来源：轩辕商业评论公众号爱好奇 9个月前（11-09） 612浏览 0评论

王思易 | 撰文张南 | 编辑荆芥 | 设计 2025 年 11 月 3 日，AI交易大赛“Alpha Arena ”第一季正式收官。主办方、Nof1.ai创始人在 X上公布结果，并向来自阿里巴巴的通义千问团队表示祝贺：千问3（Qwen3）...

科技大爆炸

一篇论文，读懂上下文工程的前世今生｜上交大新论文解读

来源：腾讯科技公众号爱好奇 9个月前（11-07） 449浏览 0评论

文｜博阳编辑｜可君 2025年6月，Shopify CEO Tobi Lütke 和 AI 大神 Andrej Karpathy 在 X 上提出了一个新概念——上下文工程。Karpathy 将其定义为”一门微妙的艺术与科学，旨在填入恰到...

spring 发表在 CentOS安装Fail2ban之小白攻略2025年4月28日
学习了
爱好奇发表在我们的身体充满“错误”，却让我们成为自己2025年3月17日
前面转载了同一内容的“我们都是基因的马赛…
爱好奇发表在哲学还能解答现代人的困惑吗？2025年2月14日
很有意思的一篇关于哲学的文章，若以前还对…
爱好奇发表在《封神2》崩的越惨，DeepSeek的刀就越锋利2025年2月10日
春节期间讨论封神2和哪吒2的很多，为什么…
爱好奇发表在一场关于DeepSeek的高质量闭门会：比技术更重要的是愿景2025年1月29日
昨天除夕深度求索发布了其多模态模型，可见…
爱好奇发表在自回归模型将死！杨立昆：你们这条路行不通2025年1月15日
虽然是一篇一年前的文章，但放在今天看明显…
爱好奇发表在维系亲密关系的秘诀：《爱的流动》2025年1月10日
看到了网络上热议的关于燕XX离婚事件，这…
爱好奇发表在专访宇树科技王兴兴：在人形机器人的巨变前夜，做一个敏锐的谨慎派2025年1月4日
在人形机器人大热的今天，转载一篇5个月前…
爱好奇发表在走进“麦学”：围观那个疯女人2024年12月12日
从此事件可以学到：不管在哪，都要学习，成…
爱好奇发表在哈佛博士9.3分神作！脑科学解读为什么孩子不爱学习？2024年12月4日
说的虽然与孩子相关，但对大人同样也有启发…