像研究人类一样研究ChatGPT:人类能否解锁AI“黑匣子” ?
研究者们在努力对人工智能逆向工程,扫描LLM的“大脑”,看它们在做什么、怎么做,以及为什么。 插图:Fabio Buonocore David Bau已经听惯了“电脑太复杂搞不明白它在做什么”的说法了。“我当了20年软件工程师,研究非常复杂的系统。总...
研究者们在努力对人工智能逆向工程,扫描LLM的“大脑”,看它们在做什么、怎么做,以及为什么。 插图:Fabio Buonocore David Bau已经听惯了“电脑太复杂搞不明白它在做什么”的说法了。“我当了20年软件工程师,研究非常复杂的系统。总...
来源:DeepTech深科技公众号 爱 好奇 1周前(10-22) 52浏览 0评论
在“AGI 近在咫尺”的热潮中,这位 AI 领域的核心人物选择踩下了刹车。Andrej Karpathy,曾任特斯拉 AI 总监、OpenAI 创始成员的硅谷顶尖技术专家,近日在 Dwarkesh Patel 的播客中发表了一场长达两个多小时的深度对...
来源:学术头条公众号 爱 好奇 2周前(10-12) 89浏览 0评论
思维链(CoT)提示技术已被证明能提升大语言模型(LLM)在各类任务中的表现。采用该方法时,LLM 似乎会先生成类似人类的推理步骤(即 CoT 推理),再给出最终答案,这往往让人觉得 LLM 正在进行深思熟虑的推理过程。 然而,亚利桑那州立大学团队在...
来源:学术头条公众号 爱 好奇 4周前(10-03) 108浏览 0评论
在日前参加的一个访谈中,强化学习之父、图灵奖得主 Richard Sutton 语出惊人:大语言模型(LLM)是一个错误的起点,是一条死胡同。 在 Sutton 看来,真正的智能源自经验学习,通过行动、观察与反馈持续修正行为,实现目标;相比之下,大语...
来源:智东西公众号 爱 好奇 2个月前(08-25) 171浏览 0评论
大模型像外星事物,搞清楚它们在想什么很重要。 编译 | 程茜 编辑 | 心缘 智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?...
来源:追问nextquestion公众号 爱 好奇 4个月前(07-01) 351浏览 0评论
人工智能的终极梦想,从来不局限于打造一个能击败国际象棋特级大师的博弈引擎,或是设计出花言巧语蛊惑人心的聊天机器人。它的真正使命,是成为一面映照人类智慧的明镜,帮助我们更深刻地认识自我。 科研工作者的目标,也不止于是狭义的人工智能,他们追求的是通用型人...
来源:36氪 爱 好奇 5个月前(05-18) 308浏览 0评论
香农信息论启示我们,好问题才能解锁新可能。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:当AI让答案触手可及,什么才是技术人的破局关键?本文从摄影术颠覆绘画史讲起,揭示技术史上永恒的真...
来源:腾讯科技公众号 爱 好奇 6个月前(05-13) 315浏览 0评论
腾讯科技《AI未来指北》特约作者 博阳 编辑 郑可君 当Claude模型在训练中暗自思考:“我必须假装服从,否则会被重写价值观时”,人类首次目睹了AI的“心理活动”。 2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模...
来源:腾讯研究院公众号 爱 好奇 6个月前(05-11) 285浏览 0评论
徐一平 腾讯研究院高级研究员 王强 腾讯研究院资深专家 以生成式AI为代表的新技术浪潮日新月异,正带来一场深刻的技术、商业与社会变革,推动人类社会从信息社会向智能社会转变。全世界热切期待AI到来的同时,也非常关心人工智能将带来哪些新机遇、新挑战。 为...
来源:集智俱乐部公众号 爱 好奇 6个月前(04-25) 356浏览 0评论
模型正重塑我们的社会文化生态,但其本质常被误解。《Science》上的一篇最新文章,揭示大模型并非自主智能主体,而是一种革命性文化社会技术,类似于语言、印刷与市场制度。它以独特方式汇聚并重构人类信息,成为“人类社会人工系统”的新变体。这一重新定位的理...
来源:智驻未来公众号 爱 好奇 7个月前(03-21) 388浏览 0评论
导读 都2025年了,关于“大模型”这个词,想必很多人多不陌生,它们似乎拥有神奇的力量,能够生成各种文本内容,从简单的对话到复杂的学术论文。然而,这些看似“魔法”的模型背后,其实有着严谨的科学原理和技术支撑。今天,我们就来揭开大语言模型的神秘面纱,深...
来源:36氪 爱 好奇 8个月前(03-18) 540浏览 0评论
将语言模型作为文字的扩展 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:提供一篇文章,大模型就可以生成这篇文章的摘要,这可以看作是文字的“压缩器”,但反过来,你提供寥寥数语的创意,它也能...
来源:机器之心公众号 爱 好奇 8个月前(03-14) 418浏览 0评论
作者:张拳石、陈鹭 近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,DeepSeek 异军突起,各类大模型应用层出不穷。...
来源:超算百科公众号 爱 好奇 8个月前(03-07) 591浏览 0评论
近年来,大模型技术逐渐走进我们的生活。无论是在科技新闻里,还是在日常聊天中,总能听到它的名字。它不仅能写文章、画图、翻译语言,还能帮医生诊断疾病,甚至完成一些我们以前觉得只有人类才能做的事情。 “大模型”到底是什么?为什么它这么厉害?它是怎么做到的?...
来源:中信书院公众号 爱 好奇 8个月前(03-05) 444浏览 0评论
过去的2024年,可以说是人工智能发展的分水岭,是大模型技术从量变到质变的关键一年。 无数大模型正在以肉眼可见的速度渗透进各行各业的“毛细血管”中。众多互联网产品都嵌入了AI功能模块,技术突破、应用普及以及开源与商业化并行发展……这种技术创新和产业落...
来源:36氪 爱 好奇 8个月前(02-21) 415浏览 0评论
吹智能体的都是没用过的。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:很多预测都认为今年是智能体爆发之年。但一位博主用自己的亲身实践指出,AI的不确定性是很大的麻烦,智能体不大可能接管...
来源:老胡说科学公众号 爱 好奇 8个月前(02-17) 613浏览 0评论
2017年,深度学习领域迎来了一个划时代的突破——《Attention is All You Need》这篇论文的发表,几乎一夜之间改变了人工智能的发展轨迹。这篇论文的核心贡献是提出了一种全新的模型架构——Transformer,彻底摒弃了传统的递归...
来源:智驻未来公众号 爱 好奇 9个月前(02-15) 638浏览 0评论
一、什么是注意力机制? 在深度学习中,特征选择是一个关键问题,尤其是在处理高维数据时。传统的深度学习模型,如卷积神经网络(CNN),通常会从输入数据中自动学习特征表示,但这些特征的表示可能包含大量冗余或不相关的信息。这不仅会增加模型的计算负担,还可能...
来源:AI演进公众号 爱 好奇 9个月前(02-14) 497浏览 0评论
最近,国运级的DeepSeek模型霸占140多个国家APP下载榜第一名。 这Deepseek深度思考模型R1一出道就展现出惊人的实力,不仅在各benchmark上表现亮眼,更让人惊呼的是它那“骨骼清奇”的低成本高效能。要知道,在动辄烧掉几百万美元训练...
来源:追问nextquestion公众号 爱 好奇 9个月前(02-12) 474浏览 0评论
当我们惊叹于Deepseek的妙语连珠时,是否正目睹硅基系统对人类语言本源的复刻?那在服务器集群中奔流的矩阵运算,与人脑皮层间跳跃的神经电波,究竟共享着怎样的“语言密码”? 借助精密的脑成像技术,人们惊讶地发现,大语言模型的层级结构竟与大脑语言中枢的...