将生活嚼得有滋有味,把日子过得活色生香,往往靠的不只是嘴,还要有一颗浸透人间烟火的心。

标签:大语言模型

AI“涌现”神话终结:2506.11135号论文,为何让巨头彻夜难眠?
信息大爆炸

AI“涌现”神话终结:2506.11135号论文,为何让巨头彻夜难眠?

来源:漫步的图灵公众号 爱 好奇 9小时前 15浏览 0评论

忘记你听过的一切,关于AI“涌现”的童话。 那种认为你只要不断堆叠数据、不断扩大参数,模型就会在某个神秘的时刻,突然“叮”的一声,自动获得推理、幽默、甚至意识的“魔法”。 这个故事,很迷人。它支撑了过去几年千亿美金的狂热。 但现在,这个神话的根基,正...

斯坦福新发现:一个“really”,让AI大模型全体扑街!
信息大爆炸

斯坦福新发现:一个“really”,让AI大模型全体扑街!

来源:学术头条公众号 爱 好奇 2周前(11-04) 123浏览 0评论

一项关于 ChatGPT 的用户数据显示,有超过 100 万人在聊天过程中表现出自杀倾向。这类高风险对话凸显了人工智能(AI)在涉及人类情绪与想法的情境中,正确理解、判断用户情感表达的重要性。 在人类认知中,区分“想法”和“事实”轻而易举。医生在面对...

谢诺夫斯基万字追问:何为智能、思维与意识?
好奇一下

谢诺夫斯基万字追问:何为智能、思维与意识?

来源:追问nextquestion公众号 爱 好奇 3周前(10-30) 99浏览 0评论

大语言模型有一个有趣特性:它们似乎能够映射人类的思维模式,并反映出对话者的信念和期望。这种特性在人类社会中被称为亲社会行为。正如布莱斯·阿圭拉·伊·阿尔卡斯所指出的,人类本质上是社会性生物。语言的进化并不是为了进行形式逻辑推理,而是一种生物适应机制,...

思维链CoT再遭质疑!三大证据实锤,真正可泛化推理还很远?
科技大爆炸

思维链CoT再遭质疑!三大证据实锤,真正可泛化推理还很远?

来源:学术头条公众号 爱 好奇 1个月前(10-12) 139浏览 0评论

思维链(CoT)提示技术已被证明能提升大语言模型(LLM)在各类任务中的表现。采用该方法时,LLM 似乎会先生成类似人类的推理步骤(即 CoT 推理),再给出最终答案,这往往让人觉得 LLM 正在进行深思熟虑的推理过程。 然而,亚利桑那州立大学团队在...

大模型究竟是怎么思考的?这可能是近期最有趣的高质量AI访谈
科技大爆炸

大模型究竟是怎么思考的?这可能是近期最有趣的高质量AI访谈

来源:智东西公众号 爱 好奇 3个月前(08-25) 213浏览 0评论

大模型像外星事物,搞清楚它们在想什么很重要。 编译 | 程茜 编辑 | 心缘 智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?...

万字追问:「语言」到「智慧」的一步之遥,究竟有多远?
科技大爆炸

万字追问:「语言」到「智慧」的一步之遥,究竟有多远?

来源:追问nextquestion公众号 爱 好奇 5个月前(07-01) 406浏览 0评论

人工智能的终极梦想,从来不局限于打造一个能击败国际象棋特级大师的博弈引擎,或是设计出花言巧语蛊惑人心的聊天机器人。它的真正使命,是成为一面映照人类智慧的明镜,帮助我们更深刻地认识自我。 科研工作者的目标,也不止于是狭义的人工智能,他们追求的是通用型人...

当答案变得廉价时,好问题就是新的稀缺品
信息大爆炸

当答案变得廉价时,好问题就是新的稀缺品

来源:36氪 爱 好奇 6个月前(05-18) 342浏览 0评论

香农信息论启示我们,好问题才能解锁新可能。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:当AI让答案触手可及,什么才是技术人的破局关键?本文从摄影术颠覆绘画史讲起,揭示技术史上永恒的真...

虞晶怡教授:大模型的潜力在空间智能,但我们对此还远没有共识
科技大爆炸

虞晶怡教授:大模型的潜力在空间智能,但我们对此还远没有共识

来源:腾讯研究院公众号 爱 好奇 6个月前(05-11) 336浏览 0评论

徐一平 腾讯研究院高级研究员 王强 腾讯研究院资深专家 以生成式AI为代表的新技术浪潮日新月异,正带来一场深刻的技术、商业与社会变革,推动人类社会从信息社会向智能社会转变。全世界热切期待AI到来的同时,也非常关心人工智能将带来哪些新机遇、新挑战。 为...

Science:大模型,一种新时代的印刷术?
信息大爆炸

Science:大模型,一种新时代的印刷术?

来源:集智俱乐部公众号 爱 好奇 7个月前(04-25) 406浏览 0评论

模型正重塑我们的社会文化生态,但其本质常被误解。《Science》上的一篇最新文章,揭示大模型并非自主智能主体,而是一种革命性文化社会技术,类似于语言、印刷与市场制度。它以独特方式汇聚并重构人类信息,成为“人类社会人工系统”的新变体。这一重新定位的理...

3000字看懂LLMs 的工作原理:从预训练到推理
好奇一下

3000字看懂LLMs 的工作原理:从预训练到推理

来源:智驻未来公众号 爱 好奇 8个月前(03-21) 422浏览 0评论

导读 都2025年了,关于“大模型”这个词,想必很多人多不陌生,它们似乎拥有神奇的力量,能够生成各种文本内容,从简单的对话到复杂的学术论文。然而,这些看似“魔法”的模型背后,其实有着严谨的科学原理和技术支撑。今天,我们就来揭开大语言模型的神秘面纱,深...

大型语言模型:将每个问题变成答案
信息大爆炸

大型语言模型:将每个问题变成答案

来源:36氪 爱 好奇 8个月前(03-18) 574浏览 0评论

将语言模型作为文字的扩展 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:提供一篇文章,大模型就可以生成这篇文章的摘要,这可以看作是文字的“压缩器”,但反过来,你提供寥寥数语的创意,它也能...

>