所有漂泊的人生都梦想着平静、童年、杜鹃花,正如所有平静的人生都幻想伏特加、乐队和醉生梦死。

标签:大语言模型

3000字看懂LLMs 的工作原理:从预训练到推理
好奇一下

3000字看懂LLMs 的工作原理:从预训练到推理

来源:智驻未来公众号 爱 好奇 2周前(03-21) 32浏览 0评论

导读 都2025年了,关于“大模型”这个词,想必很多人多不陌生,它们似乎拥有神奇的力量,能够生成各种文本内容,从简单的对话到复杂的学术论文。然而,这些看似“魔法”的模型背后,其实有着严谨的科学原理和技术支撑。今天,我们就来揭开大语言模型的神秘面纱,深...

大型语言模型:将每个问题变成答案
信息大爆炸

大型语言模型:将每个问题变成答案

来源:36氪 爱 好奇 2周前(03-18) 38浏览 0评论

将语言模型作为文字的扩展 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:提供一篇文章,大模型就可以生成这篇文章的摘要,这可以看作是文字的“压缩器”,但反过来,你提供寥寥数语的创意,它也能...

大白话解释大模型的技术原理,为什么它那么聪明?
好奇一下

大白话解释大模型的技术原理,为什么它那么聪明?

来源:超算百科公众号 爱 好奇 4周前(03-07) 67浏览 0评论

近年来,大模型技术逐渐走进我们的生活。无论是在科技新闻里,还是在日常聊天中,总能听到它的名字。它不仅能写文章、画图、翻译语言,还能帮医生诊断疾病,甚至完成一些我们以前觉得只有人类才能做的事情。 “大模型”到底是什么?为什么它这么厉害?它是怎么做到的?...

丁磊:DeepSeek爆火,你不知道的AI真相
信息大爆炸

丁磊:DeepSeek爆火,你不知道的AI真相

来源:中信书院公众号 爱 好奇 4周前(03-05) 80浏览 0评论

过去的2024年,可以说是人工智能发展的分水岭,是大模型技术从量变到质变的关键一年。 无数大模型正在以肉眼可见的速度渗透进各行各业的“毛细血管”中。众多互联网产品都嵌入了AI功能模块,技术突破、应用普及以及开源与商业化并行发展……这种技术创新和产业落...

追捧“AI智能体”的人该醒醒了
信息大爆炸

追捧“AI智能体”的人该醒醒了

来源:36氪 爱 好奇 1个月前(02-21) 76浏览 0评论

吹智能体的都是没用过的。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:很多预测都认为今年是智能体爆发之年。但一位博主用自己的亲身实践指出,AI的不确定性是很大的麻烦,智能体不大可能接管...

5000字!深度学习中的“智能眼”:揭秘注意力机制的奥秘
科技大爆炸

5000字!深度学习中的“智能眼”:揭秘注意力机制的奥秘

来源:智驻未来公众号 爱 好奇 2个月前(02-15) 136浏览 0评论

一、什么是注意力机制? 在深度学习中,特征选择是一个关键问题,尤其是在处理高维数据时。传统的深度学习模型,如卷积神经网络(CNN),通常会从输入数据中自动学习特征表示,但这些特征的表示可能包含大量冗余或不相关的信息。这不仅会增加模型的计算负担,还可能...

Deepseek妙语连珠,是否触达了人类语言的根源?
科技大爆炸

Deepseek妙语连珠,是否触达了人类语言的根源?

来源:追问nextquestion公众号 爱 好奇 2个月前(02-12) 91浏览 0评论

当我们惊叹于Deepseek的妙语连珠时,是否正目睹硅基系统对人类语言本源的复刻?那在服务器集群中奔流的矩阵运算,与人脑皮层间跳跃的神经电波,究竟共享着怎样的“语言密码”? 借助精密的脑成像技术,人们惊讶地发现,大语言模型的层级结构竟与大脑语言中枢的...

李飞飞:语言之外,另一半的智能还有待实现
科技大爆炸

李飞飞:语言之外,另一半的智能还有待实现

来源:机器之心公众号 爱 好奇 2个月前(01-24) 141浏览 0评论

「语言是人类的语言,而 3D 是自然的语言。」 「除了语言,我们还有另外一半智能,这部分非常深刻,就是我们做事的能力。」 「在 AI 之间加一个 G 以强调其通用性,我是尊重这个想法的。从制造能够思考和帮助人们做出决策的机器的角度来看,AI 或 AG...