DeepSeek-R1超高幻觉率解析:为何大模型总“胡说八道”?
来源:腾讯科技公众号 爱 好奇 5个月前(02-18) 454浏览 0评论
郭晓静 腾讯科技《AI未来指北》特约作者 DeepSeek系列模型在很多方面的表现都很出色,但“幻觉”问题依然是它面临的一大挑战。 在Vectara HHEM人工智能幻觉测试(行业权威测试,通过检测语言模型生成内容是否与原始证据一致,从而评估模型的幻...
来源:腾讯科技公众号 爱 好奇 5个月前(02-18) 454浏览 0评论
郭晓静 腾讯科技《AI未来指北》特约作者 DeepSeek系列模型在很多方面的表现都很出色,但“幻觉”问题依然是它面临的一大挑战。 在Vectara HHEM人工智能幻觉测试(行业权威测试,通过检测语言模型生成内容是否与原始证据一致,从而评估模型的幻...
来源:老胡说科学公众号 爱 好奇 5个月前(02-17) 454浏览 0评论
2017年,深度学习领域迎来了一个划时代的突破——《Attention is All You Need》这篇论文的发表,几乎一夜之间改变了人工智能的发展轨迹。这篇论文的核心贡献是提出了一种全新的模型架构——Transformer,彻底摒弃了传统的递归...
来源:智驻未来公众号 爱 好奇 5个月前(02-15) 521浏览 0评论
一、什么是注意力机制? 在深度学习中,特征选择是一个关键问题,尤其是在处理高维数据时。传统的深度学习模型,如卷积神经网络(CNN),通常会从输入数据中自动学习特征表示,但这些特征的表示可能包含大量冗余或不相关的信息。这不仅会增加模型的计算负担,还可能...
来源:智驻未来公众号 爱 好奇 5个月前(02-15) 437浏览 0评论
导读 你们是否曾经好奇,在人工智能的江湖中,那些顶尖高手是如何一决高下的?今天,我们就带你走进AI世界的两大门派——DeepMind和OpenAI,揭秘他们背后的强化学习(RL)流派之争。这不仅是技术的较量,更是智慧的碰撞。 1.两大RL流派简介 1...
来源:智驻未来公众号 爱 好奇 5个月前(02-15) 492浏览 0评论
导读 今天我们来聊聊一个听起来可能有点技术宅,但实际上超级酷的话题——强化学习。想象一下,你正在玩一款新游戏,没有教程,没有攻略,你只能靠自己摸索,通过不断尝试和犯错来学会游戏规则,逐渐成为高手。这个过程,其实就是强化学习的核心思想。 1、强化学习的...
来源:AI演进公众号 爱 好奇 5个月前(02-14) 393浏览 0评论
最近,国运级的DeepSeek模型霸占140多个国家APP下载榜第一名。 这Deepseek深度思考模型R1一出道就展现出惊人的实力,不仅在各benchmark上表现亮眼,更让人惊呼的是它那“骨骼清奇”的低成本高效能。要知道,在动辄烧掉几百万美元训练...
来源:追问nextquestion公众号 爱 好奇 5个月前(02-12) 346浏览 0评论
当我们惊叹于Deepseek的妙语连珠时,是否正目睹硅基系统对人类语言本源的复刻?那在服务器集群中奔流的矩阵运算,与人脑皮层间跳跃的神经电波,究竟共享着怎样的“语言密码”? 借助精密的脑成像技术,人们惊讶地发现,大语言模型的层级结构竟与大脑语言中枢的...
来源:科学杂志1915公众号 爱 好奇 5个月前(02-10) 474浏览 0评论
本文从基本概念出发,介绍和解释ChatGPT用到的一系列关键技术,如机器学习、神经网络、大模型、预训练+微调范式、Scaling Law……并对ChatGPT未来可能应用领域的多模态智能体(agent)进行展望。希望帮助读者更为深入地了解和使用以Ch...
来源:追问nextquestion公众号 爱 好奇 6个月前(01-26) 393浏览 0评论
从计算机诞生以来,人类就一直在想象如何让它们变得像科幻电影里那样聪明。从《2001:太空漫游》中的 HAL 9000,到《流浪地球》中的 Moss,人工智能在屏幕中往往高效、理性、逻辑缜密,给人留下深刻的印象。 现如今,大语言模型和深度学习让我们对“...
来源:机器之心公众号 爱 好奇 6个月前(01-24) 568浏览 0评论
「语言是人类的语言,而 3D 是自然的语言。」 「除了语言,我们还有另外一半智能,这部分非常深刻,就是我们做事的能力。」 「在 AI 之间加一个 G 以强调其通用性,我是尊重这个想法的。从制造能够思考和帮助人们做出决策的机器的角度来看,AI 或 AG...
来源:AI科技大本营公众号 爱 好奇 6个月前(01-15) 1161浏览 1评论
整理 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 当今人工智能界有三位“教父”,其中对人工智能风险问题最为乐观的便是图灵奖得主 & CNN 之父 Yann LeCun(杨立昆)。LeCun 如今是 Meta 的首席人工智能...
来源:DeepTech深科技公众号 爱 好奇 6个月前(01-13) 532浏览 0评论
人们对以 GPT 为代表的自回归大模型的“幻觉”问题认识已久。图灵奖得主、Meta 首席科学家杨立昆(Yann LeCun)就曾公开对大模型的发展提出质疑。 他指出一个根本性问题:自回归模型的错误概率会随着输出长度的增加而指数叠加,从而导致模型的幻觉...
来源:心智观察所公众号 爱 好奇 6个月前(01-06) 421浏览 0评论
深度学习,这个在科技圈的热门词汇,究竟为何让人如此着迷?它就像一个数据的探险家,借助深层神经网络(DNN)在信息的海洋中探寻奥秘。而这里的“深度”就意味着一个层层深入的学习过程,能从复杂的数据中自动提取有价值的特征,无需人类费劲心力去设计。 不论是图...
来源:追问nextquestion公众号 爱 好奇 6个月前(01-05) 440浏览 0评论
“机器究竟还需要多长时间,才能真正具备人类大脑的认知能力?”这个困扰人工智能领域数十年的根本性问题,在2024年末再次成为全球科技界的焦点。 当人工智能在图像识别、自然语言处理等特定领域不断突破时,一个更具挑战性的目标始终若即...
来源:追问nextquestion公众号 爱 好奇 7个月前(01-03) 375浏览 0评论
在纷繁的神经回路与信息流动之间,我们徘徊在智能的边缘,试图捕捉那一抹瞬息即逝的光芒。 大脑,这个复杂的生物计算机,承载着无数思绪与行为的密码,却始终难以捉摸其完整的面貌。人工智能,这架精密的机器,能够高效处理大量信息。但其思维与反应依然是机械的、预设...
来源:追问nextquestion公众号 爱 好奇 7个月前(12-24) 542浏览 0评论
作者| 郭瑞东(科普作家) 城市街道上,一辆自动驾驶汽车正在行驶中。突然,一个孩子追着皮球冲向马路。 车载系统的多个传感器立即捕捉到这一情况——摄像头、激光雷达和毫米波雷达同时工作,专用的神经网络处理器和GPU开始高速运算,整个系统在峰值状态下消耗数...
来源:追问nextquestion公众号 爱 好奇 7个月前(12-20) 432浏览 0评论
作者| 郭瑞东(追问作者) 站在科技的前沿,触摸着人工智能的发展脉搏,仰望那似曾相识却又遥不可及的人类智慧,科学家们不由发问,究竟怎样的路径才能将机器的智能推向人类水平,甚至超越人类的境界? Kisaco Research首席分析师Eitan Mic...
来源:科技行者公众号 爱 好奇 7个月前(12-13) 577浏览 0评论
作者 | 周雅 来源 | 科技行者 提到量子计算,美国理论物理学家理查德·费曼曾说过一句令人难忘的话:“大自然不是经典的,如果你想模拟大自然,你最好把它变成量子力学。” 在过去30年里,量子计算存在一个根本性的挑战:随着量子比特数量的增加,错误率会急...
来源:中科院物理所公众号 爱 好奇 7个月前(12-12) 417浏览 0评论
一百年前,一群物理学家动摇了科学的基础,这震撼至今且仍在持续。 玻尔的理论让薛定谔不眠 起初,即便是对于海森堡的一些哥本哈根同事来说,他的矩阵力学也太过超前了。海森堡的数学推理部分是没问题的,但令人震惊的是海森堡坚持认为,力图寻求正在发生的事情的物理...
来源:中科院物理所公众号 爱 好奇 7个月前(12-12) 554浏览 0评论
一百年前,一群物理学家动摇了科学的基础,这震撼至今且仍在持续。 在1926年,哥本哈根理论物理研究院的火药味渐浓。这所研究所是由丹麦物理学家尼尔斯·玻尔(Niels Bohr)于10年前组建成立的。他将其打造成一个汇聚正在原子领域建立新物理理论的年轻...