长链推理表象下,大模型精细表征张冠李戴的本质
来源:机器之心公众号 爱 好奇 6个月前(03-14) 375浏览 0评论
作者:张拳石、陈鹭 近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,DeepSeek 异军突起,各类大模型应用层出不穷。...
来源:机器之心公众号 爱 好奇 6个月前(03-14) 375浏览 0评论
作者:张拳石、陈鹭 近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,DeepSeek 异军突起,各类大模型应用层出不穷。...
来源:极客公园公众号 爱 好奇 6个月前(03-12) 521浏览 0评论
离用户最近,做出最好的 AI Agent 作者|shiyun 张勇毅 编辑|靖宇 2025 年是 AI Agent 元年——这句话,在北京时间 3 月 6 日凌晨,得到了应验。 「DeepSeek 之后,又一个科技圈的不眠之夜。」 不少用户在社交媒体...
来源:赛先生公众号 爱 好奇 6个月前(03-10) 478浏览 0评论
图1 深度神经网络先驱杰弗里·辛顿 图源:维基百科 导读: 深度学习的海啸分三波袭来:首先是语音识别,然后是图像识别,再之后是自然语言处理。在第三波海啸中,辛顿、杨立昆和本吉奥等人的工作,真切地让人们感受到深度神经网络对于整个人工智能领域带来的翻天覆...
来源:腾讯研究院公众号 爱 好奇 6个月前(03-08) 473浏览 0评论
丁元竹 中共中央党校(国家行政学院)督学专家、教授、博士生导师,十三届全国政协委员、全国政协文化文史和学习委员会委员 2025年春节看到朋友在微信里说AI出现了意识,为之一振。恰巧自己读书读到英国学者马库斯·乔恩的《第一性原理》有关人脑的内容和《费孝...
来源:超算百科公众号 爱 好奇 6个月前(03-07) 626浏览 0评论
你有没有想过,当你和AI聊天、让它写文章或者生成代码时,它究竟是如何理解你的问题并给出回答的?其实,这一切的背后都离不开一个关键概念——Token 。 你可以把它想象成语言的“积木”,每一个Token都是AI理解和生成文本的基本单元。从简单的日常对话...
来源:超算百科公众号 爱 好奇 6个月前(03-07) 544浏览 0评论
近年来,大模型技术逐渐走进我们的生活。无论是在科技新闻里,还是在日常聊天中,总能听到它的名字。它不仅能写文章、画图、翻译语言,还能帮医生诊断疾病,甚至完成一些我们以前觉得只有人类才能做的事情。 “大模型”到底是什么?为什么它这么厉害?它是怎么做到的?...
来源:量子位公众号 爱 好奇 7个月前(03-07) 467浏览 0评论
白交 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 计算机最高奖图灵奖揭晓! 强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为“引领基础AI技术开发的研究人员”。 值得一提的是,两位是师徒关系,Rich...
来源:中信书院公众号 爱 好奇 7个月前(03-05) 384浏览 0评论
过去的2024年,可以说是人工智能发展的分水岭,是大模型技术从量变到质变的关键一年。 无数大模型正在以肉眼可见的速度渗透进各行各业的“毛细血管”中。众多互联网产品都嵌入了AI功能模块,技术突破、应用普及以及开源与商业化并行发展……这种技术创新和产业落...
来源:中国企业家杂志公众号 爱 好奇 7个月前(03-05) 458浏览 0评论
开源模型正缓慢而坚定地超越闭源模型 编译|吴莹 曹冰颖(实习) 来源|人工智能之趋势(YouTube) “放弃生成式模型,不研究LLM(大语言模型),我们没办法只通过文本训练让AI达到人类的智慧水平。”近日,Meta首席AI科学家杨立昆(Yann L...
来源:36氪 爱 好奇 7个月前(03-04) 443浏览 0评论
AGI如果到来,会对社会、就业、能源消耗和AI 基础设施投资产生什么影响? 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:最近DeepSeek推理模型的表现和开源让人们对通用人工智能(A...
来源:摩登中产公众号 爱 好奇 7个月前(03-02) 581浏览 0评论
所有的预言,开始具象化。 一 1月20日,英伟达CEO黄仁勋黑衫短袖,在北京年会上热舞。开场演讲中他说,新的计算时代开始了。 当夜8点10分,深度求索官方公众号发文,DeepSeek-R1亮相。 新模型在岁末寒流中破风而行。一天后热议,三天后破圈,六...
来源:真格基金公众号 爱 好奇 7个月前(03-01) 496浏览 0评论
大家好,我是 Monica.im 的产品合伙人张涛。 相信大家和我一样,整个春节期间几乎都在抱着手机刷信息。白天看国内的反应,晚上看美国的反应。整个春节就这样度过了。春节后这一周,大家已经在各种微信公众号和其他平台上刷了大量关于 R1 的分析文章,从...
来源:科技导报公众号 爱 好奇 7个月前(02-26) 340浏览 0评论
近日,DeepSeek的横空出世,在全球科技领域激起千层浪,引发了从学界到业界的广泛热议与深度思考。《科技导报》2025年第3期刊发李国杰院士的《DeepSeek引发的AI发展路径思考》一文,深入剖析了DeepSeek背后所蕴含的AI发展路径相关问题...
来源:机器之心公众号 爱 好奇 7个月前(02-23) 456浏览 0评论
机器之心报道 编辑:Panda、张倩 在当今的 AI 领域,图灵奖得主 Yann LeCun 算是一个另类。即便眼见着自回归 LLM 的能力越来越强大,能解决的任务也越来越多,他也依然坚持自己的看法:自回归 LLM 没有光明的未来。 在近期的一次演讲...
来源:36氪 爱 好奇 7个月前(02-21) 375浏览 0评论
吹智能体的都是没用过的。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:很多预测都认为今年是智能体爆发之年。但一位博主用自己的亲身实践指出,AI的不确定性是很大的麻烦,智能体不大可能接管...
来源:中兴文档公众号 爱 好奇 7个月前(02-19) 495浏览 0评论
目前大模型的应用场景已经落地到我们生活的方方面面,然而,随着应用场景的不断拓展,人们逐渐意识到大模型在运行效率和资源消耗方面存在一定的局限性。 于是,一种创新的模型优化手段 —— 模型蒸馏技术应运而生。 那么,究竟什么是模型蒸馏呢? 今天,就让我们一...
来源:孤独大脑公众号 爱 好奇 7个月前(02-19) 408浏览 0评论
一 最近的集体欢天喜地,除了《哪吒》,就是DeepSeek了。 《哪吒》票房百亿,听说马上就要踏遍好莱坞;DeepSeek先是干翻硅谷万亿市值,然后拉起A股和恒生科技万亿市值。 DeepSeek的强大,自有各路专家研究解读。能够几乎在一夜之间,让大...
来源:腾讯科技公众号 爱 好奇 7个月前(02-18) 524浏览 0评论
郭晓静 腾讯科技《AI未来指北》特约作者 DeepSeek系列模型在很多方面的表现都很出色,但“幻觉”问题依然是它面临的一大挑战。 在Vectara HHEM人工智能幻觉测试(行业权威测试,通过检测语言模型生成内容是否与原始证据一致,从而评估模型的幻...
来源:腾讯研究院公众号 爱 好奇 7个月前(02-18) 579浏览 0评论
访谈主持人 王强 腾讯研究院前沿科技研究中心主任 徐一平 腾讯研究院高级研究员 以生成式AI为代表的新技术浪潮日新月异,正带来一场深刻的技术、商业与社会变革,推动人类社会从信息社会向智能社会转变。全世界热切期待AI到来的同时,也非常关心人工智能将带来...
来源:老胡说科学公众号 爱 好奇 7个月前(02-17) 529浏览 0评论
2017年,深度学习领域迎来了一个划时代的突破——《Attention is All You Need》这篇论文的发表,几乎一夜之间改变了人工智能的发展轨迹。这篇论文的核心贡献是提出了一种全新的模型架构——Transformer,彻底摒弃了传统的递归...