大白话解释Token:更多Token=更强AI?为何要用Token结算?
来源:超算百科公众号 爱 好奇 1个月前(03-07) 128浏览 0评论
你有没有想过,当你和AI聊天、让它写文章或者生成代码时,它究竟是如何理解你的问题并给出回答的?其实,这一切的背后都离不开一个关键概念——Token 。 你可以把它想象成语言的“积木”,每一个Token都是AI理解和生成文本的基本单元。从简单的日常对话...
来源:超算百科公众号 爱 好奇 1个月前(03-07) 128浏览 0评论
你有没有想过,当你和AI聊天、让它写文章或者生成代码时,它究竟是如何理解你的问题并给出回答的?其实,这一切的背后都离不开一个关键概念——Token 。 你可以把它想象成语言的“积木”,每一个Token都是AI理解和生成文本的基本单元。从简单的日常对话...
来源:超算百科公众号 爱 好奇 1个月前(03-07) 102浏览 0评论
近年来,大模型技术逐渐走进我们的生活。无论是在科技新闻里,还是在日常聊天中,总能听到它的名字。它不仅能写文章、画图、翻译语言,还能帮医生诊断疾病,甚至完成一些我们以前觉得只有人类才能做的事情。 “大模型”到底是什么?为什么它这么厉害?它是怎么做到的?...
来源:量子位公众号 爱 好奇 1个月前(03-07) 126浏览 0评论
白交 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 计算机最高奖图灵奖揭晓! 强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为“引领基础AI技术开发的研究人员”。 值得一提的是,两位是师徒关系,Rich...
来源:中信书院公众号 爱 好奇 1个月前(03-05) 124浏览 0评论
过去的2024年,可以说是人工智能发展的分水岭,是大模型技术从量变到质变的关键一年。 无数大模型正在以肉眼可见的速度渗透进各行各业的“毛细血管”中。众多互联网产品都嵌入了AI功能模块,技术突破、应用普及以及开源与商业化并行发展……这种技术创新和产业落...
来源:中国企业家杂志公众号 爱 好奇 1个月前(03-05) 115浏览 0评论
开源模型正缓慢而坚定地超越闭源模型 编译|吴莹 曹冰颖(实习) 来源|人工智能之趋势(YouTube) “放弃生成式模型,不研究LLM(大语言模型),我们没办法只通过文本训练让AI达到人类的智慧水平。”近日,Meta首席AI科学家杨立昆(Yann L...
来源:36氪 爱 好奇 1个月前(03-04) 126浏览 0评论
AGI如果到来,会对社会、就业、能源消耗和AI 基础设施投资产生什么影响? 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:最近DeepSeek推理模型的表现和开源让人们对通用人工智能(A...
来源:赛先生公众号 爱 好奇 1个月前(03-03) 127浏览 0评论
人到中年,已经成为了复杂的细胞嵌合体(mosaics of cells),其中大多数细胞基本相同,但并非完全一致。图源:KNOWABLE MAGAZINE 导读: 想象你的身体:它是成千上万细胞的聚集,承载着一生中积累的无数基因错误——其中许多是无害...
来源:摩登中产公众号 爱 好奇 2个月前(03-02) 132浏览 0评论
所有的预言,开始具象化。 一 1月20日,英伟达CEO黄仁勋黑衫短袖,在北京年会上热舞。开场演讲中他说,新的计算时代开始了。 当夜8点10分,深度求索官方公众号发文,DeepSeek-R1亮相。 新模型在岁末寒流中破风而行。一天后热议,三天后破圈,六...
来源:真格基金公众号 爱 好奇 2个月前(03-01) 134浏览 0评论
大家好,我是 Monica.im 的产品合伙人张涛。 相信大家和我一样,整个春节期间几乎都在抱着手机刷信息。白天看国内的反应,晚上看美国的反应。整个春节就这样度过了。春节后这一周,大家已经在各种微信公众号和其他平台上刷了大量关于 R1 的分析文章,从...
来源:集智俱乐部公众号 爱 好奇 2个月前(02-27) 129浏览 0评论
量子分形艺术家维克托·马津(Wiktor Mazin)使用量子计算机生成的分形图像|图片来源:@wiktormazin_quantum_art 导语 量子力学描绘了一个反直觉的现实:观察的行为会影响被观察的对象——⽽关于这种现象的本质解释,科学界⾄今...
来源:科技导报公众号 爱 好奇 2个月前(02-26) 104浏览 0评论
近日,DeepSeek的横空出世,在全球科技领域激起千层浪,引发了从学界到业界的广泛热议与深度思考。《科技导报》2025年第3期刊发李国杰院士的《DeepSeek引发的AI发展路径思考》一文,深入剖析了DeepSeek背后所蕴含的AI发展路径相关问题...
来源:机器之心公众号 爱 好奇 2个月前(02-23) 142浏览 0评论
机器之心报道 编辑:Panda、张倩 在当今的 AI 领域,图灵奖得主 Yann LeCun 算是一个另类。即便眼见着自回归 LLM 的能力越来越强大,能解决的任务也越来越多,他也依然坚持自己的看法:自回归 LLM 没有光明的未来。 在近期的一次演讲...
来源:36氪 爱 好奇 2个月前(02-21) 99浏览 0评论
吹智能体的都是没用过的。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:很多预测都认为今年是智能体爆发之年。但一位博主用自己的亲身实践指出,AI的不确定性是很大的麻烦,智能体不大可能接管...
来源:追问nextquestion公众号 爱 好奇 2个月前(02-20) 131浏览 0评论
200年前,一位法国工程师提出了“熵”这个概念,用以量化宇宙不可避免地滑向衰败的过程。然而,按照我们当前的理解,熵并非简单地反映世界的本质,更多的是我们日益增长的无知的体现。接受这一事实,正在促使我们重新审视从理性决策到机器能力的极限等各个领域。 0...
来源:中兴文档公众号 爱 好奇 2个月前(02-19) 153浏览 0评论
目前大模型的应用场景已经落地到我们生活的方方面面,然而,随着应用场景的不断拓展,人们逐渐意识到大模型在运行效率和资源消耗方面存在一定的局限性。 于是,一种创新的模型优化手段 —— 模型蒸馏技术应运而生。 那么,究竟什么是模型蒸馏呢? 今天,就让我们一...
来源:孤独大脑公众号 爱 好奇 2个月前(02-19) 140浏览 0评论
一 最近的集体欢天喜地,除了《哪吒》,就是DeepSeek了。 《哪吒》票房百亿,听说马上就要踏遍好莱坞;DeepSeek先是干翻硅谷万亿市值,然后拉起A股和恒生科技万亿市值。 DeepSeek的强大,自有各路专家研究解读。能够几乎在一夜之间,让大...
来源:腾讯科技公众号 爱 好奇 2个月前(02-18) 144浏览 0评论
郭晓静 腾讯科技《AI未来指北》特约作者 DeepSeek系列模型在很多方面的表现都很出色,但“幻觉”问题依然是它面临的一大挑战。 在Vectara HHEM人工智能幻觉测试(行业权威测试,通过检测语言模型生成内容是否与原始证据一致,从而评估模型的幻...
来源:腾讯研究院公众号 爱 好奇 2个月前(02-18) 155浏览 0评论
访谈主持人 王强 腾讯研究院前沿科技研究中心主任 徐一平 腾讯研究院高级研究员 以生成式AI为代表的新技术浪潮日新月异,正带来一场深刻的技术、商业与社会变革,推动人类社会从信息社会向智能社会转变。全世界热切期待AI到来的同时,也非常关心人工智能将带来...
来源:老胡说科学公众号 爱 好奇 2个月前(02-17) 167浏览 0评论
2017年,深度学习领域迎来了一个划时代的突破——《Attention is All You Need》这篇论文的发表,几乎一夜之间改变了人工智能的发展轨迹。这篇论文的核心贡献是提出了一种全新的模型架构——Transformer,彻底摒弃了传统的递归...
来源:智驻未来公众号 爱 好奇 2个月前(02-15) 174浏览 0评论
一、什么是注意力机制? 在深度学习中,特征选择是一个关键问题,尤其是在处理高维数据时。传统的深度学习模型,如卷积神经网络(CNN),通常会从输入数据中自动学习特征表示,但这些特征的表示可能包含大量冗余或不相关的信息。这不仅会增加模型的计算负担,还可能...