一个人最好记性不要太好,因为回忆越多,幸福感越少。

好奇

大白话解释Token:更多Token=更强AI?为何要用Token结算?

大白话解释Token:更多Token=更强AI?为何要用Token结算?

来源:超算百科公众号 爱 好奇 1个月前(03-07) 128浏览 0评论

你有没有想过,当你和AI聊天、让它写文章或者生成代码时,它究竟是如何理解你的问题并给出回答的?其实,这一切的背后都离不开一个关键概念——Token 。 你可以把它想象成语言的“积木”,每一个Token都是AI理解和生成文本的基本单元。从简单的日常对话...

大白话解释大模型的技术原理,为什么它那么聪明?

大白话解释大模型的技术原理,为什么它那么聪明?

来源:超算百科公众号 爱 好奇 1个月前(03-07) 102浏览 0评论

近年来,大模型技术逐渐走进我们的生活。无论是在科技新闻里,还是在日常聊天中,总能听到它的名字。它不仅能写文章、画图、翻译语言,还能帮医生诊断疾病,甚至完成一些我们以前觉得只有人类才能做的事情。 “大模型”到底是什么?为什么它这么厉害?它是怎么做到的?...

丁磊:DeepSeek爆火,你不知道的AI真相

丁磊:DeepSeek爆火,你不知道的AI真相

来源:中信书院公众号 爱 好奇 1个月前(03-05) 124浏览 0评论

过去的2024年,可以说是人工智能发展的分水岭,是大模型技术从量变到质变的关键一年。 无数大模型正在以肉眼可见的速度渗透进各行各业的“毛细血管”中。众多互联网产品都嵌入了AI功能模块,技术突破、应用普及以及开源与商业化并行发展……这种技术创新和产业落...

AGI世界畅想

AGI世界畅想

来源:36氪 爱 好奇 1个月前(03-04) 126浏览 0评论

AGI如果到来,会对社会、就业、能源消耗和AI 基础设施投资产生什么影响? 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:最近DeepSeek推理模型的表现和开源让人们对通用人工智能(A...

我们都是基因的马赛克

我们都是基因的马赛克

来源:赛先生公众号 爱 好奇 1个月前(03-03) 127浏览 0评论

人到中年,已经成为了复杂的细胞嵌合体(mosaics of cells),其中大多数细胞基本相同,但并非完全一致。图源:KNOWABLE MAGAZINE 导读: 想象你的身体:它是成千上万细胞的聚集,承载着一生中积累的无数基因错误——其中许多是无害...

DeepSeek降临一个月,新世界就这样到来了

DeepSeek降临一个月,新世界就这样到来了

来源:摩登中产公众号 爱 好奇 2个月前(03-02) 132浏览 0评论

所有的预言,开始具象化。 一 1月20日,英伟达CEO黄仁勋黑衫短袖,在北京年会上热舞。开场演讲中他说,新的计算时代开始了。 当夜8点10分,深度求索官方公众号发文,DeepSeek-R1亮相。 新模型在岁末寒流中破风而行。一天后热议,三天后破圈,六...

万字赏析 DeepSeek 创造之美:DeepSeek R1 是怎样炼成的?

万字赏析 DeepSeek 创造之美:DeepSeek R1 是怎样炼成的?

来源:真格基金公众号 爱 好奇 2个月前(03-01) 134浏览 0评论

大家好,我是 Monica.im 的产品合伙人张涛。 相信大家和我一样,整个春节期间几乎都在抱着手机刷信息。白天看国内的反应,晚上看美国的反应。整个春节就这样度过了。春节后这一周,大家已经在各种微信公众号和其他平台上刷了大量关于 R1 的分析文章,从...

李国杰院士“七问”DeepSeek

李国杰院士“七问”DeepSeek

来源:科技导报公众号 爱 好奇 2个月前(02-26) 104浏览 0评论

近日,DeepSeek的横空出世,在全球科技领域激起千层浪,引发了从学界到业界的广泛热议与深度思考。《科技导报》2025年第3期刊发李国杰院士的《DeepSeek引发的AI发展路径思考》一文,深入剖析了DeepSeek背后所蕴含的AI发展路径相关问题...

追捧“AI智能体”的人该醒醒了

追捧“AI智能体”的人该醒醒了

来源:36氪 爱 好奇 2个月前(02-21) 99浏览 0评论

吹智能体的都是没用过的。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:很多预测都认为今年是智能体爆发之年。但一位博主用自己的亲身实践指出,AI的不确定性是很大的麻烦,智能体不大可能接管...

熵,绝对混沌,还是无知的量度?

熵,绝对混沌,还是无知的量度?

来源:追问nextquestion公众号 爱 好奇 2个月前(02-20) 131浏览 0评论

200年前,一位法国工程师提出了“熵”这个概念,用以量化宇宙不可避免地滑向衰败的过程。然而,按照我们当前的理解,熵并非简单地反映世界的本质,更多的是我们日益增长的无知的体现。接受这一事实,正在促使我们重新审视从理性决策到机器能力的极限等各个领域。 0...

模型蒸馏:让学霸老师带出学神学生

模型蒸馏:让学霸老师带出学神学生

来源:中兴文档公众号 爱 好奇 2个月前(02-19) 153浏览 0评论

目前大模型的应用场景已经落地到我们生活的方方面面,然而,随着应用场景的不断拓展,人们逐渐意识到大模型在运行效率和资源消耗方面存在一定的局限性。 于是,一种创新的模型优化手段 —— 模型蒸馏技术应运而生。 那么,究竟什么是模型蒸馏呢? 今天,就让我们一...

DeepSeek收你们来了,还吃?

DeepSeek收你们来了,还吃?

来源:孤独大脑公众号 爱 好奇 2个月前(02-19) 140浏览 0评论

一  最近的集体欢天喜地,除了《哪吒》,就是DeepSeek了。 《哪吒》票房百亿,听说马上就要踏遍好莱坞;DeepSeek先是干翻硅谷万亿市值,然后拉起A股和恒生科技万亿市值。 DeepSeek的强大,自有各路专家研究解读。能够几乎在一夜之间,让大...

专访上海交大讲席教授徐雷:人工智能走了20年弯路之后

专访上海交大讲席教授徐雷:人工智能走了20年弯路之后

来源:腾讯研究院公众号 爱 好奇 2个月前(02-18) 155浏览 0评论

访谈主持人 王强 腾讯研究院前沿科技研究中心主任 徐一平 腾讯研究院高级研究员 以生成式AI为代表的新技术浪潮日新月异,正带来一场深刻的技术、商业与社会变革,推动人类社会从信息社会向智能社会转变。全世界热切期待AI到来的同时,也非常关心人工智能将带来...

5000字!深度学习中的“智能眼”:揭秘注意力机制的奥秘

5000字!深度学习中的“智能眼”:揭秘注意力机制的奥秘

来源:智驻未来公众号 爱 好奇 2个月前(02-15) 174浏览 0评论

一、什么是注意力机制? 在深度学习中,特征选择是一个关键问题,尤其是在处理高维数据时。传统的深度学习模型,如卷积神经网络(CNN),通常会从输入数据中自动学习特征表示,但这些特征的表示可能包含大量冗余或不相关的信息。这不仅会增加模型的计算负担,还可能...