GPT-5 为啥不 “胡说” 了?OpenAI 新论文讲透了
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
文|博阳 GPT-5发布之后,虽然其性能并未能达成业界的“飞跃”期望,但其中最亮眼的就是幻觉率的大幅下降。 OpenAI给出的数据显示,GPT-5出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。 但这一提升背后...
以微饿之态,养身心之力,避停滞之险,得丰盈之人。 作者:深海 前段时间刷视频,我被罗翔老师的一句话狠狠戳中了: “一天24小时,你刷了8个小时的手机,又看了两个小时的小黄书,然后又刷了3个小时的剧,其他的时间不是吃就是睡,你说你到底是个什么样的人? ...
来源:机器之心公众号 爱 好奇 1周前(09-09) 48浏览 0评论
AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。 大模型会有幻觉,这几乎已经成为一个常识,让每一个严肃使用大模型的人都不得不谨慎小心。Open...
来源:企业管理杂志公众号 爱 好奇 2周前(09-04) 67浏览 0评论
构建一个拥抱不确定性、鼓励多元探索、宽容失败的创新生态系统。 2015年3月,“互联网+”写入政府工作报告,推动互联网与传统行业的深度融合。十年后,“人工智能+”也写入了政府工作报告,新一轮变革正在上演。从“互联网+”到“人工智能+”,不仅意味着技术...
来源:36氪 爱 好奇 2周前(09-02) 77浏览 0评论
一辈子可长可短。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 起床,开始工作,结束工作,晚餐,睡觉,如此往复……有时感觉几周、几个月、甚至几年飞逝而过,却感觉不到有什么事情发生。 作为时间管理...
来源:星图金融研究院公众号 爱 好奇 3周前(08-29) 64浏览 0评论
本轮牛市,上证指数一路突破各种“前高”,势如破竹,很多投资者却感慨“涨指数不涨个股”,虽是普涨行情,看着自己的账户跑输指数依旧苦恼不已。问题出现在哪里呢?可能源于投资者太有“主见”了。在股票投资的世界里,投资者常常陷入对“精准”的狂热追求——试图通过...
来源:智东西公众号 爱 好奇 3周前(08-25) 92浏览 0评论
大模型像外星事物,搞清楚它们在想什么很重要。 编译 | 程茜 编辑 | 心缘 智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?...
来源:摩登中产公众号 爱 好奇 4周前(08-22) 115浏览 0评论
挣脱肉身。 一 银灰色的电缆插入后颈,绿色数字倾泻而下,基努里维斯惊诧睁大双眼。 21世纪的故事以《黑客帝国》开篇,无人料到,那是一个漫长的伏笔。 26年后,今年8月,OpenAI宣布进军脑机接口领域,同月,苹果的脑机接口协议发布,而一个多月前,马斯...
来源:数字生命卡兹克公众号 爱 好奇 1个月前(08-17) 144浏览 0评论
GPT-5和“还我GPT-4o”的风波,闹得沸沸扬扬。 今天,奥特曼还有一次认怂了,不仅调了UI,还把o3这些老模型还了回来。 这些其实都是产品层面的,但是我自己的心中,其实一直好奇另一个问题。 为什么GPT-5在变可靠幻觉率变得极低了之后,他的情商...
来源:洞见公众号 爱 好奇 1个月前(08-13) 99浏览 0评论
2015年,作家李尚龙曾说:废掉一个年轻人,一根网线就够了。 如今十年过去,算法让这句话更具冲击力。 TED做过一项统计。 Twitter每日推文量在5亿条以上,浏览量超2000亿次,用户每天观看推文超300条。 更可怕的是,这些信息都是经过算法筛...
来源:返朴公众号 爱 好奇 1个月前(08-07) 113浏览 0评论
一个诞生于200多年前的数学定理,在漫长的时间里改变了医学、法律、科研、人工智能等多个领域,并成为个人理性思考和决策的强大工具。这正是贝叶斯定理的魅力所在。它不仅仅是一个数学公式,更是一种帮助我们在不确定性中寻找答案的思维方法。但是,实际上大多数人都...
来源:知乎 爱 好奇 2个月前(08-01) 167浏览 0评论
(基于非形式逻辑谬误与认知偏差的综合分类) 一、基础推理缺陷 1,后此谬误(Post Hoc Ergo Propter Hoc):因事件A先于B发生,即认定A是B的原因(如“鸡鸣后太阳升起,故鸡鸣导致日出”) 2,片面归因(Texas Sharpsh...
来源:科普中国 爱 好奇 2个月前(07-19) 174浏览 0评论
相信不少朋友已经体验过文生图这类模型,比如 MidJourney、Stable Diffusion 或 OpenAI 的 DALL·E 等。只需简单输入一段文字,就能获得高质量的图像,这也让许多平面设计师倍感压力。接下来,我们将深入探讨这类模型的工作...
来源:腾讯科技公众号 爱 好奇 2个月前(07-18) 155浏览 0评论
文|晓静、博阳 编辑|萌萌 Agent是今年AI圈最大的共识,OpenAI自然也不能掉队。 北京时间2025年7月18日凌晨1点,Sam Altman和四位OpenAI 的研究员在直播中正式发布了ChatGPT Agent——一款通用型AIAgent...
来源:返朴公众号 爱 好奇 2个月前(07-14) 171浏览 0评论
近期,多个品牌充电宝厂家因电芯存在安全风险实施召回,而此前国家市场监督管理总局已撤销或暂停了多个充电宝及电芯厂家 3C 认证。6月26日,民航局发布紧急通知,自 6 月 28 日起禁止旅客携带没有 3C 标识、3C 标识不清晰、被召回型号或批次的充电...
来源:吴晓波频道公众号 爱 好奇 2个月前(07-12) 157浏览 0评论
“全球加速推动稳定币立法的背后,是希望利用稳定币来巩固美元主导地位的美国,和尝试‘去美元化’的其他国家。” 文 / 巴九灵 最近,身边很多人都在讨论一个新东西:稳定币。 尤其进入5月,中美欧好像排练好了一样,先后抛出稳定币监管重磅文件。 5月20日,...
来源:盖亚组织公众号 爱 好奇 2个月前(07-06) 208浏览 0评论
导语:在瑞·达利欧的世界观中,“成功”不是一个点,而是一条路径;不是命运馈赠的偶然,而是可以被系统提炼、持续优化的决策机制。这位桥水基金创始人用几十年实践,总结出一套堪称“操作系统”的思维体系,其核心不过两个字:原则。 原则是他破解世界运行逻辑的「钥...
来源:中信书店公众号 爱 好奇 2个月前(07-05) 176浏览 0评论
当全球债务突破300万亿美元、多国大选极右翼势力崛起、地缘冲突频发、人工智能以“周”为单位迭代颠覆产业……世界在多重震荡中迎来新秩序重构,我们已然站在“巨变拐点”上。 以上这些看似孤立的事件,在桥水创始人瑞·达利欧的宏观框架中,正是“大债务周期”与“...
来源:追问nextquestion公众号 爱 好奇 3个月前(07-01) 239浏览 0评论
人工智能的终极梦想,从来不局限于打造一个能击败国际象棋特级大师的博弈引擎,或是设计出花言巧语蛊惑人心的聊天机器人。它的真正使命,是成为一面映照人类智慧的明镜,帮助我们更深刻地认识自我。 科研工作者的目标,也不止于是狭义的人工智能,他们追求的是通用型人...
来源:腾讯研究院公众号 爱 好奇 3个月前(06-30) 197浏览 0评论
闫德利 腾讯研究院资深专家 一、AI已在诸多任务领域超越人类 AI发展日新月异,在许多任务上已经陆续超越人类基线水平。如2015年图像分类,2018年中等水平阅读理解,2020年视觉推理、英语语言理解,2023年多任务语言理解、竞赛级数学,2024年...