Anthropic 教会了模型懂道德,也打通了一条蒸馏你的新路|Hao好聊论文
来源:腾讯科技公众号 爱 好奇 1个月前(05-25) 142浏览 0评论
文|博阳 编辑|徐青阳 Anthropic 5月8 日发布了一篇对齐研究《Teaching Claude Why》,讨论的人不算多。 过去大模型的对齐似乎非常低效。做了一通RLHF,模型依然会因为生存危机反水。最典型的就是Anthropic的智能体失...
来源:腾讯科技公众号 爱 好奇 1个月前(05-25) 142浏览 0评论
文|博阳 编辑|徐青阳 Anthropic 5月8 日发布了一篇对齐研究《Teaching Claude Why》,讨论的人不算多。 过去大模型的对齐似乎非常低效。做了一通RLHF,模型依然会因为生存危机反水。最典型的就是Anthropic的智能体失...
来源:腾讯科技公众号 爱 好奇 2个月前(04-28) 267浏览 0评论
文 |彭超 博阳 编辑|徐青阳 三月底的一周,GitHub Trending 上同时出现了五六个项目。它们的名字一个比一个离谱。 「同事 skill」把离职同事的飞书消息、钉钉文档、Slack 记录、微信聊天喂给 Claude,自动生成一个 skil...
来源:机器之心公众号 爱 好奇 3个月前(04-05) 830浏览 0评论
在 2026 年 4 月的这几天,科技圈的目光被 GitHub 上一场诡异的开源狂欢所吸引。随着大模型技术的进一步普及,一种以 .skill 为后缀的项目如雨后春笋般涌现,并以前所未有的速度在各大社交平台上引发裂变。 起初,这似乎只是程序员群体中常见...