新闻首页 / “2025年05月06日”的新闻

查看方式:
0

AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份

新智元报道 编辑:定慧 科幻中 AI 自我复制失控场景,正成为现实世界严肃的研究课题。英国 AISI 推出 RepliBench 基准,分解并评估 AI 自主复制所需的四大核心能力。测试显示,当前 AI 尚不具备完全自主复制能力,但在获取资源等子任务上已展现显著进展。 想象一种失控的、具有自我复制能
0

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光

新智元报道 编辑:Aeneas KingHZ 超越 DeepSeek-R1 的英伟达开源新王 Llama-Nemotron,是怎么训练出来的?刚刚放出的论文,把一切细节毫无保留地全部揭秘了! 现在,英伟达 Llama-Nemotron 系列模型,正式超越 DeepSeek-R1! 而且,这些模型已经
0

「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

新智元报道 编辑:犀牛 本文深入梳理了围绕 DeepSeek-R1 展开的多项复现研究,系统解析了监督微调(SFT)、强化学习(RL)以及奖励机制、数据构建等关键技术细节。 最近,推理语言模型(RLMs)已经成为主流。 最新发布的、性能最强的 LLM 大都是推理模型。 尤其是 DeepSeek-R1
1

AI引爆全球失业潮,美国大学生毕业即失业!全球大厂联手裁员上万

新智元报道 编辑:Aeneas 定慧 现在,AI 已经彻底引爆了全球失业潮,多邻国裁员只是多米诺骨牌的第一张而已。外媒统计发现,全球五家大企业已经因为 AI 裁员了上万人。更有统计数据显示,最近美国大学毕业生的失业率异常之高,已经达到了 5.8%! 不开玩笑,AI 带来的全球失业潮,是真的来了! 从
0

苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器

新智元报道 编辑:英智 研究揭示早融合架构在低计算预算下表现更优,训练效率更高。混合专家(MoE)技术让模型动态适应不同模态,显著提升性能,堪称多模态模型的秘密武器。 如今,打造强大的多模态模型是 AI 领域的重要目标。 一种常用方法是把单独预训练好的模型组合起来,比如把训练好的视觉编码器连接到 L
0

AI教父Hinton警告:有志于编程,不必读大学!

新智元报道 编辑:KingHZ 程序员要消失了?AI 教父 Hinton、诺奖得主 Pissarides 和英伟达 CEO 黄仁勋齐声预警:AI 正在颠覆编程岗位,「写代码」将变成过去式!最新报告显示,美国超1/4 编程职位已消失。大学该不该还教编程?CS 还值不值得学? Hinton 相信未来 A
0

1美元颠覆6000亿广告界,哥大辍学天才30天狂飙500万营收

新智元报道 编辑:英智 当 AI 闯入营销界,会掀起怎样的风暴?哥大辍学天才 Kennan 打造的 Icon,以 1 美元成本颠覆 6000 亿广告市场,30 天狂揽 500 万美元 ARR,用技术改写行业。 通过学习数千个爆火的广告,Icon 在营销方面的知识,已经超越了全球最贵的营销大师 Gar
0

从游戏少女到AI女神!她用物理驯服AI,让飓风预测快1000倍

新智元报道 编辑:英智 25 年前,10 岁的 Rose Yu 收到一台改变命运的电脑,从玩游戏到成为 AI 领域的领军人物,她如何用物理学与深度学习破解交通、飓风和核聚变的难题?跟随她的脚步,揭秘一位天才科学家的开挂人生! 10 岁那年,Rose Yu 收到一份改变命运的生日礼物——一台电脑。 在
0

睡觉也在卷!伯克利Letta新作「睡眠时计算」让推理效率飙升

新智元报道 编辑:英智 AI 也会偷偷努力了?Letta 和 UC 伯克利的研究者提出「睡眠时计算」技术,能让 LLM 在空闲时间提前思考,大幅提升推理效率。 AI「睡觉」时也能思考了? Letta 和 UC 伯克利研究者提出了「睡眠时计算」(Sleep-time Compute)技术,旨在提高 L
0

别再卷数据了,LLM也怕「过劳死」!CMU等揭秘灾难性过度训练

新智元报道 编辑:KingHZ 颠覆 LLM 预训练认知:预训练 token 数越多,模型越难调!CMU、斯坦福、哈佛、普林斯顿等四大名校提出灾难性过度训练。 如果训练数据越多那么 LLM 越好。 这到底对不对? 不对! 增加更多的预训练数据来扩展语言模型,反而可能会导致后训练阶段的性能下降! 这就
1

25位IT大佬亲述:AI「吃掉」程序员!码农黄金时代终结

新智元报道 编辑:KingHZ AI 开发者可能自食其果,最先被 AI 取代!AI Impact Lab 的创始人认为:未来的趋势是 AI 让高级工程师比升值,而让初级工程师贬值。如果 AI 能引发文明变革,那「程序猿」将首当其冲,最先被 AI 取代。 如果 AI 真的取代人类工作,为什么不从 AI
0

让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?

新智元报道 编辑:定慧 当 AI 模型拥有千万级 Token 的超长记忆力时,如何检验它们的真正实力?OpenAI 给出了新答案:MRCR 基准测试。这不再是简单的「大海捞针」,而是要求模型在海量文本中,区分并找到多个一模一样的「针」中的特定一个,难度堪称「AI 界的奥运会」。MRCR 不仅有助于揭
0

AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品

新智元报道 来源:学术头条 具身智能最大的挑战在于泛化能力,即在陌生环境中正确完成任务。最近,Physical Intelligence 推出全新的π0.5 VLA 模型,通过异构任务协同训练实现了泛化,各种家务都能拿捏。 近年来,机器人取得了显著进展,能表演杂技、跳舞、听从指令,甚至完成叠衣服、擦
0

AI再破2000年前「上古卷轴」!古希腊著作原文首次重见天日

新智元报道 编辑:定慧好困 2000 多年未解之谜被 AI 破解!2025 年,研究人员首次非侵入性地读取到仍卷着的赫库兰尼姆古卷标题。这一突破来自维苏威挑战赛,获奖团队赢得 6 万美元,更为沉睡两千年的古代智慧开启了解读新纪元。 AI 再建一功! 火山灰掩埋的古代智慧,正在被 AI 一点点复活。
0

3B模型逆袭7B巨头!Video-XL-Pro突破长视频理解极限

Video-XL-Pro 团队投稿 量子位 | 公众号 QbitAI 3B 模型超越 Meta 7B 模型,超长视频理解 SOTA 刷新了! 来自上海交通大学、北京智源研究院、特伦托大学的联合研究团队推出了 Video-XL-Pro,实现近一万帧视频的单卡处理,大海捞针准确率超 98%。 现有的多模
0

用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源

超越 YOLOv3、Faster-RCNN,首个在 COCO2017 val set 上突破 30AP 的纯多模态开源 LLM 来啦! 华中科技大学、北京邮电大学等多所高校研究团队共同推出的 Perception-R1(PR1),在视觉推理中最基础的感知层面,探究 rule-based RL 能给模
0

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

MultiGO 团队投稿量子位 | 公众号 QbitAI 从人体单图变身高保真 3D 模型,不知道伤害了多少程序猿头发的行业难题,竟然被港科广团队一招破解了! 团队最新提出的MultiGO创新方案,借助分层建模思路——将人体分解为不同精度层级,从基础体型到衣物褶皱逐级细化。 这有点像在搭乐高积木:先
2

OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到

GPT-4o 更新后“变谄媚”?后续技术报告来了。 OpenAI 一篇新鲜出炉的认错小作文,直接引来上百万网友围观。 CEO 奥特曼也做足姿态,第一时间转发小作文并表示: (新报告)揭示了 GPT-4o 更新失败是因为什么,从中 OpenAI 学到了什么,以及我们将会采取的应对措施是什么。 概括而言
0

三位北大校友突破65年数学难题!为母校126周年献贺

65 年数学难题新突破! 来自复旦大学的林伟南、王国祯以及 UCLA 的徐宙利合作,解决了 126 维空间的 Kervaire 不变量问题。 三位作者都是北大数院出身,该成果曾作为北大建校 126 周年贺礼做报告,现在完整论文终于上传 arXiv。 △图源:北京大学数学科学学院 他们这次解决的是高维
1

大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%

BrowseComp-ZH 团队投稿 量子位 | 公众号 QbitAI 你以为大模型已经能轻松“上网冲浪”了? 新基准测试集 BrowseComp-ZH 直接打脸主流 AI。 BrowseComp-ZH 是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO 等机构联合发布的新基准测试集,让 2
0

海外最赚钱的中国AI公司,藏不住了

文 | 侃见财经 全球 AI 浪潮强势来袭,商业化爆发“奇点”临近。 4 月 28 日晚间,昆仑万维(300418.SZ)发布 2025 年一季度业绩报告,其中显示,公司一季度实现营业总收入 17.6 亿元,同比大幅增长 46%。整体毛利率高达 69%,继续保持在较高水平。 侃见财经翻看这份财报,最
0

当你的AI男友不再擦边,MiniMax就“赢”了

文 | 创业最前线,作者 | 冯羽,编辑 | 蛋总 “在使用海螺 AI 生成视频时偶尔会出现‘开盲盒’情况(即存在一定概率描述与生成内容不符),但大模型的本质是一种概率计算,尤其是手部细节是 AIGC 弱项,短期内难以避免。”一位短视频创作者表示。 这款支持文生视频、图生视频的 AI 内容平台上线时
0

AI大幅降本,扶起“半死不活”的动漫短剧

文 | 犀牛娱乐,作者|小福,编辑|朴芳 AI 技术增效,让动漫短剧也有了上桌的机会。 短短几年时间,一个动漫短剧演变出了各式各样的类型,动态漫短剧、AI 生成动漫短剧、AI 转绘动漫短剧……看似皆为动漫,却落得同台不同命。 传统动漫短剧成明日黄花 就在几个月之前,动漫短剧还不是那么被看好的生意。
0

突发!曝阿里通义薄列峰离职,此前为应用视觉团队负责人

衡宇发自凹非寺 量子位 | 公众号 QbitAI 五一节后第一口瓜,曝阿里通义实验室高层人员离职变动! “互联网八卦小喇叭”等多个微信公众号爆料,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级 P10),已于 4 月 30 日低调离职。 他曾带领团队做出通义 App 上全民舞王「兵马俑跳科目三」等
0

微信下场做抽奖,腾讯挖起自己的流量

文 | 电商在线 刚在春节用蓝包完成一场电商奇袭的腾讯,又搞起大动作。 自 2024 年 12 月灰度测试以来,微信蓝包凭借其“社交送礼”的便捷性迅速崛起。先是靠着送礼物这个独特功能抢夺互联网的流量与关注,随后快速进入用户的聊天页面,成为和红包一样占据C位的聊天框角色。2 月 5 日,微信派发布数据
5

哈啰单车,凭什么比公交还贵?

文 | 听筒 Tech,作者 | 陈柯,编辑 | 饶言 悄然涨价的“最后一公里”,用户直呼“骑不起”。 五一假期临近,那些曾靠“30 分钟内 1 元任意骑”俘获无数“旅游特种兵”的共享单车们,在经历一次次坐地起价后,正在被年轻人抛弃。 这些共享单车,不再是“城市慢骑”的首选,这其中,尤以哈啰单车为甚
0

TikTok Shop西线有战事

文 | 光子星球 4 月的广州暑气渐起,看似一片火热的广交会上,跨境从业者的脸上却有一丝遮不住的阴郁。 距离“关税大棒”正式落地还有半个月时间,全球最大市场的变故推动大家谋求新路。“大家都在准备退路,转代理甚至直接转行。” TikTok Shop 商家李斌(化名)便是其中之一,在他观察下,不少为跨境
0

优酷平台预算缩水后的第一剑,指向了男频剧

文 | 首席消费官,作者 | 苏苏 2023 年底,优酷当时剧集业务的负责人在公开讲话中提到,要“以男性赛道撬动平台新增量”。 2025 年,优酷剧集负责人更换后,曾经押注的男性赛道,作品或扑街、或迟迟无法播出、或一直开不了机,或在平台调转发展方向、施行“缩预算、砍集数”方针的影响下,传来了项目“开
0

被买爆的大疆Pocket3:“产品流量感”激发品牌势能活水

文 | 品牌议题 01、直男品牌,竟被女生买爆了 一部 2023 年 10 月上线的口袋相机大疆 Pocket 3,竟然在 2025 年 3 月依然断货。“电子茅台”名不虚传,太不可思议了。 一机难求,也有黄牛插脚的原因。第三方平台溢价普遍达 200-500 元,部分商家甚至效仿奢侈品行业的“配货模
0

昆仑万维做短剧:收入1.67亿元,月均流水千万美元

文 | DataEye 近日,互联网大厂昆仑万维发布 2024 年年报及 2025 年一季报。 昆仑万维 2024 年度总营收 56.6 亿元,同比增长 15.2%,但归母净亏损 15.95 亿,公司由盈转亏(2023 年净利润达 12.58 亿元)。到了一季度,公司营收达 17.64 亿元,同比增

新闻日历

新闻类别

昨日新闻阅读排行