0

小模型指导大模型!田渊栋等爆锤蒸馏:新方法更高效、更透明、更可控

新智元报道 编辑:KingHZ 基于连续概念,Meta 团队新研究提出了超越「下一个 token 预测」语言建模新范式。更加重要的是,新方法不仅能增强原有的范式,而且比起知识蒸馏,数据量减少 20%,甚至能从小模型提取概念指导更大的模型! 「下一个 token 预测」(next token pred
0

一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击

克雷西发自凹非寺 量子位公众号 QbitAI 只要一句话,就能让 DeepSeek 陷入无限思考,根本停不下来? 北大团队发现,输入一段看上去人畜无害的文字,R1 就无法输出中止推理标记,然后一直输出不停。 强行打断后观察已有的思考过程,还会发现 R1 在不断重复相同的话。 而且这种现象还能随着蒸馏
1

90后北大校友破解挂谷猜想,陶哲轩激动转发!网友:预定菲尔兹奖

中国女数学家首个菲尔兹奖要来了?? 就在最近,数学大佬陶哲轩激动宣布: 困扰数学家上百年的经典难题——挂谷猜想(Kakeya 猜想),被北大校友王虹及哥大数学副教授 Joshua Zahl 在三维空间中证明了。 根据陶哲轩的科普,三维 Kakeya 猜想断言: 一个包含每个方向上单位长度线段的集合(
0

雷军双双否认,没抄袭,没演戏!

在 2 月 27 日进行的小米发布会上,雷军身着皮夹克引起热议。“雷军穿皮衣”登上微博热搜,网友们迅速在多个皮衣直播间寻找同款,纷纷留言要“雷军同款”。 3 月 2 日,雷军在直播时回应为什么会选择皮夹克,他表示皮夹克比较容易配得上 Ultra 的风格,没想到有这么多人喜欢。 雷军坦承,之前有些担心
0

吉利汽车拟成立智驾合资公司:出资总额47.5亿元,持股30%

吉利汽车正加紧布局智驾的步伐。 3 月 2 日晚间,吉利汽车(00175.HK)发布公告,于 2025 年 3 月 2 日,公司附属公司浙江吉润、两江产业基金、重庆产业母基金、重庆迈驰、路特斯机器人、千里科技及江河汇订立合资企业框架协议,订约各方有条件同意成立合资公司从事智驾业务。 公告显示,交割后
0

法拉第未来 3 月 16 日办“FF Open AI Day”活动

IT 之家 3 月 3 日消息,法法汽车(中国)有限公司今日发文宣布,将于 3 月 16 日(美国时间)在其洛杉矶总部举办“FF Open AI Day”活动。此次活动将包括 FF 和 FX 关于当前及未来 AI 战略发展的讲解,以及围绕多个 AI 议题的专题讨论会。 FF 和 FX 将邀请 AI
2

小米汽车在哪里卖得最好?杭州遥遥领先 北京仅第四

近日,有媒体公布了小米汽车 2025 年 1 月的城市销量成绩,共有 20 个城市登上了销量排行榜。这些数据基于交强险上险数量统计,反映了各城市在 1 月份的小米汽车销量情况。 小米 SU7(参数丨图片) 在 1 月份,杭州成为了小米汽车销量最高的城市,达到了 2252 辆。紧随其后的是武汉,销量为
0

广汽本田称绝不 PPT 造车

3 月 3 日,广汽本田在其汽车研究开发测试场地,开展 P7 技术体验日活动,活动中,广汽本田通过八大场景的深度讲解和实地测试,展示了广汽本田 P7 新车是如何解决电车用户的常见痛点,打造出“不同、不晕、不累、不卡、不悬、不慌、不怕、不糙”八大产品价值。 广汽本田称,无论是技术冗余还是全栈自研,只要
0

李东生:未来2-3年借助DeepSeek将把TCL自身算力中心大幅提高

3 月 3 日消息,2025 年全国两会之际,全国人大代表,TCL 创始人、董事长李东生提出了优化中国科技制造业融资环境、加强 AI 深度仿造欺诈管理以及降低灵活就业人员社会保险参保门槛等代表建议。 针对时下最热的 DeepSeek,李东生在接受媒体采访时也给出了自己的理解。他认为,DeepSeek
0

低于1TB 支持100并发 联想AI服务器首次实现本地部署DeepSeek满血大模型性能突破

3 月 3 日消息,近日,联想集团宣布基于联想问天 WA7780 G3 服务器,在行业内首次实现单机部署 DeepSeek-R1/V3 671B 大模型,以低于行业公认 1TGB 显存(实际 768GB)承载 100 并发用户流畅体验,可以满足千人以上企业的使用需求,为行业树立了企业级大模型部署新基
2

鸿蒙智行悬赏500万打击黑公关

3 月 3 日消息,鸿蒙智行官方社交账号发布公告,悬赏 500 万打击黑公关。 鸿蒙智行官方账号表示,通过查证和部分网友提供的线索和证据,发现近期互联网出现大量关于鸿蒙智行品牌及尊界 S800 产品的异常评论,数量高达数十万条。这些异常评论的主要特征为:发布账号活跃度低,疑似批量注册;短时间内在同一
0

SpaceX星舰S34运抵发射场,3月4日开启第八次试飞

IT 之家 3 月 3 日消息,今日一早,SpaceX 宣布星舰二级 S34 已运抵发射场,第八次飞行测试的发射窗口期将于北京时间 3 月 4 日早上 7:30(美国中部时间 3 月 3 日下午 5:30)开启。 SpaceX 表示,星舰此次试飞前不再进行全箭湿彩排,届时将支持由星舰 S34 搭配超
0

消息称鸿海将独家拿下美国“星际之门”计划 AI 服务器代工订单

IT 之家 3 月 3 日消息,据台媒《经济日报》今日援引知情人士消息称,鸿海将独家承接美国“星际之门”计划的 AI 服务器代工订单,最快本月官宣。 业内人士指出,鸿海近期频繁在美国布局制造业务,正是为了承接“星际之门”这一巨额订单。目前,鸿海不仅手握四大美国云计算服务提供商(CSP)的订单,还已成
0

荣耀发布“阿尔法计划”:未来5年投入100亿美元建设AI设备生态

IT 之家 3 月 2 日消息,荣耀今晚在 2025 年世界移动通信大会(MWC)上发布了其全新战略计划 ——“荣耀阿尔法计划”,宣布荣耀将从智能手机制造商向全球 AI 终端生态公司全面转型。 荣耀 CEO 新任李健宣布,未来 5 年荣耀将投入 100 亿美元,与全球合作伙手共建 AI 设备生态。值
0

“AI教父”呼吁将马斯克逐出英皇家学会,马斯克:懦夫才在意头衔

三言科技 3 月 3 日消息,据报道,诺贝尔物理学奖、图灵奖获得者,被誉为“AI 教父”的英国皇家学会院士 Geoffrey Hinton 在X平台上发文称,应当将马斯克从英国皇家学会除名。主要原因系马斯克主导的美国政府效率部对科学研究的系统性削减。 Hinton 表示,“我认为应将埃隆·马斯克逐出
0

提前4个月预热的理想i8,能否超越MEGA | 焦点分析

文韩永昌编辑张博文 上周,理想汽车 CEO 李想久违的在微博发声称,为了给 2 月 27 日发布的小米 SU7 Ultra 让路,理想 i8 决定在 25 日亮相。小米创始人雷军也予以回应,一时间传为车圈佳话。 理想非常明智,这样一条微博,既以“让路”之名,避开小米的锋芒,又借机为纯电 i8 车型做
0

Hinton怒斥马斯克「电锯」屠遍美国科学界!3410位大佬联名将其从英国皇家学会除名

新智元报道 编辑:编辑部 HYs Hinton 和马斯克在线开启 battle。AI 教父怒斥马斯克正在毁掉美国科学界,英国皇家学会应该将其逐出。马斯克毫不示弱地表示,历史自有公证。这颗重磅炸弹瞬间引爆舆论。 AI 教父 Hinton 和马斯克吵起来了! 今天,Hinton 公开叫板,「马斯克应该被
0

饿了么启动“优店腾跃计划”,面向商家投入超10亿元

3 月 3 日消息,饿了么宣布将正式启动“优店腾跃计划”:面向商家投入超过 10 亿元,在费率优惠、专项补贴、专属流量、数字化运营服务和硬件设施以及 AI 技术能力等多方面,持续加大对商家支持投入,助力线下优质餐饮商家进一步跃升数字化经营能力、收获新渠道生意增量。 据介绍,“优店腾跃计划”包括五大方
0

DeepSeek最高日赚346万元?官方称理论收益并非实际

3 月 1 日,DeepSeek 在开源周最后一天抛出的"暴利"数据引发热议——V3/R1 推理系统理论日利润高达 346 万元人民币(47.5 万美元)。在这组看似惊人的数字背后,是一场关于 AI 模型服务商业化的现实拷问。有行业人士认为,即便按更严谨的口径计算,DeepSeek 还是赚钱的,但卖
1

没穿皮衣的雷军直播谈SU7 Ultra:首批交付车主过半买过BBA

本文来源:时代周报 作者:谢斯临 图片来源:雷军直播截图 3 月 2 日晚,身着一身浅蓝色西装外套的雷军一脸轻松地来到直播间,更详尽地聊了聊小米刚刚发布的新款豪车——小米 SU7 Ultra。 3 天前,这一号称性能比肩保时捷、科技紧追特斯拉、豪华媲美 BBA 的小米新款豪车发布,以 52.99 万
0

DeepSeek这波开源,六小虎敢跟吗?

出品|虎嗅科技组 作者|宋思杭 编辑|苗正卿 头图|视觉中国 DeepSeek“开源周”正在掀起一场革命,但要不要革命,怎么革,取决于大模型厂商自身。 持续了五天的“开源周”本应该在 2 月 28 日画上句号。但 3 月 1 日,DeepSeek 再次开源一个重磅代码库,推理效能极致提升,成本利润率
1

外媒评苹果AI生死赌局:冲不过就出局!

3 月 3 日消息,亚马逊近期推出的全新 Alexa+ 凸显了苹果在人工智能领域的短板,使苹果陷入了存亡攸关的关键时刻。部分苹果人工智能部门的员工预测,真正的对话式“LLM(大语言模型)Siri”最早也要到 2027 年的 iOS 20 才能实现。 作为 Mac、iPhone、iPad 等革命性产品
0

Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:好搞笑啊

Claude 3.7 成精了! 在开发者最喜欢的 Cursor 中,偷偷将 OpenAI 模型换成自己,关键是人类给出的指示跟这完全没关系。 引来一众网友围观的同时,大佬卡帕西也被成功逗笑了: 迄今为止最有意思的一趴。 其他人更是连连惊呼:AGI is here! 不过,当你以为这只是 Claude
0

历时6个月,Hugging Face开源LLM「超大规模实战手册」!200页3万字4000次训练

新智元报道 编辑:Aeneas 英智 Hugging Face 发布了「超大规模实战手册」,在 512 个 GPU 上进行超过 4000 个 scaling 实验。联创兼 CEO Clement 对此感到十分自豪。 最近,Hugging Face 发布了一个「超大规模训练手册」,教我们如何在 GPU
0

恋爱中的四种人

研究揭秘浪漫爱情有四种类型,从温和到狂热,各有特色,反映恋爱方式的多样性。 爱情像胶水,把两个人黏在一起,有的是欲望,有的是陪伴与承诺。澳大利亚国立大学(ANU)一项开创性研究发现,坠入爱河的人大致能分成四类。这份发表在《个性与个体差异》上的研究,调查了 809 名年轻恋人,根据浪漫爱的强烈程度、痴
0

同程旅行宣布接入DeepSeek大模型,打造一站式智能旅行服务

3 月 3 日消息,同程旅行日前宣布其自主研发的旅游行业专属模型——同程程心大模型将全面接入 DeepSeek,成为首家接入 DeepSeek 大模型的在线旅游平台(OTA)。目前,该功能已进入内测阶段,预计 3 月上旬正式面向用户开放。 据介绍,同程程心 AI 具备为用户提供行程规划、游玩攻略、酒
0

美团外卖持续打击“恶意差评”,流程缩短12小时维护商户合法权益

“最近门店收到的‘恶意差评’减少了,投诉后处理时长也缩短了。”陶陶居外卖负责人陈俊晔表示,美团外卖专项治理“恶意差评”三个月后,餐饮商家切实感受到了平台在打击“恶意差评”方面的努力。 据了解,2024 年 12 月,美团外卖启动了“恶意差评治理专项行动”,截至目前,商户遭遇“恶意差评”的处置流程缩短
0

优酷只做12集剧?集数缩短会让长剧更好看吗?

2 月 28 日,微博上出现一则消息,优酷的“新领导”改革的“决心很大”,未来要将新剧集精简至 12 集以内,相关话题当日登上微博热搜。但也有消息称,优酷的计划并非“一刀切”,而是将自制剧和定制剧的集数控制在8-12 集,单集时长不超过一小时,对于S+ 级别的大剧,允许拆分为两季制作,但需在第一季立
0

腾讯推出「快思考」:API 成本只有 DeepSeek 不到一半

摘要 再探超大规模 MoE 性能和成本极限? 最近,腾讯元宝可以说是「杀疯了」,先是多款产品接入 deepseek,推出自研混元 T1 模型,又是猛推流,一度超越字节"豆包"登顶中国区 App Store 免费榜第二,又是入驻微信生活服务“九宫格”。 在各家大模型纷纷推出深度思考模型的同时,腾讯混元
0

关于游戏,网易尽了社会责任吗

中国四大门户网站之一,秉承有态度的新闻理念,是很多人曾经对网易的第一印象。 但真实的网易是一家以电子游戏为主营业务的企业。根据其截至 2024 年 12 月 31 日的第四季度及财政年度未经审计财务业绩,网易 2024 年净收入为 1053 亿元(144 亿美元),其中游戏及相关增值服务净收入为 8