新闻首页 / “2024年06月03日”的新闻

查看方式:
0

昆仑万维开源2千亿稀疏大模型天工MoE,全球首创能用4090推理

2024 年 6 月 3 日,昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE , 性能强劲, 同时推理成本更低。Skywork-MoE 基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来,是首个完整将 MoE Upcycling 技术应用并落地的开
2

面壁智能刘知远:已经比较确信Llama3-V是对MiniCPM-Llama3-V 2.5套壳

36 氪获悉,针对“斯坦福 AI 团队被曝抄袭中国面壁开源模型”,面壁智能创始人刘知远在知乎平台回应称:已经比较确信 Llama3-V 是对我们 MiniCPM-Llama3-V 2.5 套壳,比较有意思的证据是 MiniCPM-Llama3-V 2.5 研发时内置了一个彩蛋,就是对清华简的识别能力
0

内部消息:Apple Vision Pro将于7月29日在法国推出

Apple Retail 泄露的内部公告显示,Apple Vision Pro 将于 2024 年 7 月 29 日在法国推出。 虽然苹果公司已经确认,Apple Vision Pro 将于 2024 年底之前在该国发布,但还没有正式宣布这款产品将在美国以外的任何地方发售。 根据 WatchGene
0

在WWDC上 苹果不会宣布任何新的硬件

彭博社的 Mark Gurman 预计,在 6 月 11 日的 WWDC 2024 主题演讲期间,苹果不会宣布任何新的硬件。 他在今天的 Power on 时事通讯中说:“WWDC 上不会发布硬件,除非苹果出人意料地在晚些时候发布一款新设备(明确地说:我并不指望会这样)。” 尽管此前有报道称,苹果计
0

经典机型告别:iPhone 5s被苹果列入停产产品名单

苹果公司今天对其过时和停产的产品清单进行了三个调整,涉及 iPhone 5s、第六代 iPod touch 和较旧的 iMac 机型。 首先,苹果现在认为 iPhone 5s 在全球范围内都是一款停产产品,这意味着苹果商店和苹果授权服务提供商不再为该设备提供维修或其他硬件服务。 苹果在 2013 年
0

苹果已悄悄地将M2 iPad Air的GPU核心数从10核改为9核

据悉,苹果已经悄悄地将 M2 iPad Air 的 GPU 核心数从 10 核改为 9 核,而 Metal Benchmark 测试表明 9 核规格是准确的。 在最初的新闻稿中,M2 iPad Air 最初宣布配备了 10 核 GPU。尚不清楚苹果何时修改了官网的信息,目前苹果官方新闻稿与部分地区官
1

智谱AI获中东财团4亿美元投资

据英国《金融时报》5 月 31 日援引两位知情人士的消息报道,中东石油巨头沙特阿美旗下风险投资部门管理的 Prosperity7 基金参与了对中国人工智能初创企业智谱 AI 约 4 亿美元的一轮投资。 《金融时报》表示:预计这笔投资将使智谱 AI 的估值达到约为 30 亿美元,此次投资也使得 Pro
2

京东健康旗下家医事业部被整体裁撤,刘强东“训话”后京东宣布涨薪

5 月 27 日,京东集团宣布,自 2024 年 7 月 1 日起,通过一年半时间,京东采销年度固定薪酬由 16 薪提升至 20 薪,业绩激励上不封顶。据了解,这是京东半年内第二次给一线采销人员涨薪。2023 年 12 月底,京东集团宣布,2024 年 1 月 1 日起京东采销等一线业务人员的年固定
0

小红书大举替换中高层高管,后台出现诸多 bug

据报道,2023 年,小红书在一场共创会议中明确了“坐一观三”的发展策略,向 3 亿 DAU 正式进发。为了拉平差距,小红书今年一季度在行业大举挖人,有大量中层以上管理者进入小红书,承担起小红书商业化产品、社区运营、电商产品、法务等重要岗位。 与此同时,多元的组织文化冲击了小红书的原有团队。内部互相
1

内卷加剧!拼多多上线自动跟价功能

5 月 29 日,拼多多正式上线了自动化价格追踪系统。此举意味着若竞争对手下调商品价格,而用户的商品价格尚显高价,平台将智能调整用户定价,使之与竞争对手保持同步甚至更具竞争优势。 值得注意的是,抖音电商此前刚刚宣布小规模内测“自动改价”功能,该功能支持商家委托平台根据市场情况,参考平台的建议价,在商
0

ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜

新智元报道 编辑:乔杨 LLM 有记忆能力吗?有,也没有。虽然 ChatGPT 聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。 Django 框架的创始人之一、著名开发者 Simon Willison 最近发表了一篇博客文章
0

AI视觉算法登柳叶刀!看CT提前10年预测致命心脏疾病,已进入临床使用

新智元报道 编辑:乔杨 最近,《柳叶刀》上的一篇医学文章发表了有关心血管疾病风险预测的里程碑式结果。之所以如此有影响力,是因为这项名为 CaRi-Heart 的技术结合了 AI 视觉识别和预测算法,可以在没有明显症状时提前 10 年识别出重大的心血管疾病风险。 英国一家名为 Caristo Diag
0

谷歌DeepMind:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了

新智元报道 编辑:Aeneas 好困 刚刚,谷歌 DeepMind、JHU、牛津等发布研究,证实 GPT-4 的心智理论已经完全达到成年人类水平,在更复杂的第 6 阶推理上,更是大幅超越人类!此前已经证实,GPT-4 比人类更能理解语言中的讽刺和暗示。在心智理论上,人类是彻底被 LLM 甩在后面了。
0

不想炸薯条的Ilya和不送GPU的英伟达,Hinton最新专访:道路千万条,安全第一条

新智元报道 编辑:alan 从谷歌离职一年之际,「人工智能教父」Hinton 接受了采访。半退休的 Hinton 向我们讲述了时光积累下来的智慧,以及那些年和徒弟 Ilya 在一起的日子。 从谷歌离职一年之际,「人工智能教父」Hinton 接受了采访。 ——也许是因为徒弟 Ilya 终于被从核设施中
0

AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解

新智元报道 编辑:alan AlphaFold3 的横空出世再次震撼了整个学术界,然而谷歌 DeepMind 的「不开源」引起学界不满,AlphaFold 服务器遭到黑客攻击,开源项目也开始发力。 不久前,AlphaFold3 横空出世,直接登上了 Nature 头版。 新的架构、前所未有的预测精度
0

首次解密Claude 3大脑!25岁Anthropic参谋长预言3年内自己将被AI淘汰

新智元报道 编辑:编辑部 Anthropic 的 25 岁参谋长自曝因为深感 AGI,未来三年自己的工作将被 AI 取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说,Claude 3 模型已经初现 AGI 了吗? 今天,整个 AI 社区被这篇文章刷屏了。 来自 AI 明星初创公司 An
0

next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+

新智元报道 编辑:LRS 研究人员提出了一种新的大型语言模型训练方法,通过一次性预测多个未来 tokens 来提高样本效率和模型性能,在代码和自然语言生成任务上均表现出显著优势,且不会增加训练时间,推理速度还能提升至三倍。 当前,大型语言模型,例如 GPT 和 Llama,主要是根据「前文的单词序列
0

LLM的「母语」是什么?

新智元报道 编辑:alan 在以英语为主的语料库上训练的多语言 LLM,是否使用英语作为内部语言?对此,来自 EPFL 的研究人员针对 Llama 2 家族进行了一系列实验。 大语言模型的「母语」是什么? 我们的第一反应很可能是:英语。 但事实果真如此吗?尤其是对于能够听说读写多种语言的 LLM 来
0

无需3D数据也能训练,港科&港中文联手华为推3D驾驶场景生成模型

允中发自凹非寺 量子位公众号 QbitAI 无需采集 3D 数据,也能训练出高质量的 3D 自动驾驶场景生成模型。 这是来自香港中文大学、香港科技大学和华为诺亚方舟实验室的最新研究成果——针对自动驾驶街景的可控 3D 场景生成方法“MagicDrive3D”。 此前,采用常见的 2D 自动驾驶数据集
0

ControlNet作者搞起大模型:让天下没有难写的生图提示词

梦晨西风发自凹非寺 量子位公众号 QbitAI ControlNet 作者新项目,居然也搞起大模型和 Agent 了。 当然还是和 AI 绘画相关:解决大伙不会写提示词的痛点。 现在只需一句超简单的提示词说明意图,Agent 就会自己开始“构图”: a funny cartoon batman fi
0

六位一线AI工程师总结爆火!大模型应用摸爬滚打一年心得公开

梦晨西风发自凹非寺 量子位公众号 QbitAI 六位一线 AI 工程师和创业者,把在大模型应用开发上摸爬滚打一整年的心得,全!分!享!了! (奇怪的六一儿童节大礼包出现了) 这篇干货长文,一时间成为开发者社区热议的话题。 有网友评价为,大模型领域少有的“有操作性”的实用见解,非常值得一读。 这 6
1

AI读论文新神器:多栏密集文字、中英图文混排文档都能读|旷视

Fox 团队投稿 量子位公众号 QbitAI 虽然多模态大模型都能挑西瓜了,但理解复杂文档方面还是差点意思。 面对文字密集、多栏混排等文档时往往力不从心,区域级别的细粒度理解,就更是无从谈起了。 最近,旷视团队打造了一支多模态大模型的“点读笔”——Fox,轻松实现对 8 页文档(中英混合,单栏多栏格
0

首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度

UrbanGPT 团队投稿 量子位公众号 QbitAI 时空预测技术,迎来 ChatGPT 时刻。 时空预测致力于捕捉城市生活的动态变化,并预测其未来走向,它不仅关注交通和人流的流动,还涵盖了犯罪趋势等多个维度。目前,深度时空预测技术在生成精确的时空模型方面,依赖于大量训练数据的支撑,这在城市数据不
0

无需2万的Vision Pro,1299玩转空间视频

克雷西发自三里屯 量子位公众号 QbitAI 只要一台“手机”,普通用户也能随时随地拍摄出 AR 大片了。 这个看似手机的设备,就是 AR 独角兽 XREAL 最新推出的空间计算终端 Beam Pro。 不同于传统的 3D 拍摄,用它拍 AR 视频,不用后期处理,立马就能看,效果是这样婶儿的: 而且
10

斯坦福团队被曝抄袭清华系面壁智能大模型,已删库跑路

金磊西风发自凹非寺 量子位公众号 QbitAI 家人们,大模型圈儿出了个惊天大瓜—— 斯坦福 AI 团队,竟然曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果——模型结构和代码,几乎一模一样!跟任何抄袭事故一样……AI 圈内都惊呆了。 斯坦福的这项研究叫做Llama3-V,是于 5 月 29 日新
0

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

西风发自凹非寺 量子位公众号 QbitAI 无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现,包括 GPT-4 在内的 10 个大模型,生成达到 128k 甚至 1M 上下文长度的都有。 但一番考验下来,在新指标“有效上下文”上缩水严重,能达到32K的都不多。 新基准名为RULER,包含检
0

ICML2024高分!魔改注意力,让小模型能打两倍大的模型

彩云科技团队投稿 量子位公众号 QbitAI 改进 Transformer 核心机制注意力,让小模型能打两倍大的模型! ICML 2024 高分论文,彩云科技团队构建 DCFormer 框架,替换 Transformer 核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA)。
0

小米 SU7 车机现身安兔兔:骁龙 8295 加持,流畅度位于第一梯队

6 月 3 日消息,安兔兔车机版今日曝光了小米 SU7 中控系统跑分,搭载了高通骁龙 8295 车规级智能座舱芯片,与之搭配的是 16GB(实际分配到 Android 系统 12GB)内存以及 128GB 存储。 据悉,本次上传到安兔兔车机版后台的跑分为 957833,达到了骁龙 8295 的主流水
1

加价3000炒相机,社交炫耀与饥饿营销的阳谋

来源 Tech 星球 文任雪芸 “一个卖家告诉我,现在伊拉克都得加价 300 美元”,最近计划出去旅行的小麦打算在 618 购入一台富士相机,并将型号瞄准了 XT30 二代。 在购买之前,她曾以为这是一天就能完成的事情。“没想到我从线上旗舰店找到了全城的线下经销商,从一手市场找到了二手市场,都没买到
0

摩托罗拉 moto X50 Ultra 柔和桃限定版手机开售,4699元

IT 之家 6 月 3 日消息,摩托摩拉 moto X50 Ultra 手机今日开售,该手机定位 AI 手机,搭载高通骁龙 8s Gen 3 处理器、联想小天 AI 个人智能体,售价 4699 元。 moto X50 Ultra 手机采用金属中框 + 实木 / 玻璃机身,厚 8.59mm ,重 19

新闻日历

新闻类别

昨日新闻阅读排行