0

大模型“取长补短”新思路入选NeurIPS'24,显著优于现有路由方法

RouterDC 团队投稿 量子位公众号 QbitAI 高效组合多个大模型“取长补短”新思路,被顶会 NeurIPS 2024 接收。 名为 RouterDC,是一种基于双重对比学习的路由架构,具有参数高效性(小于 100M 的参数)和计算高效性(不需要对于 LLM 进行梯度回传)的优势。 在具有挑
0

海外直播平台 Twitch 因数据泄露事故在土耳其被罚 200 万里拉

IT 之家 11 月 18 日消息,据土耳其官方通讯社 Anadolu Agency 当地时间本月 16 日报道,该国个人数据保护局 KVKK 因一起数据泄露事故对亚马逊旗下直播平台 Twitch 处以合计 200 万土耳其里拉(当前约合 42 万人民币)的罚款。 Anadolu Agency 表示
0

OpenAI 早有“造芯梦”:曾考虑收购晶圆级芯片企业 Cerebras

11 月 19 日消息,据外媒 TechCrunch 报道,马斯克与 OpenAI 法律诉讼中新增的证据文件显示,OpenAI 这家明星 AI 模型企业早在 2017 年左右就考虑过进入 AI 芯片业务。 在 2017 年 9 月一封写给马斯克与 OpenAI 首席执行官山姆・阿尔特曼(Sam Al
0

NeurIPS 2024高中赛道开卷!人大附中、北师大实验中学等摘得3篇Spotlight

新智元报道 编辑:静音好困 NeurIPS 2024 高中生论文录用结果公布!论文接受率仅为 6.4%,3 名国内学生杀出重围,斩获 Spotlight。 就在刚刚,NeurIPS 2024 首届高中论文录用结果公布了! 今年,NeurIPS 2024 首次设置了「高中生赛道」,直接将「学好 AI
0

AI一键解析九大生物医学成像模式,用户只需文字prompt交互

BiomedParse 团队投稿 量子位公众号 QbitAI 用 AI 大模型一键解析 MRI、CT 和病理学等九大生物医学成像模式。 不仅复杂、不规则形状对象能高精度识别: 而且通过对象识别阈值建模,模型能够检测无效的提示请求,并在图像中不存在指定对象时拒绝分割。 用户更是无需手动进行标注或边界框
0

英伟达与谷歌合作开发量子计算处理器

英伟达与谷歌 Quantum AI 部门宣布合作,利用 NVIDIA CUDA-Q 平台和 Eos 超级计算机,助力谷歌研究人员开发量子计算机的海量数字模型,以解决设计难题。 谷歌将使用英伟达的混合量子经典计算平台来模拟其量子处理器的物理特性,克服量子计算硬件的局限性,加速量子组件的开发。 这项合作
0

智子引擎开源多模态MoE大模型,可高效扩展模型容量

转载整理自智子引擎 量子位公众号 QbitAI 随着多模态大模型的快速发展,当前主流多模态大模型具备完成多种任务的能力(图文描述、视觉问答、文字识别、图标理解、目标检测等)。但是,这些不同的多模态任务往往具有完全不同的数据分布,导致在模型训练过程中遇到“多任务冲突”的问题,尤其在模型参数量较小时,这
> 返回新闻首页