0
0
机器人感知大升级!轻量化注入几何先验,成功率提升31%
Evo-0 团队投稿 量子位 | 公众号 QbitAI 在机器人学习领域,如何让 AI 真正“看懂”三维世界一直是个难题。 VLA 模型通常建立在预训练视觉语言模型(VLM)之上,仅基于 2D 图像-文本数据训练,缺乏真实世界操作所需的 3D 空间理解能力。 当前基于显式深度输入的增强方案虽有效,但
0
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
henry 发自凹非寺 量子位 | 公众号 QbitAI 英伟达还能“猖狂”多久?——不出三年! 实现 AGI 需要新的架构吗?——不用,Transformer 足矣! “近几年推理成本下降了 100 倍,未来还有望再降低 10 倍!” 这些“暴论”,出自Flash Attention的作者——Tr