0
0
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
henry 发自凹非寺 量子位 | 公众号 QbitAI 英伟达还能“猖狂”多久?——不出三年! 实现 AGI 需要新的架构吗?——不用,Transformer 足矣! “近几年推理成本下降了 100 倍,未来还有望再降低 10 倍!” 这些“暴论”,出自Flash Attention的作者——Tr
> 返回新闻首页