3
0
啊?7B的DeepSeek反超R1满血版,上海AI Lab周伯文团队新成果
梦晨发自凹非寺 量子位公众号 QbitAI 倒反天罡了,新方法让 DeepSeek 蒸馏的 Qwen 数学能力反超 R1 满血版,7B 反超 671B。 除此之外,0.5B 模型超过 GPT-4o,1.5B 的 DeepSeek 蒸馏 Qwen 超过 o1-mini 和 o1-preview,3B
> 返回新闻首页