0
0
大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
明敏发自凹非寺 量子位公众号 QbitAI 用扩散模型替代自回归,大模型的逆诅咒有解了! 人大高瓴人工智能研究院、蚂蚁共同提出 LLaDA(a Large Language Diffusion with mAsking)。 LLaDA-8B 在上下文学习方面与 LLaMA3-8B 能力相当,而且在反
> 返回新闻首页