新闻首页 / “2023年06月08日”的新闻
0
0
LeCun力挺,马毅教授五年集大成之作:完全数学可解释的白盒Transformer,性能不输ViT
新智元报道 编辑:LRS 马毅教授领导的研究团队开发了 CRATE 模型,推动了神经网络可解释研究! 过去十多年,AI 的飞速发展主要是工程实践上的进步,AI 理论并没有起到指导算法开发的作用,经验设计的神经网络依然是一个黑盒。 而随着 ChatGPT 的爆火,AI 的能力也被不断夸大、炒作,甚至到
0
一文解决所有「语言模型」疑问:能不能训多个epoch?怎么微调效率高?需要多少条数据?
新智元报道 编辑:LRS 关于语言模型,你的问题可能已经有了答案。 过去几个月里,Meta 的 LLaMA 引领了一场语言模型的开源狂潮,并且随着大众对语言模型训练研究的深入,很多问题也都有了答案。 比如需要人类反馈和强化学习来对齐语言模型吗?语言模型在 ChatGPT 模拟数据上的效果怎么样?是否