新闻首页 / “2023年07月28日”的新闻
0
0
北大校友论文获ICML时间检验奖,Hinton弟子一作,生成式AI受关注
萧箫发自凹非寺 量子位公众号 QbitAI ICML 2023 时间检验奖出炉! 今年和往年一样,也是一篇获奖论文和两篇亚军(Runners Up),均从 ICML 2023 的论文集中选出,“在过去 10 年里持续产生影响力”。 其中,获奖论文的第一作者是 Hinton 弟子 Richard Ze
0
国内团队提出全新RLTF框架,刷新SOTA!大模型生成代码质量更高bug更少
新智元报道 编辑:LRS 好困 最近,来自国内的研究团队提出了一种全新的 RLTF 技术,可以利用程序的单元测试反馈信号,无需基于人工的人类反馈(RLHF),来自动化提升 LLM 的代码生成能力。 「程序合成」或「代码生成」任务的目标是根据给定的描述生成可执行代码,最近有越来越多的研究采用强化学习(
0
训练14分钟,超越Alpaca!华人团队发布「飞天羊驼」,基于LLM的数据过滤新范式
新智元报道 编辑:好困 最近,来自马里兰、三星和南加大的研究人员提出了一种利用 LLM 自动识别和删除低质量数据的数据选择策略——AlpaGasus,不仅在测试中优于原始的 Alpaca,而且训练速度更快。 近期,指令微调(IFT)已经被作为预训练大语言模型(LLMs)获得指令遵循能力的关键训练阶段