新闻首页 / “2023年08月25日”的新闻
0
0
推理1760亿参数的BLOOMZ,性能时延仅3.7秒 | 最“in”大模型
编者按: 本文作者是 Hugging Face 的机器学习工程师 Régis Pierrard,并于 2023 年 3 月 28 日发布于 Hugging Face Blog[1]。感谢 Régis Pierrard 授权我们翻译和转发本文。 本文介绍了如何在 Habana® Gaudi®2[2]上
0
32k上下文可商用!羊驼进化成长颈鹿,“开源大模型之最”
丰色发自凹非寺 量子位公众号 QbitAI 号称“世界首个上下文长度达 32k 的开源可商用大模型”来了。 名字“简单粗暴”,就叫“长颈鹿”(Giraffe),基于 130 亿规模的 Llama-2 打造。 如作者所言,原始的 Llama-2 和 Llama-1 都只有 4k 上下文,很难真正在企业
0
中国科学技术大学联手新加坡管理大学,推出图像生成模型CgT-GAN
据 Arxiv 页面显示,中国科学技术大学近日联手新加坡管理大学发布一款图像生成模型 CgT-Gan。 CgT-GAN 通过将图像纳入训练过程,使模型能够“看到”真实的视觉模态。具体来说,研究团队采用对抗训练来教导 CgT-GAN 模型模仿外部文本语料库的短语,同时利用基于 CLIP 的奖励机制提供