0
0
用两个简单模块实现双重SOTA!华科大白翔团队等推出多模态新框架
LIRA 团队投稿量子位 | 公众号 QbitAI 多模态大模型需要干的活,已经从最初的文生图,扩展到了像素级任务(图像分割)。 不过,无论是 OMG-LLaVA,还是提出了 embedding-as-mask 范式的 LISA(CVPR 2024),都还存在分割结果不够精确,以及理解过程中出现幻觉
> 返回新闻首页