0
0
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑基准
RISEBench 团队投稿 量子位 | 公众号 QbitAI GPT-4o-Image 也只能完成 28.9% 的任务,图像编辑评测新基准来了! 360 个全部由人类专家仔细思考并校对的高质量测试案例,暴露多模态模型在结合推理能力进行图像编辑时的短板。 最近,上海人工智能实验室联手上海交大、同济大