近日,实验室强辰辉同学的论文《VER-Bench: Evaluating MLLMs on Reasoning with Fine-Grained Visual Evidence》被计算机多媒体领域CCF A类顶级会议ACM MM 2025录用。该研究针对当前多模态大模型(MLLM)评测中普遍忽略对细微视觉线索进行深度推理的不足,提出了一个全新的评测框架VER-Bench。它通过一系列精心设计的任务,专门评估模型从图像中识别微小证据(平均仅占图像面积的0.25%)并以此为基础进行复杂推理的能力。该工作不仅揭示了现有模型的局限性,也为推动MLLM具备更精细、更可靠的类人视觉分析能力指明了方向。 Vision Group@UCAS成立于2019年,是一支专注于机器学习、图像和视频处理及计算机视觉等领域的研究团队,尤其专注于基于点标注与多源信息融合的弱小目标感知。实验室承担了多个重要项目,包括国家自然科学基金项目、航天科工及华为公司等单位课题,致力于推动计算机视觉技术的创新与发展。
@
2021 .