国科大视觉实验室

Vision Group一篇论文被ACM MM 2025录用

近日，实验室强辰辉同学的论文《VER-Bench: Evaluating MLLMs on Reasoning with Fine-Grained Visual Evidence》被计算机多媒体领域CCF A类顶级会议ACM MM 2025录用。该研究针对当前多模态大模型（MLLM）评测中普遍忽略对细微视觉线索进行深度推理的不足，提出了一个全新的评测框架VER-Bench。它通过一系列精心设计的任务，专门评估模型从图像中识别微小证据（平均仅占图像面积的0.25%）并以此为基础进行复杂推理的能力。该工作不仅揭示了现有模型的局限性，也为推动MLLM具备更精细、更可靠的类人视觉分析能力指明了方向。

Vision Group@UCAS成立于2019年，是一支专注于机器学习、图像和视频处理及计算机视觉等领域的研究团队，尤其专注于基于点标注与多源信息融合的弱小目标感知。实验室承担了多个重要项目，包括国家自然科学基金项目、航天科工及华为公司等单位课题，致力于推动计算机视觉技术的创新与发展。