实验室韩许盟同学提交的论文Boosting Segment Anything Model Towards Open-Vocabulary Learning近日被国际顶尖学术会议AAAI 2025录用。
最近的 Segment Anything 模型 (SAM) 已成为一种新的典型视觉基础模型,展示了强大的零样本泛化性。尽管 SAM 在各个领域都有应用和适应性,但其主要限制在于无法掌握对象语义。 在该研究中,韩许盟同学提出了一个新颖的框架Sambor,其在保留 SAM所有强大能力的同时,能够根据任意类别名称来检测出相应的目标。 Sambor在包括 COCO 和 LVIS 在内的基准测试中表现出卓越的零样本性能,与之前最先进的方法相比具有很强的竞争力。 Vision Group@UCAS成立于2019年,是一支专注于机器学习、图像和视频处理及计算机视觉等领域的研究团队,尤其专注于基于点标注与多源信息融合的弱小目标感知。实验室承担了多个重要项目,包括国家自然科学基金项目、航天科工及华为公司等单位课题,致力于推动计算机视觉技术的创新与发展。
@
2021 .