实验室陈鹏飞同学提交的论文《P2Object: Single Point Supervised Object Detection and Instance Segmentation》近日被国际顶尖学术期刊 IJCV 录用。最近几年,基于单点监督的目标识别方法受到了越来越多的关注。然而,与全监督算法相比,其性能仍存在较大差距。本文提出了点到框网络(P2BNet),该网络通过类似锚框的方式生成提议框,并采用由粗到细的范式对提议框进行优化。进一步研究发现无论是图像级还是实例级的提议框集合,都是基于离散的边界框采样建立的。这使得伪边界框估计陷入次优解,导致目标边界被截断或背景被过度包含。因此,我们对从离散到连续的优化进行了一系列探索,由此产生了 P2BNet++ 和点到掩码网络(P2MNet)。P2BNet++ 通过更好地利用空间线索,实施了一种近似连续的提议框采样策略。P2MNet 进一步引入低级图像信息来辅助像素预测,并设计了边界自预测机制以缓解估计边界框的局限性。得益于连续的目标感知像素级感知能力,P2MNet 能够生成更精确的边界框,并可推广到分割任务中。在多个数据集上,我们的方法大幅超越了以往的方法,显示出其在缩小与全监督任务性能差距方面的巨大潜力。 Vision Group@UCAS成立于2019年,是一支专注于机器学习、图像和视频处理及计算机视觉等领域的研究团队,尤其专注于基于点标注与多源信息融合的弱小目标感知。实验室承担了多个重要项目,包括国家自然科学基金项目、航天科工及华为公司等单位课题,致力于推动计算机视觉技术的创新与发展。
@
2021 .