本文共 617 字,大约阅读时间需要 2 分钟。
商汤开源方法利用无标注数据显著提升人脸识别精度
近日,一篇来自微信公众号“我爱计算机视觉”的论文引发广泛关注。该文提出了一种创新的人脸识别方法,能够在仅使用少量标注数据的情况下,通过构建伪正样本对来显著提升模型性能。
文章主要解决以下问题:已标注的人脸数据虽然质量高,但其数量相对有限;而大量未标注数据虽然可用性强,但直接使用难以保证标注准确性。作者提出了一种基于共识驱动传播的模型,通过分析未标注数据中的同一人多张面部图像关系,构建伪正样本对。
核心思想在于:通过多个深度学习模型的特征提取,构建未标注样本的K邻域图(KNN图),并利用KNN图中节点之间的关系信息,自动标注伪正样本。具体而言,作者设计了一个包含基模型、委员模型和调解员模型的框架,通过多个视图的特征融合,识别同一人多张面部图像的关系。
实验结果表明,该方法在MageFace和IJB-A数据集上的性能均有显著提升。在MageFace数据集上,仅使用十一分之一标注数据时,模型精度可达78.18%,甚至接近全监督方法的78.52%表现。更令人惊讶的是,在IJB-A上,该方法的效果甚至超越了传统全监督方法,证明其在复杂场景下的强大适用性。
值得注意的是,该方法不仅适用于人脸识别任务,在其他分类问题中也具有广泛的应用价值。其核心优势在于低成本扩展数据集能力,能够有效缓解数据标注难题。
总体而言,这项研究为人脸识别领域带来了重要突破,其创新点和实用价值具有长远意义。
转载地址:http://ysyk.baihongyu.com/