人脸检测江湖的那些事儿

图片:teguhjatipras / CC0

人脸检测江湖的那些事儿

文章插图
人脸检测江湖的那些事儿

文章插图
王剑锋 , 人类的悲欢并不相通 。 题外话
这是 Face++ Detection Team(R4D)第 3 篇知乎专栏 。 若是说该专栏的定位是双标的目的交流 , 一个比力贴切的词可能是「窗口」:一方面 , 我们但愿从论文的出产、研究员的当作长甚至公司的文化空气等多方面被领会 , 被熟悉 , 被熟悉 , 但愿联袂配合见证最优检测算法的研究、立异与落地 , 冲破认知鸿沟 , 实现降本增效 , 为客户和社会缔造最大价值;另一方面 , 我们也但愿领会读者的设法 , 增添与读者的互动 , 形当作双标的目的反馈的正标的目的沟通机制 。 R4D 后续也会组织线下勾当 , 加大加深彼此交流 。 若是你感乐趣 , 或者想插手 , 接待联系 Face++ Detection Team 负责人俞刚 (yugang@megvii.com) 。
本次分享的本家儿题是人脸检测(Face Detection) , 分享者是旷视科技王剑锋 , 来自 Face++ Detection 组 。 经由过程这篇文章 , 可以一窥旷视近两年在该偏向的工作与思虑 , 并但愿为计较机视觉社区带来开导 , 进一步鞭策人脸检测手艺的研究与落地 。 人脸检测是人脸识此外第一站 , 旷视的尽力本家儿要表现在紧紧环绕人脸检测范畴顽固而焦点的问题睁开 , 攻坚克难 , 功夫花在刀刃上 , 好比人脸标准的变更及遮挡等 , 实现速度与精度的双重涨点 。
媒介
人脸检测的目标是 , 给定肆意图像 , 返回此中每张人脸的鸿沟框(Bounding Box)坐标 , 现实操作上它对通用物体检测(General Object Detection)有较多借鉴 , 是通用物体检测手艺的聚焦和细分 。 因为人脸检测是所有人脸阐发算法的前置使命 , 诸如人脸对齐、人脸建模、人脸识别、人脸验证 / 认证、头部姿态跟踪、面部脸色跟踪 / 识别、性别 / 春秋识别等等手艺皆以人脸检测为先导 , 它的黑白直接影响着人脸阐发的手艺走标的目的和落地 , 因而在学术界和工业界引起普遍的正视和投入 。
现在 , 跟着深度进修普及 , 人脸检测与通用物体检测已相差无几 , 作为二分类使命 , 其难度也低于通用物体检测 , 是以现阶段人脸检测研究更需走差别化路线 , 从现实应用中罗致营养 。
标准转变是人脸检测分歧于通用物体检测的一大问题 。 通用物体的标准转变规模一般在十几倍之内;与之比拟 , 人脸的标准转变规模因为摄像头不竭进级 , 在 4K 甚至更高分辩率场景中可达数十倍甚至上百倍 。 面临这一问题 , [1, 2] 给出的谜底是寻找最优标准多次采样原图 , 其素质是优化图像金字塔(Image Pyramid);[3, 4] 则操纵分歧深度的特征图顺应分歧标准的人脸 , 其素质是优化特征金子塔(Feature Pyramid);而旷视自立研创的 SFace 方式试着从完全分歧的角度切入这一问题 。 这是本文第一部门 。
【人脸检测江湖的那些事儿】和标准转变一样 , 遮挡也是人脸检测面对的常见挑战之一 。 现实场景中的眼镜、口罩、衣帽、头盔、首饰以及肢体等皆会遮挡人脸 , 拉低人脸检测的精度 。 对此 , [5, 6] 测验考试晋升神经收集顺应遮挡环境的能力 , [7] 则将问题转化为遮挡与非遮挡人脸在标的目的量空间中的距离这一怀抱进修问题 。 此外 , 良多深度进修方式练习时辅用的数据加强手艺也在必然水平上提高了收集对遮挡景象的鲁棒性;而旷视原创的全新算法 FAN 也是针对人脸遮挡问题而提出 。 这是本文第二部门 。
如上所述 , 人脸检测是人脸关头点、人脸识别等的前置使命 , 人脸检测框质量直接影响着整条 Pipeline 的表示 , 常见人脸检测数据集的评测指标对鸿沟框质量缺乏存眷;2018 WIDER Challenge Face Detection 初次采用不异于 MS COCO 的评测体例 , 表白这一状况已有大幅改善;本文第三部门则将介绍此次角逐夺冠的一些诀窍 。

推荐阅读