文章插图
FAN 收集布局FAN 在 WIDER Face 上曾经连结了半年的 state-of-the-arts 。 因为仅仅验证方式的可行性,FAN 没有叠加任何 trick,只在原始的 RetinaNet 上调整锚点框,增添我们的 Spatial Attention,是以 FAN 还有很大的上升空间 。
文章插图
WIDER Face 验证集的 PR 曲线定位精度:2018 WIDER Challenge Face Detection
第三部门介绍一下旷视科技夺魁 WIDER Face and Pedestrian Challenge 2018 上的解决方案 。 2018 WIDER Challenge 有 3 个 track,旷视参战了此中的 Face Detection 。 更多信息请拜见:ECCV 2018 | 旷视科技夺获人工智能顶赛 Wider Challenge 人脸检测冠军 。
文章插图
2018 WIDER Challenge Face Detection 排名Face Detection 利用 WIDER Face 数据集原始图像,可是 Label 做了必然批改 。 据我们统计,Label 数目稍多于原数据集,导致在不合错误模子做任何更改的环境下,利用新 Label 也会比原 Label 涨点(更新:今朝 WIDER Face 官网上已经用 WIDER Challenge Label 笼盖原 Label,不再存在此问题) 。 此外,WIDER Challenge 数据集分歧于 WIDER Face 数据集的是,利用了不异于 MS COCO 的 Metrics,这意味着对模子的回归能力提出了更高的要求 。
旷视夺冠的方式仍然基于 RetinaNet 。 经由过程对比常见 Backbone,我们给出了以下表格的成果 。 可以发现,更强的 Backbone 并不料味着更好的 Detection 能力 。 一些 Backbone 分类能力更强,可是供给的特征或者分层特征并不敷好;感触感染野等对 Detection 至关主要的身分也不合适;对于二分类问题而言也存在过拟合现象 。 因为尝试周期等原因,我们最后简单选择了 ResNet-50 和 DenseNet-121 继续后面的尝试 。 需要声明的是,它们在良多环境下都不是最优 Backbone,我们有需要思虑何种 Backbone 提取的特征最适合做检测 。
文章插图
分歧 Backbone 的比力我们在 Backbone 上应用了 GAP trick,这在上篇知乎专栏(ycszen:语义朋分江湖的那些事儿——从旷视说起)有所介绍 。 该 trick 同样合用于 Detection 。 我们还利用了 Deformable Conv,但其进献本家儿如果扩大 ResNet 原本不高的感触感染野 。
对于 Head 部门,我们起首将 Smooth L1 Loss 换当作 IoU Loss,这是为赐顾帮衬数据中占比力多的小脸,但现实阐发一下可以发现,在锚点框合适的环境下,IoU Loss 的晋升会很细小 。 我们对 Head 的本家儿要改动是做一个简单的 Cascade 。 Cascade R-CNN[12] 是最早经由过程做 Cascade 晋升模子 Regression 能力的方式,我们但愿将其移植到单步检测器上 。
文章插图
Cascade R-CNN可以发现,具体做法部门借鉴了 SFace,即把前一个 Stage 的预练习鸿沟框与 ground truth 鸿沟框之间的 IoU 作为下一个 Stage 的 Classification Label;跟着 IoU 逐渐晋升,每个 Stage 的 IoU threshold 也逐渐增大,这与 Cascade R-CNN 很近似 。
文章插图
旷视利用的单步检测 Cascade 方案这个 Cascade 方案不难想到,也简单易行,可是简直涨点,Inference 时也只需保留最后一个 Stage,不会增添 Inference 当作本;这个方案也有本身的问题,最大的是每个 Stage 在共用统一个特征图,也共用不变的 anchor,对此已有一些相关论文提出改良,如[13, 14, 15] 。
推荐阅读
- 荨麻疹常见的发病原因有哪些?如何检测过敏原?
- 苹果新机发布!“人脸识别”新功能大揭秘!
- 58同城手机app如何进行人脸认证,详细教程
- 教你如何检测自家风水
- 茶人 茶道 茶江湖,孕妇能喝玫瑰花茶吗
- 微商大师检测僵尸粉怎么弄——下面为你讲解
- 华为手机怎样进行硬件检测
- 江湖传说卖煎饼赚得比工资多,那为啥你做不了这行?
- 钉钉开启人脸打卡后还能极速打卡吗
- Apex英雄检测到调试程序请关闭游戏重试解决办法