當前位置:首頁 > 新聞中心 > 科研動態

科研動態

华阳彩票取得人臉識別新突破:真實場景下的大規模雙樣本學習方法

  • 发表日期:2019-03-07 【 【打印】【關閉】
  •   近些年得益于網絡架構、訓練策略以及人臉數據的發展,人臉識別技術取得了巨大的提升,越來越多的被推廣到安防領域,延伸出考勤機、門禁機等多種産品,産品系列達20多種類型,可以全面覆蓋煤礦、樓宇、銀行、軍隊、社會福利保障、電子商務及安全防務等領域,人臉識別的全面應用時代已經到來。 

      然而,現有方法主要關注自然環境下的人臉識別,其訓練數據大都從網絡上收集而來,一般只包含中等量級的人數(約10萬人),但每類平均樣本數很多(多于20個)。然而,實際應用中的人臉識別系統通常只能獲取2張圖像,一張證件照,一張現場照。同時,系統需要面對的人臉個體數量可達到上百萬甚至是千萬級。因此,實際中人臉數據庫通常具有海量類別,但每類只有2個樣本,一般被稱之爲大規模雙樣本問題。 

      現有方法在訓練這種數據時會遇到巨大的挑戰,例如類內變化不足使得訓練難以收斂以及海量樣本數對計算設備的極端要求。爲此,华阳彩票針對真實場景下的人證核驗問題,提出了基于深度學習的大規模雙樣本學習方法,解決了雙樣本數據帶來的類內變化不足問題和海量樣本數計算壓力大的問題。 

       目前,深度學習在人臉識別界具有統治地位,基于分類的訓練方法是主流,其將每個人當作獨立的類別,並使用softmax進行分類訓練。近兩年SphereFace,CosFace以及InsightFace進一步引入了邊界裕量(margin)來提高識別網絡的可擴展性,在公開測試集上取得了領先性能。然而,softmax的計算消耗與類別數直接相關。在實際應用中,百萬類甚至千萬類的分類會對訓練平台産生極大壓力,普通訓練平台(如8卡TITANX)甚至無法訓練,給主流方法的應用帶來了困難。 

      华阳彩票朱翔昱、雷震等研究人員提出的大規模雙樣本學習方法包括兩個方面,一是提出了一種分類-驗證-分類(CVC)的訓練策略來逐步提高實際場景中的性能,二是針對大規模分類問題提出了DP-softmax使得深度學習在超大規模類別的分類上具有可擴展性。 

      在分類-驗證-分類(CVC)訓練策略中,研究人員將整個訓練過程分爲三個階段。第一個階段爲Pre-learning(Classification),首先在網圖人臉數據庫上訓練一個深度神經網絡模型,以得到一個較好的初始人臉識別性能。第二阶段为Transfer Learning (Verification),使用基于度量学习的人脸验证方法如triplet loss在大规模双样本数据上进行微调,将人脸知识从自然环境迁移到人证场景下。第三阶段为Fine-grained Learning (Classification),構建了一個特殊的分類層DP-softmax對百萬級類別進行分類,最終達到人證場景下的最優性能。 

      DP-softmax極大降低了大規模分類的計算需求,首先通過CVC策略中第二階段的模型對訓練數據抽取特征並構建每個類別的類別模板(prototype),生成所有類別的類別模板庫。在訓練過程中,針對當前mini-batch中的樣本選擇與他們最相似的少量類別模板構建臨時分類層來完成本次的分類訓練。整個過程可以在不影響訓練效果的前提下,極大降低大規模分類的計算需求。研究人員對提出的方法進行了充分的實驗,表明在IvS場景下,本方法相比現有方法有了明顯提升。 

    論文鏈接