依托可信AI技術螞蟻安全實驗室斬獲NeurIPS & Facebook AI聯合競賽冠軍

本文作者：木子

2021-12-16 14:29

導語：降低80%的圖像對抗風險螞蟻集團升級基于可信AI技術的內容安全解決方案

12月10日，由國際人工智能頂會NeurIPS 與 Facebook AI聯合舉辦的圖像相似匹配競賽ISC2021落下帷幕。本次比賽共有1635支參賽隊伍參加，是今年NeurIPS會議上最具影響力的比賽之一。來自螞蟻集團的TitanShield Team（titanshield2）以超越第二名10個百分點的成績斬獲圖像表征賽道冠軍。據悉，此次奪冠團隊采用的技術方案是由螞蟻集團獨立自研的、“基于特征兼容自監督學習框架”的預訓練模型，能夠針對性地解決內容安全風控領域常見的敏感信息更迭速度快、風控模型訓練不及時等問題。作為可信AI技術研究及應用中的一環，該技術上線后可降低80%的圖像對抗風險，將有助于極大地提升在內容安全等相關應用領域中的AI魯棒性（Robustness）。

ISC2021圖像表征賽道成績排行榜

魯棒性：人工智能的第一場大考

作為人工智能下一階段快速發展的瓶頸所在，安全和可信性決定了人工智能未來三十年的發展速度和應用深度；而AI的魯棒性，即抗打擊能力及穩定性，則成為了人工智能的第一場大考。以圖片識別領域為例，無人駕駛車輛上加載的圖像識別模型可能因為圖像識別錯誤，而釀成車禍；版權保護場景下，盜版商通過圖片的變形，試圖繞開反盜版模型的審查；內容安全場景中，將涉毒涉黃信息隱匿在看似合法的圖片中，更是黑產團伙獲利的慣用伎倆。“如果抵擋不住攻擊，識別結果不可信，那么AI模型不僅失去了它存在的意義，還會成為另一個風險敞口”，螞蟻集團資深技術專家博山在采訪中強調。

可信AI：做內容安全戰場的定海神針

一直以來，敏感信息復雜多變，模型訓練樣本不足，是各家企業內容安全風控的核心痛點。例如，新增的劣跡藝人、潮流商品的版權圖片，AI不僅無法預判其出現的趨勢，還需要在其出現后快速做出風控響應；而在兒童軟色情等問題場景下，由于模型訓練樣本不足，如何讓AI實現有效風控成為難題。不僅如此，在全行業分工協作程度不斷加深的今天，各類企業、商戶組成了龐大的生態服務鏈。任一薄弱環節，都可能成為黑產的突破口，對企業自身及關聯企業帶來巨大的負面影響。但由于訓練樣本的敏感性等，如何實現聯合風控，成為行業共同面臨的困境。

而此次比賽中，奪冠團隊所采用的“基于特征兼容自監督學習框架”的預訓練模型，在圖像識別領域，極大地緩解和應對了上述問題。首先，該技術能夠基于公開數據集進行預訓練，幫助AI提前完成同類風險預演。其次，在傳統的AI識別中，模型識別依賴人工投喂標注了“特征”的樣本；例如，模型在識別熊貓圖片前，需要先“學習”熊貓的特征——“眼部有黑色毛發”、“常與竹子一同出現”等等。而借助“自監督學習”技術，該模型可以通過自主學習抓取“特征”，降低70%標注量，訓練時間也從原本的一周縮短至3天。同時，創新的“特征兼容”方案，能夠實現在兩個業務場景或兩家企業間，借助“特征”信息的兼容共享，實現風險聯防。

據悉，該模型及相關技術作為螞蟻集團內容安全風控決策引擎的重要組成部分，目前已在支付寶內容安全場景中全面上線，可整體降低80%的圖像對抗風險。

雷峰網(公眾號：雷峰網)

雷峰網版權文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏