2
| 本文作者: 亞萌 | 2017-02-16 17:39 |

雷鋒網按:谷歌博客今天比較忙,在發布 TensorFlow's 1.0這一重磅更新后,緊接著又發布了一條新聞:啟動一場基于YouTube-8M數據庫的視頻理解挑戰賽。挑戰賽提供了豐厚的獎金,并終將在今年的CVPR2017大會上進行展示。以下來自谷歌博客內容,由雷鋒網編譯整理。
去年9月,為了促進大規模視頻理解技術的創新和發展,我們發布了YouTube-8M數據庫,里面包含了數百萬的視頻,而且這些視頻都被分類貼上的數千種標簽。最近,谷歌其它團隊相繼發布了更多的數據庫,比如Open Images和YouTube-BoundingBoxes,與YouTube-8M數據庫一起,促進圖像和視頻理解技術的發展。為了促進這些目標,今天我們正式發布升級版的YouTube-8M,并與Google Cloud Machine Learning、 kaggle.com一起合作組織一場“視頻理解挑戰賽”和一場以此為主題的 CVPR’17 Workshop。
最新升級版的YouTube-8M包括更加清晰、詳細的標簽(平均每個視頻多兩倍的標簽)和一系列干凈的視頻。除了之前發布的視覺特征之外,數據庫首次包括了預先計算的音頻特征,這是基于最先進的音頻建模架構得來的。音視頻特征以1秒的時間粒度實時同步,這使得YouTube-8M成為了一個大型多模態的數據庫,為聯合音視(臨時的)建模提供了令人欣喜的機會。新版本的關鍵數據如下所示。

升級版YouTube-8M數據庫的可視化樹狀圖。按照24個垂直行業組織起來,包括前200個最常用的實體和每一個垂直領域最常用的5個實體。

樣本視頻,來自YouTube-8M數據庫里前18個高等級的垂直領域
我們很高興地宣布“谷歌云和YouTube-8M視頻理解挑戰賽”(Google Cloud & YouTube-8M Video Understanding Challenge)正式啟動,這次挑戰賽與谷歌云和kaggle.com一起合辦。挑戰賽參與者需要在使用YouTube-8M作為訓練數據庫的基礎上,建造音視頻內容分類模型,然后給大約70萬未見過的測試視頻貼上標簽。這個比賽將由Google Cloud贊助,優勝者們將獲得10萬美元的獎金(第一名獎金3萬美元,后四名分別為2.5萬、2萬、1.5萬和1萬美元)。為了讓這個比賽有更廣泛的參與度,Google Cloud也會提供一些使用優惠,參與者可以自由選擇是否使用Google Cloud機器學習來訓練模型和進行探索。 開源的TensorFlow代碼、執行的一些基線分類模型、訓練和評估腳本,如今在Github上都可以獲得了(https://github.com/google/youtube-8m/)。基于本地或云端的訓練,請看這個說明(https://github.com/google/youtube-8m/blob/master/README.md)和指南(https://www.kaggle.com/c/youtube8m#getting-started-with-google-cloud)
2017年7月,第30屆IEEE計算機視覺與模式識別大會(CVPR 2017)將在夏威夷舉行,2017年7月26日,我們將在第一屆YouTube-8M Workshop上宣布此次挑戰賽的結果,并且也會舉辦由杰出研究員參加的特邀報告。Workshop上,將會對挑戰賽表現優異者成果和一些論文進行展示。我們在此邀請研究人員們提交基于YouTube-8M所做的創新研究、實驗和應用論文,也包括與上述挑戰賽相關的論文。
我們設計這個數據庫的時候,就考慮到規模和多元性,希望從中學到的教訓可以推廣到很多視頻域(YouTube-8M捕捉了超過20中多樣的視頻域)。我們相信,這次挑戰賽可以給研究者提供更大的數據或計算集群,以前所未有的規模去探索和創新,從而促進研究的進步。
Via Googleblog
更多雷鋒網相關文章:
谷歌工程師懟上Yann LeCun:你對Google Brain的評價完全是錯的
德州撲克算法幕后研發者CMU博士Brown專訪:AI如何打敗頂級人類牌手?
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。