成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給彭鵬
    發送

    0

    快9倍!Facebook開源機器學習翻譯項目fairseq

    本文作者: 彭鵬 編輯:郭奕欣 2017-05-10 20:28
    導語:日前,FaceBook的人工智能實驗室宣布了其在翻譯任務上所取得的突破性成果。研究表明:利用CNN比傳統的RNN方法速度快了9倍。

    Facebook的使命是讓世界變得更加開放,讓每個人都能以最高的準確性和最快的速度使用自己喜歡的語言來發帖子和視頻進行互動,語言翻譯對此十分重要。

    雷鋒網了解到,今天,Facebook的人工智能研究團隊發表了他們的研究成果Fairseq,他們使用了一種新型的卷積神經網絡來做語言翻譯,比循環神經網絡的速度快了9倍,而且準確性也是現有模型中最高的。此外,FAIR序列建模工具包的源代碼和訓練好的系統都已經在開源平臺GitHub上公布,其他的研究者可以在此基礎上建立自己的關于翻譯、文本總結和其他任務的模型。

    為什么選擇卷積神經網絡?

    卷積神經網絡在數十年前由Yann Lecun 提出,已經在諸如圖像處理之類的領域取得了成功。 循環神經網絡卻是文本領域的現有技術,并且由于其極高的效率而成為語言翻譯的首選。

    盡管循環神經網絡以前在語言翻譯上比卷積神經網絡表現的更好。但是其設計具有固有的局限性,這可以通過它們怎么處理信息來理解。計算機一句一句地來翻譯一個文本然后去預測另外一種語言具有相同意思的單詞序列。循環神經網絡以嚴格的從左到右或者從右到左的來進行運算,一次處理一個單詞。這和現在高度并行的GPU硬件有點不符合。由于單詞只能一個接著一個進行處理,計算不能完全并行。而卷積神經網絡可以同時計算所有的元素,充分利用了GPU的并行性。CNN的另一個優點是它對信息進行分層處理,這讓它可以更容易獲得數據之間的復雜關系。

    雷鋒網獲悉,在先前的研究中,卷積神經網絡在翻譯任務上的表現要差于循環神經網絡。然而,由于卷積神經網絡架構上的潛力,FAIR開始了研究,發現所設計的翻譯模型顯示了CNN在翻譯方面的優異性能。CNN優異的計算性能將有可能會擴展可翻譯的語言,將包括全球的6500種語言。

    最快最好的結果

    Facebook團隊的結果表明,在廣泛應用的標準測試數據集(WMT會議提供)上,其比RNN表現的更好。尤其是卷積神經網絡比先前在WMT發表的結果都要好。在英語-法語任務上提高了1.5 BLEU,在英語-德語任務上提高了0.5BLEU,在WMT2016的英語-羅馬尼亞語任務上,提高了1.8BLEU。

    對神經機器學習實際應用考慮的一個方面在于翻譯一個句子所需要的時間。 FAIR的卷積神經網絡模型計算的相當快速,比循環神經網絡快樂整整9倍。許多研究都通過量化權重或者其他的方法的方法來加速神經網絡,這也同樣可以用于卷積神經網絡。

    用多跳注意和門控來獲得更好的翻譯效果

    團隊的架構一個重要的部分就是多跳注意。注意力的機制類似于一個人在翻譯句子的時候會把句子分開翻譯,而不是僅僅看一次句子然后就直接寫下完整的翻譯。所設計的網絡會重復地掃描句子來決定它將要翻譯的下一個單詞。多跳注意是這種機制的加強版,它讓網絡更多次地掃描句子來產生更加好的結果。每一次掃描之間都相互影響。舉一個例子,第一次掃描會注意到一個動詞,然后第二次掃描會注意到相關聯的助動詞。

    在下面這幅圖中,Facebook團隊展示了一個系統是怎么閱讀一個法語短語然后再翻譯成英語的。首先,用卷積神經網絡來生成每一個法語單詞的對應向量,在此同時進行計算。然后解碼的CNN再生成對應的英語單詞。在每一步,都掃描一下法語單詞來看一下哪些詞語與下一個要翻譯的英文單詞關系最為密切。在解碼器中有兩層,下面的動畫說明了每一層的注意力機制是怎么完成的。綠線的強度表現了網絡對每一個法語單詞的注意力。當網絡訓練好之后,也就可以進行翻譯了,英文單詞的計算也可以同時進行。

    快9倍!Facebook開源機器學習翻譯項目fairseq

    系統的另一個方面是門控,其控制神經網絡里面的信息流。在每個神經網絡中,信息都流過所謂的隱藏單元。的門控機制精確的控制了傳向下一個單元的信息,一個好的翻譯才因此產生。例如,當預測下一個單詞的時候,網絡會把它前面的翻譯部分考慮進去。門控允許它在翻譯的一個特定方向進行放大—這一切都取決于網絡認為其在上下文中認為合不合適。

    以后的發展

    這一種方法是機器翻譯的一種替代框架,也給其它的文本處理任務提供了新的思路。例如,多跳機制在對話系統中允許網絡注意對話的不同部分。例如對兩個沒有聯系的事實,可以把它們聯系在一起來更好地回答復雜的問題。

    via code.facebook,雷鋒網編譯

    AI科技評論招業界記者啦!

    在這里,你可以密切關注海外會議的大牛演講;可以采訪國內巨頭實驗室的技術專家;對人工智能的動態了如指掌;更能深入剖析AI前沿的技術與未來!

    如果你:

    *對人工智能有一定的興趣或了解

     * 求知欲強,具備強大的學習能力

     * 有AI業界報道或者媒體經驗優先

    簡歷投遞:

    lizongren@leiphone.com

    雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

    快9倍!Facebook開源機器學習翻譯項目fairseq

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說