成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能開發者 正文
    發私信給汪思穎
    發送

    0

    Facebook開源VoiceLoop,根據開放場景語音文字合成新語音

    本文作者: 汪思穎 2017-09-05 14:14
    導語:看Facebook最新開源語音合成方法

    雷鋒網 AI科技評論消息:Facebook研究員近日開源了他們在今年七月發表的一篇論文(Voice Synthesis for in-the-Wild Speakers via a Phonological Loop)中的語音合成方法。

    Facebook開源VoiceLoop,根據開放場景語音文字合成新語音

    在論文中,他們提出了一種新的文字轉語音的神經網絡方法,可以將從開放場景下采樣到的聲音中提取的文字轉化為語音。不同于其他的文字轉語音系統,這種方法能夠處理從公開演講中提取出來的非約束性的樣本,而且網絡架構比現存的解決同樣問題的架構要簡單。它基于新的移位緩沖內存儲器區(shifting buffer working memory),這個緩沖區也可以用于評估注意力,計算輸出音頻,以及自身的更新。

    Facebook開源VoiceLoop,根據開放場景語音文字合成新語音

    通過使用與上下文無關( context-free)的查找表對輸入語句進行編碼,該表的每個條目包含一個字符或音素。同樣,能通過一個短向量來表示說話者,這個短向量也適用于新說話者。而且在生成音頻之前,優先準備好緩沖區可以使生成的語音具有可變性。

    上圖為實驗樣例中生成的注意力圖,X 軸是輸出時間(聲學樣本),Y 軸是輸入(文本/音素)。

    代碼地址:https://github.com/facebookresearch/loop

    論文地址:https://arxiv.org/abs/1707.06588

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    Facebook開源VoiceLoop,根據開放場景語音文字合成新語音

    分享:

    編輯

    關注AI學術,例如論文
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說