成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業界 正文
    發私信給Nemo
    發送

    0

    阿里云百煉上線音視頻實時互動功能,人人都能創建專屬多模態應用

    本文作者: Nemo   2024-12-19 16:08
    導語:阿里云百煉還支持以sdk的形式集成到Web、ioS和安卓應用,可應用于AI虛擬助手、虛擬陪伴和AI老師等場景。

    近日,阿里云百煉上線了全新音視頻實時互動功能,用戶可在百煉上自由選擇文本、語音和視覺理解等200多款模型,無需代碼,數分鐘即可搭建一個能聽、能看、會說的專屬AI助手。阿里云百煉還支持以sdk的形式集成到Web、ioS和安卓應用,可應用于AI虛擬助手、虛擬陪伴和AI老師等場景。

     

    阿里云百煉上線音視頻實時互動功能,人人都能創建專屬多模態應用

    用戶在百煉上幾分鐘即可搭建一個能聽、能看、會說的專屬AI助手

     

    過去一年,大模型正在從純文本模態向語音和視覺等多模態演進,極大地拓寬了大模型應用的想象空間。然而現有單一模型仍舊無法處理復雜的任務,為了進一步加速單一大模型構建成像人一樣自然交互的復雜AI應用,阿里云百煉提供了200多款語言模型Qwen、視覺語言模型Qwen2-VL、語音合成模型CosyVoice等全模態全尺寸大模型,同時聯合阿里云AI實時互動方案,在國內率先為用戶提供了便捷的工作流應用和智能體編排應用,例如支持構建RAG知識庫、Prompt調優、sdk集成等。

     

    據介紹,在視覺理解模型方面,阿里云Qwen2-VL具備強大的視覺智能體能力,例如采用多模態旋轉位置嵌入(M-ROPE)方法,能夠同時捕捉和整合一維文本序列、二維視覺圖像以及三維視頻的位置信息,模型具備更好地理解和建模復雜的多模態數據,該模型一經推出就成為開源社區最受歡迎的多模態大模型;在音頻方面,阿里云語音合成模型CosyVoice,通過對生成語音的情感、韻律進行細粒度的控制,情感表現力上得到明顯提升,阿里云AI實時互動方案還可提供化智能降噪、智能打斷、智能斷句等超擬人對話能力。

     

    以搭建一個視覺能力的AI應用為例,用戶進入百煉應用控制臺后,僅需上傳圖片知識庫、編寫提示詞、設置音頻、調優這四步,數分鐘內就能創建一個能完成專屬視頻交互的AI應用,基于Qwen-VL強大的視覺推理能力,它不僅能識別物體的種類,還能準確描述物體的風格、特點、位置以及物體上的文字等關鍵信息。此外搭建好的應用還支持以音視頻sdk集成到用戶的Web、ioS或者安卓應用中,幫助企業快速實現業務創新。

     

    據介紹,阿里云百煉上的通義API每百萬tokens價格已降至0.3元,一汽、金山、哈啰集團、國家天文臺等超30萬企業和機構在使用阿里云百煉。


    雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說