0
作者:袁柏林
編輯:董子博
“數智人必將為我們社會帶來翻天覆地的變革。我作為內容創作者,實地的感受真的是太震撼了。”作為騰訊云智能2D小樣本數智人體驗館劉興亮如是說。

圖:劉興亮的數智人分身與本人對比
(來源:騰訊云智能)
隨著人工智能技術、云計算、5G移動通信技術等的技術發展,數智人行業不斷加快的各種應用場景落地。數智創研院的《2022數智人分析洞察報告》顯示,中國AI數字人市場規模呈現高速增長趨勢,預計到2026年將達102.4億元。
在過去,要完成一個超寫實、高精度數字人的制作,可能需要數十小時的烘焙和渲染——而在今天,一項數智人技術的突破,或許會讓這項技術,變成以后每個人都共有的“標配”。
元宇宙興起后,數字人賽道成為各大互聯網企業爭逐之地。關于數字人,雷峰網(公眾號:雷峰網)曾在Meta元宇宙「寒氣」逼人,數字人用「內功」驅寒文章里詳細敘述過。簡而言之,數字人是元宇宙重要的組成部分,且接近C端用戶,具備強大的變現能力。
而數智人則與數字人,雖一字之差,但截然不同。
數智人,如同它的名字,是智能的數字人。因此,數智人不僅具備數字人強勁的變現優勢,而且數智人更擁有智能化與交互性特征,這也是“數智人”與普通的數字人最大的區別。
在AI技術、5G技術、XR技術以及深度學習等技術的支撐下,數智人將擁有更智慧的頭腦、更靈活的動作、更豐富的表情以及更人性化的心智等特征。
去年7月底,依托多模態人機交互技術,國家博物館就與騰訊SSV數字文化實驗室聯合打造出首個虛擬數智人“艾雯雯”,成為國家博物館虛擬世界的代言人,助力讓文物活起來,成為文化數字化戰略發展的典型案例。

圖:國博虛擬數智人“艾雯雯”
(來源:國家博物館公眾號)
一年未到,騰訊這次達到了從制作時間和成本上突破數智人發展上限:利用短短3分鐘視頻在24小時內高效生成數智人。
4月25日,騰訊云智能首次對外重點推介的2D小樣本數智人,只需3分鐘視頻即可在一天內定制專屬數智人分身。
騰訊優圖實驗室研究總監汪鋮杰表示“我們看到的是3分鐘的視頻做訓練,但是背后是有一塊很大的多模態數據在支撐。”
3分鐘的小樣本視頻背后是基于大數據的學習,即對引入自監督機制的通用多模態模型進行訓練,將視頻里的語音、文本與數智人像的表情、口型進行關聯,并且自監督式的模型可以讓數據自己約束自己,以此節省更多數智人標注時間。
這讓數智人行業完成邊際成本到固定成本的進階。
相較于之前訓練一個數智人,需要幾十小時,甚至更長時間的語料或者視頻素材,現在只需要通過通用模型的學習,就可以變成一次性的固定成本,后面每一個新的數智人的定制,包括形象、音色等的邊際成本都會比較小。
可想而知,先把底層通用模型訓練好,再制作多少新的數智人也不過“添個人就是添雙筷子的事兒”。
這種一次生成、多次獲利的模式促進數智人的制作時長實現從月級別降到小時級別,數智人的制作成本從百萬級別降到千元級別。
此外,2D小樣本數智人技術結合3D技術,即在從“文本或音頻信息”到“3D人像驅動”,最后實現“2D人像視頻”的模式上,騰訊云智能已經有較多技術積累,這將能夠使生成更加精確、2D小樣本數智人細節打磨更加精致。
目前小樣本數智人不僅實現了“皺紋級”形象還原,還達到“音素級”音色復刻的效果。
外貌表情、舉手投足的真人風貌復現,讓人驚嘆:“世另我”!

圖:小紅書營銷講師蘇歆老師與她的數智分身
(來源:騰訊云智能)
總而言之,數智人背后的技術支持,促使數智人行業得以完成快速生產、成本精益、效果精良的蛻變。
此前,數智人主要服務于公司企業或者高層管理等部分精英人員,覆蓋傳媒、醫療、金融、教育等各行各業。
對于集團來說,數智人能夠助力企業數智化轉型升級,降本增效,打造更好的7*24全天候客戶服務;對于精英人員來說,數智人能夠跨越時間和空間的限制,幫助其處理閑鎖事務,節約時間成本,解放生產力,將人的注意力放到更有價值的事情上去。
但是,要社會的整體進步發展,數智人的門檻必須往下拉一拉。
而騰訊云智能所訓練的2D小樣本數智人將生產成本的大幅度降低。且客戶可以自己開賬號、下單購買、上傳素材、自行訓練、確認效果,完全實現自助式服務。
可以預見,隨著技術發展,生產成本和使用門檻將會越來越低。對于個人,尤其是普羅大眾來說,做自己專屬的數智分身將是觸手可及。
人人都有數智分身的未來,并不是夢。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。