成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    AR/VR 正文
    發私信給蔣鴻昌
    發送

    0

    量子視覺張聰:VR+行業還不成立,市場需要專注底層技術的創業公司

    本文作者: 蔣鴻昌 2017-04-27 21:08
    導語:這是一家有三個計算機視覺博士創立的VR公司。

    雷鋒網「新智造」按:雷鋒網正在啟動“新智造成長榜2017”評選活動,我們將對人工智能與機器人行業進行大規模報道、梳理和調研,并聯合數十家著名投資機構根據這些創新公司的技術實力、商業能力和成長性進行深度評選,最終從多個領域分別選出一些極具潛力成長性的創新公司。本文為雷鋒網「新智造」對一家VR創業公司的報道,報道對象為量子視覺,講述其如何創造性地使用深度學習改進圖像拼接,并開發出一體化的VR攝影機。如果你想參與我們的評選,可點擊「報名」鏈接,或通過郵箱xinzhizao@leiphone.com聯系我們!

    從2014年Facebook收購Oculus,到2016年下半年資本冷遇,VR熱潮如煙花般絢爛而短暫。在這樣的一個時期,一家VR創業公司的發布會就顯得非常可貴,尤其是這家公司發布的是一款貨真價實的高端硬件:20目攝像頭,可以拍攝10K、360度3D視頻的VR攝像機,售價98000元。

    這款叫AURA的VR攝影機出自量子視覺,一家由三個計算機博士組建的公司,把學到的技術應用到行業中的具體需求的想法,讓他們三個走到了一起。

    日前,量子視覺CEO張聰接受了雷鋒網新智造的采訪。在他看來,過去兩年,資本和創業者對VR的熱情,很大程度上源于過去一貫的成功經驗:在某個行業里有深厚資源的人,往往會第一時間講新出現的技術加以應用,集合自己的行業,就能產生巨大的價值。但這個邏輯目前無法在VR成形的原因是,從底層技術上來說,VR的很多方面都還是缺失的。張聰向雷鋒網新智造介紹了AURA背后的技術積累,以及量子視覺的創業故事。

    從計算機視覺博士到VR創業者

    在上海交通大學讀博士期間,張聰以研究助理(RA)的身份去了香港中文大學,師從王曉剛教授和湯曉鷗教授,兩位在華人世界里最權威的圖像識別研究者。

    張聰說,研究圖像,是讓他開心的事情。數學、物理領域推公式、證明效率更高的研究不同,直觀的圖像是能讓張聰興奮起來的東西。所以,本科學習電子工程,博士他就轉去做計算機視覺和機器學習了。

    2012年,多倫多大學計算機系教授Geoffrey Hinton的學生用老師在6年前提出的Deep Learning理論,參加計算機視覺最知名的比賽ImageNet并拿下冠軍。自此開始,深度學習開始成為計算機視覺的通行研究方法,香港中文大學就是最早一批轉到新方法的機構。張聰說,用深度學習處理計算機視覺的問題,很多領域的第一篇論文就出自他所在的實驗室。

    量子視覺張聰:VR+行業還不成立,市場需要專注底層技術的創業公司

    但畢業后,張聰并沒有去做計算機視覺相關的工作。他的理由和當初選圖像作為研究方向如出一轍:VR這種更直觀的體驗,帶來的興奮度是遠遠超過圖片的。

    他還有個“私心”,如果去做計算機視覺,和香港中文大學淵源頗深的商湯科技是最好的選擇,實際上他也完全有機會進去,“但商湯里100多個博士,你進去了又能怎樣呢?”

    30歲前一直待在學校、實驗室,張聰想讓自己學到的技術能給這個世界帶來一點東西,甚至創造商業財富,在這個過程中,個人價值也能得到最大的實現。

    2015年5月,運動相機制造商GoPro宣布收購專注于全景圖像拼接的法國創業公司Kolor,這讓張聰找到了靈感。將圖片和視頻拼接成全景圖像,是VR的第一步,從這次并購來看,市場對拼接軟件是有需求的。

    張聰堅信VR是朝陽產業,而且是他和兩個合伙人,也是同一個實驗室的韓慶龍和黃之燊能夠將自己所學應用進來的領域。三個人,韓慶龍研究方向是視頻編碼和圖像處理,黃之燊主攻深度圖像解析和圖形變換,張聰的長項是深度學習。于是,圖像拼接成了他們創業的方向。

    “其實我們的機會成本挺高的,如果我們現在去找AI的工作,七、八十萬的年薪總是逃不掉的。”

    升級拼接:把“抹平”拼縫改進為像素級匹配

    量子視覺把圖像拼接作為創業的第一步,來自他的團隊的底氣。Kolor被收購后,他們也試著開發了拼接軟件,并用幾臺小蟻相機搭建了全景相機,拍完照片一看,“效果已經比Kolor好了”。

    張聰告訴雷鋒網新智造,背后的秘密來自算法的升級。圖像拼接要處理的一個很重要的問題是“抹平”拼縫,通俗來講,將圖像拼接起來,進行畸變校正后,兩個圖像的拼接處因為灰度的細微差別等原因,會產生“拼接縫”。為了讓拼接更完美,就需要抹平這些縫隙。

    Kolor使用的是一種很經典的拼接算法,基于一些特征點做校正和變換,然后使用Multi-Band的方式,讓圖像拼接處平滑地過渡。這種算法在八十年代就已經被提出,因為能兼顧拼縫附近的局域細節和大尺度上兩張圖片的宏觀特征(如光照)而被廣泛采用。

    量子視覺則改用了一種新的算法,原理上是將兩個拼接的圖像進行像素級的匹配,這樣就不存在縫隙的問題,圖像拼接效果也更完美。匹配像素的過程在學術里就是光流的問題,所以,這一套方法也被稱為光流法拼接。

    光流法拼接的另一個好處是可以實現更好的3D效果。過去,要拍攝有3D效果的全景視頻,需要幾組平行的雙目攝像頭,通過左右兩個畫面的視差產生3D效果。但這種方法的問題是只有攝像頭正對的畫面3D效果是比較好的。光流法則是基于點云計算出來深度信息,從而實現每個角度都有的3D效果。這個過程設計基于估計的深度和重建,要用到深度學習技術,這正是張聰的強項。

    在找松禾資本和IDG融資時,量子視覺已經在使用光流拼接法。張聰說,投資人是看不懂這種方法的,但可以明顯感受到拼接的圖像質量更高。

    2016年4月的F8大會上,Facebook發布了360度3D全景相機Surround 360,并開源了硬件設計和拼接算法。張聰發現,擁有最多的權威VR專家的Facebook,使用的也是光流法拼接,Facebook使用的框架也和量子視覺有很多相似的地方。

    量子視覺張聰:VR+行業還不成立,市場需要專注底層技術的創業公司

    (Facebook的Surround 360)

    Facebook開源,意味著所有人都可以使用這種方法去做圖像拼接,這當然引起了量子視覺的擔心。不過仔細研究,張聰更多的是踏實,一方面,是和權威專家的不約而同帶來的學術認同感;另一方面,Facebook的實際拍攝經驗并不多,它的方案更多的是提供了一個通用的、開源的,能夠引導大家的算法,在真正的生產和內容制作環節,Facebook的方案中的一些模塊是有問題的。

    “我們有這種原發的能力,可以基于我們的相機和實際情況進行調整。算法依舊有一個很大的改進空間。”

    Aura:可以拍10K 、360度3D視頻的專業級VR攝影機

    拿到第一輪融資后,張聰就升級了用小蟻相機搭建的全景相機,改用了4個索尼α7以及20個GoPro組成的方案。他告訴雷鋒網新智造,進行圖像拼接時,除了算法,硬件的排布也非常重要,所以,他們的研發,就是不斷迭代算法,改進硬件排布,兩邊不斷相互迭代的過程。

    方案做好后,量子視覺要去市場試水。他們最有名的作品,是拍攝黃曉明的新劇《萬水千山總是情》的VR宣傳片,以及張楚的第一只全景MV《晃動一下》。張聰還透露了VR視頻制作的“潛規則”:不少團隊號稱可以制作VR視頻,但他們接活兒后會再找有能力的外包。“黃曉明的片子,到我們已經是第六道了。”

    量子視覺張聰:VR+行業還不成立,市場需要專注底層技術的創業公司

    (《萬水千山總是情》VR宣傳片)

    視頻的效果還不錯,但拍攝的過程讓張聰堅定了自己做一款VR攝影機的念頭。使用單反或者GoPro拼接的方案,最大的問題是操作太麻煩了,每個相機的參數,包括同步、存儲,甚至是拍攝完成后將素材拷貝下來,都是一個繁瑣務必的過程,“你要把SD卡一個一個拔下來,拷貝素材,再放到軟件里拼接。”這樣的方案,也根本無法給任何第三方使用。

    從2016年3月份開始,量子視覺就開始了研發一體化VR攝影機的進程。把多個攝像頭通過特定的排布方式集中到一個球形上,同時要考慮散熱、結構、電池續航和量產,每個環節都是“坑”。不過,深圳是硬件創業者的天堂,而且,早在有這個念頭之前,量子視覺就招募了前火樂科技研發總監曾作為,堅果G1智能家庭影院、堅果P1便攜智能投影等暢銷產品,就出自他手。

    2016年十一期間,量子視覺就做出了直徑20厘米,排球大小,有著20目攝像頭的全景攝影機,并和暴風體育合作,用在中國網球公開賽的VR直播中。此后,經過再次迭代以及配套軟件的開發,量子視覺在今年3月21日正式發布了這款相機——AURA專業級VR攝影機。

    量子視覺張聰:VR+行業還不成立,市場需要專注底層技術的創業公司

    AURA由20枚鏡頭組成,水平方向為16枚視場角90度的廣角鏡頭,頂端和底部則為4個視場角為190度的魚眼鏡頭,可連續拍攝1個小時,使用外部供電方案則可以實現長達10小時的連續拍攝。AURA可以支持目前主流的 H.264、H.265 視頻編碼標準,最大可以輸出25fps的10K 3D影像、60fps的10K 2D影像以及120fps的6K 2D影像。它還可以進行VR直播,實時輸出6K、30fps的3D VR直播畫面,并通過RTSP協議進行有線或無線實時監看。

    AURA還有配套的實時監控軟件AURA WORK和后期制作軟件AURA STUDIO,可以實現實時監看,以及一鍵快速素材導出、拼接、剪輯等,大大提高了高質量VR視頻的制作效率。

    “我自己也覺得,我們公司的模式很重,又要做硬件又要做軟件,但這是因為整個生態鏈不成熟。我們堅持做下來,反而會成為壁壘。”

    VR+行業還不成立,市場需要有專注底層技術的創業公司

    現在,VR遇冷在張聰看來并不奇怪。去年VR被資本熱捧的原因很簡單,大家默認VR是一個成熟的東西,和各個行業結合,就可以產生巨大的價值。

    不過現在來看,這個邏輯并不成立。其中最大的問題是在根本的底層技術上,VR的很多方面都是缺失的,整個生態鏈還處于非常不成熟的階段。以VR直播為例,在直播時,需要有實時拼接能力和推流能力的高清攝影方案,但同時,網絡的上行帶寬、CDN分發以及用戶的接收端,都還存在很大的問題。

    因為高端設備價格昂貴,加上VR內容,尤其是VR視頻體驗糟糕,C端市場的缺失是VR行業面臨的有一個大問題。現在,已經很少再有明星嘗試VR版的視頻內容。

    在這樣的情況下,更需要有專注底層技術的創業公司,這也是量子視覺推出可以拍攝10K視頻的VR攝影機的原因。通常來說,人眼的視角區域不到70度。在360度的全景視頻,需要10K的分辨率,才能在人眼所視范圍內,達到每只眼4K的觀看效果。

    “我最開始創業的時候,就沒覺得VR會很快火起來,因為我當時看大家做的東西都一塌糊涂。”張聰把這個看做技術創業者最好的機會,而將技術壁壘快速轉化為商業壁壘后,有造血能力的VR公司會在一兩年內迎來春天。


    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章

    主筆

    歡迎一切良性、有效的交流。 微信號:hongchang2011
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說