0
雖然說AI不是數據的堆砌,但是AI的背后的確是數據的功勞。不然,我們居家必備的小愛同學、天貓精靈們怎么聽得懂我們的話?
尤其是今年國家不提GDP增長目標但極力推進高質量發展的背景下,追求更加精準的AI落地成為行業共識。
這意味著,AI數據質量需要進一步提升。
9月6日,在吸引了1.8萬家境內外企業的服貿會上(全稱是2020中國國際服務貿易交易會),云測數據首次發布了一項數據標注領域的重要成果:云測數據項目最高交付精準度達到了99.99%——這是目前數據標注領域可達到的最高服務標準。
在數據標注行業,交付精度達到99.99%是什么概念呢?
一般來說,在AI行業,算力、算法、數據是三大要素,前兩者是設備與能力,數據則是讓AI學習的知識素材。

AI數據服務,包含了為AI算法、算力訓練及優化提供的數據采集、清洗、信息抽取、標注等服務,以采集和標注為主。
而AI就是通過大批量基于特定標注規則后學習的方法論,因此需要人工將像素、語音信號、文本內容轉換為機器能理解、能看懂的數據內容,才可以被機器習得識別處理的方法論。
這些被標注的結果為識別人的特征點,在臉上打上一個個特殊標記,為識別圖像中的車輛,通過標注框的方式將對應像素位置范圍框選其中。

因此,數據標注的精準度提升,AI才不會把汽車識別為房子,把老虎識別為獅子。在AI越來越強調落地各個產業的今天,數據標注精準度是把控AI質量的關鍵。
云測數據總經理賈宇航表示,進行99.99%的成果展示,也是向外傳遞數據標注高質量發展信心。
云測數據是什么公司?
行業內人士可能都知道Testin云測,成立于2011年,是一家以人工智能技術驅動的企業服務平臺。實際上,云測數據正是Testin云測旗下AI數據標注服務品牌,是主打高質量AI數據服務的服務商,是算法廠商的上游,圖像、語音、文本的數據類型都做到了全品類支持。
雷鋒網注意到,之所以他們有底氣向行業展示出4個9的精準度,云測數據總經理賈宇航給出的理由在于:云測數據具備全品類的高效標注平臺,已經完成了標準化API接口的流程嵌入,做到了模板化的任務創建,并支持了不同種類標注類型和標注方法。
此外,其工作平臺包含項目管理、環節工具、標注平臺,云測數據所沉淀的是完全自主知識產品的平臺技術。
值得一提的是,相比外包的數據標注業務,云測數據自建了數據交付中心以及自有員工,人員穩定。截至目前,云測數據在華東、華北、華南設有數據交付中心和數據采集基地。
對于場景數據的把控和處理,正成為新競爭格局下的硬實力。
雷鋒網了解到,云測數據可能更偏向在智能駕駛、智慧城市、智能家居、智慧金融、新零售等場景的AI數據服務。

以自動駕駛為例,在實際落地中,為對物體測距及測速更加精準,引入激光雷達傳感器。車載攝像頭中的數據與我們人眼相差無幾,而激光雷達產生數據與人類所認知的現實世界差距甚遠。
據悉,完成激光雷達的相關3D點云數據標注工作,背后需要標注人員對3D點云數據有豐富的處理經驗。云測數據在工具層面采用融合標注方式,讓標注人員更加直觀的將兩個世界維度的數據融合一起判斷,提高了標注人員的數據處理精準度,同時加快了標注效率。
整體來看,國內的AI發展態勢良好,場景化AI數據服務趨勢凸顯,且AI公司把自己快“逼”上落地極限了,與場景緊密捆綁的數據標注都將迎來發展熱潮。
伴隨著5G的落地,更多豐富的場景也將井噴,AI行業數千億的蛋糕,將成為今天企業走向未來的新動力。(雷鋒網雷鋒網)
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。