0
如果將數據科學家比作醫生的話,那么數據科學本身便既是行醫技能,又是行醫工具。
1974年, 因科學研究計算機模擬產生了大量數據,需要依靠算法發現其中規律,圖靈獎得主Peter Naur首次提出了數據科學(Data Science)的概念:基于數據處理的科學,這標志著數據科學的開端。
當今世界,隨著互聯網的發展,數據無處不在,要想利用好大數據,揭示數據中的隱藏規律,并幫助組織利用這種洞察來做出更明智的決策,就需要數據科學,也就是說必須首先收集、處理、分析和分享這些數據。管理這個數據生命周期便是數據科學的本質。
3月30日,2023數據科學峰會在北京舉行。關于數據科學如何幫助企業釋放數據價值的相關問題,雷峰網與相關媒體在會后與IDC中國副總裁兼首席分析師武連峰、百分點科技董事長兼CEO蘇萌、百分點科技CTO劉譯璟進行了深入的交流。
現有平臺、工具已經無法完全發掘數據的價值
根據IDC數據,2021年,全球數據總量達到了84.5ZB,預計到2026年,全球結構化與非結構化數據總量將達到221.2ZB。武連峰認為如此多的數據量,對于現有的工具、平臺、算力處理會帶來非常大的挑戰。而數據類型多樣、數據孤島、以及數據安全性等很難保證,還有云端部署和私有部署軟件適配難度大、實時數據分析能力欠缺等挑戰,都使得數據的價值無法得到充分的發揮。
在他看來發揮數據價值,需要打造三方面的能力:第一,數據的獲取和治理能力;第二,做數據挖掘與展現的能力;第三,數據的變現和創新能力。
目前政企數字化轉型已經進入到一個深水區。武連峰表示,如果把數字化轉型從低到高分成五個階段,二三階段占比已經超過2/3,到第四個階段還一直處在上山爬坡的階段,爬到一個中上快到山頂的時候,這時候是最難的。
另外,大數據、AI、云等,很多技術是一個融合的應用,而融合應用對于企業也帶來一定的挑戰。隨著技術的斷代式發展,數智基礎設施也呈現斷點式建設,企業不得不投入大量資源重復建設,以完成技術更迭和應用升級。
如果要應用好數據,只有將場景、技術和數據深度融合才能創造價值。
今天很多政企里面,數據還存在一個不足的現象。尤其中小企業數據還是不足的;政企雖然有大量的數據,但是數據治理、數據孤島的現象還非常嚴重。因此,在武連峰看來,首先,面向數據治理一定要打造一個統一的數據治理平臺,將數據變干凈;其次需要一個智能化的分析工具,將數據信息變成知識;最后是實現高效的數據智能化應用。
新的技術和應用帶來更加豐富的數據、多模態的數據,而這些數據需要進入到可分析、可解釋,需要讓它用得起來,需要參與到真正的預測和決策大的場景中來。蘇萌表示,數據科學在過去50年里從1.0的小數據時代,2.0的大數據時代,走入了3.0的AI時代,未來將邁向數據原生時代。當下市場需求不再是斷點式技術和工具,而是端到端的數據科學解決方案,在長鏈條里實現數據價值。
而國內外一些頂尖的公司像華為、阿里、Plantir、Alteryx包括百分點,開始紛紛的去沉淀整體的產品技術和解決方案。那么問題來了,企業到底應該如何選擇一個適合自己得數據科學技術平臺呢?
企業應該選一個什么樣的數據科學基礎平臺?
用數據,歸根結底是想讓數據創造業務價值,而不是為了用數據而用數據。
以前的用戶更加關注單點問題的解決,現在數據從采集、治理、分析、建模、預測到應用整個周期更加長,用戶更希望幫助他解決價值實現的問題。
蘇萌認為,百分點的數據價值鏈夠長,百分點科技沉淀了十三年的經驗和實踐推出的科學基礎平臺--DeepMatrix,是一套端到端的數據科學技術平臺。從規劃設計、數據治理、建模分析和數據應用四大階段,覆蓋數據價值實現的全生命周期,具備全面數據類型支持、完善數據治理能力、強大數據建模能力、豐富數據洞察能力、高效知識生產能力和高度復用領域知識六大能力。
劉譯璟認為,當前主要的流程和工具已經覆蓋齊全,未來將聚焦于領域知識的沉淀和復用。據介紹,百分點數據科學基礎平臺系列產品,主要致力于解決數據價值鏈中的共性問題,面向數據工程師、數據分析師和數據科學家群體,提供能力全面、交互自然知識驅動的通用工具,具有創新意識和數字化基礎比較好的成熟的數字化中晚期的用戶時百分點的目標客戶。
當問及相比于同類市場產品,百分點數據科學基礎平臺的優勢是什么?
劉譯璟告訴記者,競爭優勢其實一直也是我們在思考的問題,如果概括來說的話主要有兩個方面:
第一方面,百分點能力很全,因為入行比較早,一直做一款應用,以至于始終保持的都是全棧的數據可用的能力。現在越來越多的創業公司已經很難做到比較全面的能力,只能依托云大廠,做一些小而美的功能,解決部分問題。
第二方面,應用場景的選擇、領域的選擇,會形成差異化。百分點數據科學基礎平臺具備兩大特征,知識化和智能化。
首先是知識化,平臺不斷沉淀領域中的數據科學知識,包括程序性知識、事實性知識和概念性知識。傳統企業的數字化轉型面臨著冷啟動問題,平臺能夠借助行業內已有的專業知識為其破局。其次是智能化,數據科學基礎平臺內置了智能輔助開發系統,可以自動化地輔助開發者選擇方案以及完成數據適配,并智能化地進行方案精調和改進。同時,能夠在數據治理的多個環節依托知識庫及語義理解等智能技術幫助開發者提高效率。
劉譯璟告訴雷峰網(公眾號:雷峰網),任何產品都不是一蹴而就的。從最早做推薦引擎,就涉及了海量的用戶數據,最大規模的時候,大概有一千多臺服務器,我們要在上面做機器學習的算法、運營指標的分析等,經過了13年,我們一直在持續迭代自己的技術能力,并通過不斷的落地實踐,才固化了產品模式。我們把底層的平臺做出來以后,客戶就不需要很長的時間周期和人力,幫助客戶提升效率,這是我們打造這個產品的初衷。
蘇萌在最后表示:“過去的50年在數據科學不斷發展和變遷,從我個人來說,個人成長、求學、做科研、又出來創業,自己感悟到一點特別深的是,信息技術真的在改變人類,信息技術創造了數字的世界,而數字的技術又在推動數字經濟的不斷發展,數字經濟又推動了人類和組織社會的變革,而且變革又進一步為創新提供了土壤,其實我們不斷的循環在往前走。我們也在感受著使命的召喚,百分點科技的使命就是繼續致力于‘用數據科學構建更智能的世界’。”
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。