0

雷鋒網(wǎng) AI 研習社按,日前,kdnuggets 上的一篇文章對比了三大公司(谷歌、微軟和亞馬遜)提供的機器學習服務平臺,對于想要啟動機器學習項目的公司或是數(shù)據(jù)科學新手來說,提供了非常多的指導和建議。雷鋒網(wǎng) AI 研習社將原文編譯整理如下:
對于大多數(shù)企業(yè)來說,機器學習就像航空航天一樣遙遠,聽起來既昂貴,還需要高科技人才。從某種角度來說,如果你想建立一個像 Netflix 一樣好的推薦系統(tǒng),那確實是昂貴且困難。但是,目前這個復雜的領域有一個趨勢:一切皆服務(everything-as-a-service)——無需太多投資,即可快速啟動機器學習計劃。如果你是數(shù)據(jù)科學的新手,想要抓住當下的機會,這將是一種正確的選擇。
機器學習里最令人鼓舞的故事之一就是,一個日本農(nóng)民,為了減輕他父母的工作負擔,決定設計一個自動分揀黃瓜的系統(tǒng)。不像其他的大型公司,這個人并沒有機器學習的專業(yè)知識,也沒有很多預算,但是他努力學會了 TensorFlow,并使用深度學習來識別不同種類的黃瓜。
通過使用機器學習云服務,你可以開始構建第一個工作的模型,只要一小個團隊,就可以從機器學習的預測中獲得有價值的信息。許多人已經(jīng)討論過不同的機器學習的策略。現(xiàn)在讓我們來看看市場上最好的機器學習平臺都有哪些服務。
什么是機器學習服務
機器學習服務(Machine learning as a service, MLaaS)包含機器學習大多數(shù)基礎問題(比如數(shù)據(jù)預處理,模型訓練,模型評估,以及預測)的全自動或者半自動云平臺的總體定義。預測結果可以通過 REST API 與內(nèi)部的 IT 基礎架構橋接。
Amazon 機器學習服務,Azure 機器學習和 Google Cloud AI 是最領先的三個云 MLaaS 服務,允許在很少甚至沒有數(shù)據(jù)科學專業(yè)知識的情況下進行快速模型訓練和部署。如果你還沒有數(shù)據(jù)科學團隊,可以參看我們的另一篇文章,看看團隊都需要擁有哪些技能的人才。
在本文中,我們將首先概述 Amazon,Google 和 Microsoft 的主要機器學習服務平臺,并比較這些供應商所支持的機器學習 API。這并不是如何使用這些平臺的說明,而是在開始閱讀平臺的文檔之前所需要做的功能調(diào)研。
針對定制化的預測分析任務的機器學習服務

使用 Amazon ML 進行預測分析
亞馬遜的機器學習服務有兩個層面:用于預測分析的 Amazon ML 和針對數(shù)據(jù)科學家設計的 SageMaker。
Amazon Machine Learning 是市場上最自動化的解決方案之一,最適合對處理效率敏感的操作。該服務可以加載來自多個來源的數(shù)據(jù),包括 Amazon RDS,Amazon Redshift,CSV 文件等。所有數(shù)據(jù)的預處理操作都是自動執(zhí)行的:包括確認哪些字段是分類標簽,哪些是數(shù)字,而且不需要用戶選擇進一步的數(shù)據(jù)預處理方法(降維還是白化)。
Amazon ML 的預測能力限于三種:二分類,多分類,以及回歸任務。也就是說,Amazon ML 服務不支持無監(jiān)督的學習方法,用戶必須在訓練集中選擇標記好的目標變量。而且,用戶不需要知道任何機器學習方法,Amazon 會在分析提供的數(shù)據(jù)之后自動選擇機器學習方法。
這種高自動化的水平既是 Amazon ML 的優(yōu)勢,也是劣勢。如果您需要一個完全自動化,但是功能有限的解決方案,那么這個服務非常適合你。但是如果不是這樣的話,你可以選擇 SageMaker。
Amazon SageMaker 以及基于框架的服務
SageMaker 是一個機器學習環(huán)境,通過提供快速建模和部署工具來簡化數(shù)據(jù)科學家的工作。例如,它提供 Jupyter 來簡化數(shù)據(jù)瀏覽和分析。Amazon 也提供了內(nèi)置的算法,針對分布式系統(tǒng)中的大型數(shù)據(jù)集和計算進行了優(yōu)化。這些算法包括:
線性學習器,一種用于分類和回歸的監(jiān)督方法。
用于稀疏數(shù)據(jù)集的分類和回歸的分解機(Factorization Machine)。
XGBoost 是一個有監(jiān)督的提升樹算法,通過結合簡單算法的預測來提高分類,回歸以及排序的預測精度。
基于 ResNet 的圖像分類,也可以應用于遷移學習。
Seq2seq 是用于預測序列的監(jiān)督算法,可用于翻譯句子,將句子總結為更短的詞匯等。
K-means 是一種用于聚類任務的無監(jiān)督學習方法。
主成分分析(PCA),可以用于數(shù)據(jù)降維。
隱含狄利克雷分布(Latent Dirichlet allocation)是用于文檔歸類的無監(jiān)督方法。
神經(jīng)主題模型(Neural topic model, NTM)是一種無監(jiān)督方法,它可以遍歷文檔,找出高頻詞匯,并根據(jù)內(nèi)容定義文檔的主題(用戶不能預先定義主題的名稱,但是可以設置話題的數(shù)量)。
SageMaker 中內(nèi)置的方法與 Amazon 推薦的 ML API 在很大程度上有交集,但在這里它允許數(shù)據(jù)科學家定制使用,并使用自己的數(shù)據(jù)集。
如果你不想使用這些功能,你也可以添加自己的方法,并通過 SageMaker 利用它的部署功能運行模型。或者也可以將 SageMaker 與 TensorFlow 或 MXNet 等深度學習庫集成在一起。
一般來說,亞馬遜的機器學習服務為經(jīng)驗豐富的數(shù)據(jù)科學家和只需要完成工作而不需深入準備數(shù)據(jù)集和建模的人都提供了足夠的自由。對于那些已經(jīng)使用亞馬遜環(huán)境并且不打算轉(zhuǎn)移到其他云供應商的公司來說,這是一個可靠的選擇。
Microsoft Azure 機器學習工作室(Machine Learning Studio)
Azure Machine Learning 意在為新手和經(jīng)驗豐富的數(shù)據(jù)科學家建立一個強大的工作空間。微軟的機器學習產(chǎn)品功能與亞馬遜的類似,但就目前而言,Azure 的現(xiàn)成算法更加靈活。
Azure 提供的服務可以分為兩大類:Azure Machine Learning Studio 和 Bot 服務。讓我們首先了解一下 Azure ML Studio,在之后介紹特定 API 和工具的部分時,回到 Bot 服務。
ML Studio 是微軟 MLaaS 的主要部分,幾乎所有的 Azure ML Studio 中的操作都必須手動完成:包括瀏覽數(shù)據(jù),預處理,選擇方法,以及驗證模型結果。
使用 Azure 進行機器學習的學習曲線可能比較陡,但是這也能使得用戶對該領域的主要技術有更深入的了解。另一方面,Azure ML 支持圖形界面,可以可視化工作流程中的每一個步驟。使用 Azure 的主要好處是可以使用各種算法。ML Studio 支持大約 100 種解決分類(包括二分類和多分類),異常檢測,回歸,推薦和文本分析方法。值得一提的是,該平臺也支持一種聚類算法(K-means)。
Azure ML 的另一大部分是 Cortana Intelligence Gallery。它是由社區(qū)提供的機器學習解決方案的集合,供數(shù)據(jù)科學家開發(fā)和利用。Azure 對于從事機器學習的人來說是一個強大的工具。
Google 預測 API
Google 在兩個層面上提供 AI 服務:針對高級數(shù)據(jù)科學家的機器學習引擎,和高度自動化的 Google 預測 API。不過,谷歌將在2018 年 4 月 30 日停用預測 API 服務。
即將停用的預測 API 類似于 Amazon ML,只有兩個很精簡的方法,主要用于解決兩個問題:分類(二類和多類)和回歸。訓練好的模型可以通過 REST API 接口進行部署。
Google 并沒有公開預測中使用了哪些算法,也不能讓工程師自定義模型。Google 的環(huán)境最適合在緊迫的期限內(nèi)進行機器學習,并推出初始版本的 ML 模型。然而這個產(chǎn)品并沒有像谷歌所期望的那么受歡迎。
那么接替 Google 預測 API 的是什么呢?
Google 云端機器學習引擎
預測 API 的高度自動化是以犧牲靈活性為代價的。Google ML Engine 正好相反。它適用于經(jīng)驗豐富的數(shù)據(jù)科學家,非常的靈活,建議大家使用 TensorFlow 的云基礎設施作為機器學習的驅(qū)動。Google ML Engine 大體上與 SageMaker 相似。
TensorFlow 是 Google 的另一個產(chǎn)品,它是一個開源機器學習庫,包含各種數(shù)據(jù)科學工具,它并不是 ML-as-a-service。它沒有可視化界面,TensorFlow 的學習曲線非常陡峭。但是,這個庫也面向想要轉(zhuǎn)向數(shù)據(jù)科學的軟件工程師。TensorFlow 非常強大,主要針對深度神經(jīng)網(wǎng)絡的任務。
基本上,TensorFlow 和 Google 云服務結合,構成了三層服務模型,包括了基礎架構服務和平臺服務解決方案。
用一句話來總結機器學習服務平臺:Azure 是目前 MLaaS 市場上擁有功能最多的工具集,它涵蓋了大多數(shù)與 ML 相關的任務,為構建自定義模型提供了一個可視化的界面,并且為那些不想深入了解數(shù)據(jù)科學的人提供了一套可靠的 API。但是相較于亞馬遜,它仍然缺乏自動化的能力。
Amazon,Microsoft,Google 機器學習 API 的比較
除了成熟的平臺之外,還可以使用高級的 API。這些都是使用訓練好的模型的服務,只需要將數(shù)據(jù)輸入,就可以得到結果。API 不需要機器學習的專業(yè)知識。目前,這三家廠商的 API 大致可以分為三類:
文本識別,翻譯和文本分析
圖像+視頻識別和相關分析
其他,包括某些未分類服務

語音和文本處理 API:Amazon
Amazon 提供了多個針對文本分析中常見任務的 API。這些 API 是高度自動化的,只需適當?shù)恼暇涂梢怨ぷ鳌?/p>
Lex API 是為了能將聊天機器人嵌入到應用中而設計的,它包含了自動語音識別(ASR)和自然語言處理(NLP)的能力。這些都基于深度學習模型。API 可以識別書面文本和語音,Lex 接口允許將識別出的結果連接到各種后端解決方案。很顯然,亞馬遜鼓勵使用自家的 Lambda 云環(huán)境。所以在訂閱 Lex 服務之前,最好熟悉一下 Lambda 云環(huán)境。除了獨立的應用程序之外,Lex 目前也支持在 Facebook Messenger,slack 和 Twilio 部署聊天機器人。
Lex 是一個復雜的以聊天機器人為導向的工具,而 Transcribe 僅應用于語音識別。該工具可以識別多個說話人,同時也能很好的識別低質(zhì)量的音頻,比如電話音頻。這些功能使得這個 API 成為音頻歸檔分類的一個很好的解決方案, 也可以進一步為電話呼叫中心的數(shù)據(jù)文本分析提供支持。
Polly 服務與 Lex 相反,它是將文本轉(zhuǎn)換為語音, 這能夠使聊天機器人通過語音的方式回復,這個 API 并不會生成文本,只是讓文本的發(fā)音更接近與人類。如果你曾經(jīng)使用過 Alexa,你就會知道這種聲音是什么樣的。目前,它支持 25 種語言的男性和女性的聲音,主要是英語和西歐語言。一些語言有多種男性和女性的聲音,所以甚至可以有多種選擇。與 Lex 一樣,建議將 Polly 與 Lambda 一起使用。
Comprehend 是另一個 NLP API 集。與 Lex 和 Transcribe 不同,它針對不同的文本分析任務而設計。目前,Comprehend 支持:
實體提取(識別名字,日期,組織等等)
關鍵短語檢測
語音識別
情感分析(文本是積極,中立,還是消極)
主題建模(通過分析關鍵字定義文本主題)
該服務可以幫助分析社交媒體的回復,評論,以及不適合手動分析的其他大型文本數(shù)據(jù),比如 Comprehend 和 Transcribe 的組合將有助于分析客服的電話服務。
就像名稱所表達的一樣,Translate 服務是用來翻譯文本的。Amazon 聲稱,該服務使用的神經(jīng)網(wǎng)絡,與基于規(guī)則的翻譯方法相比,能夠提供更高的翻譯質(zhì)量。然而,目前版本只支持阿拉伯文、中文、法文、德文、葡萄牙文和西班牙文這六種語言與英文的互譯。
語音和文本處理 API:Microsoft Azure Congnitive Services
與亞馬遜一樣,微軟也提供高級API:Congnitive Services,可以與你的基礎平臺集成到一起來完成任務,并不需要任何數(shù)據(jù)科學的專業(yè)知識。
Speech
Speech 集包含四個 API,針對自然語言識別和一些其他任務使用了不同類型的自然語言處理(NLP)技術:
語音翻譯 API
Bing Speech API:文本和語音之間的互相轉(zhuǎn)換
說話人識別:可用于語音驗證任務
定制化的語音服務,可使用 Azure 的自然語言處理方法處理自己的數(shù)據(jù)和模型
Language
微軟的 Language API 與 Amazon Comprehend 類似,側(cè)重于文本分析:
Language Understanding Intelligent Service 是一個分析文本意圖,并將之轉(zhuǎn)換為命令的 API(例如「運行 YouTube」,或者「打開客廳燈」等)
用于情感分析和定義主題的文本分析 API
Bing 拼寫檢查
文本翻譯 API
Web 語言模型 API,用于估計單詞組合的概率,并實現(xiàn)單詞的自動智能補全
語言分析 API,用于分句,標注詞類,并將文本分成標記的短語
語音和本文處理 API:Google 云服務
雖然這套 API 與亞馬遜、微軟 Azure 的 API 相似,但也擁有一些獨特和有趣的東西。
現(xiàn)今各種聊天機器人已經(jīng)成為趨勢,Google 也提供了一些服務。Dialogflow 采用了 NLP 技術,旨在發(fā)現(xiàn)文本中表達的意圖,并解釋人想要什么。可以使用 java,Node.js 和 Python 為 API 調(diào)整和定制功能。
這其中的核心功能幾乎與 Amazon comprehend 和微軟的 Languate 完全相同。
在文本中識別實體
識別情緒
分析語法結構
分類主題(比如食物, 新聞,電子等等)
這項服務用于識別自然語音,與其他公司類似的 API 相比,其主要優(yōu)勢在于 Google 支持更豐富的語言。目前,它支持全球 110 多種語言。額外功能如下:
Word hints,允許定制識別到特定的上下文或者默寫單詞(例如,可以更好的理解當?shù)氐幕蛘咝袠I(yè)內(nèi)的術語)
過濾不當內(nèi)容
處理嘈雜的音頻
基本上,你可以使用該 API 將 Google 翻譯集成到產(chǎn)品中,包含 100 多種語言的自動檢測和翻譯。
除了文本和語音,Aamzon,Microsoft 和 Google 還提供了用于圖像和視頻分析的常用 API。

盡管圖像分析和視頻 API 密切相關,但是許多視頻分析工具仍處于開發(fā)或測試階段。例如,Google 對許多圖像處理任務提供了豐富的支持,但是缺乏一些微軟和亞馬遜已經(jīng)支持的視頻分析功能。

圖像和視頻處理API:Amazon Rekognition
Rekognition 并不沒有拼錯。Rekognition API 用于圖像以及最近的視頻識別任務。包括:
目標檢測和分類(查找和檢測圖象中的不同目標,并定義他們的類別)
在視頻中,可以檢測「跳舞」等活動或者「撲滅火」這種復雜的動作
人臉識別(用于檢測人臉,并找到匹配的人臉)和臉部分析(這個分析非常有趣,可以檢測到笑臉,分析眼睛,甚至在視頻中識別出情感情緒)
檢測不當視頻
識別圖片和視頻中的名人
圖像和視頻處理 API:Microsoft Azure Congnitive Service
軟件包結合了六個 API,分別專注于不同類型的圖像,視頻和文本分析。
Computer Vision:用于識別目標、動作、圖像中主體顏色
Content Moderator:在圖像、文字和視頻中檢測不適當?shù)膬?nèi)容
Face API:用來檢測人臉并分組,識別年齡、情緒、性別、姿勢、笑容和面部毛發(fā)
Emotion API:用來識別面部表情的工具
Custom Vision Service:支持使用自己的數(shù)據(jù)構建自定義的圖像識別模型
Video indexer:是一種在視頻中查找任務的工具,可以定義語音情感并標記關鍵字
圖像和視頻處理 API:Google Cloud Services
該工具為圖像識別任務而建立,對于查找特定的圖像屬性非常有用:
標記對象
檢測人臉并分析表情
尋找標志性事件并描述現(xiàn)場(例如假期、婚禮等)
在圖像中查找文本并識別語言
圖像中的主色調(diào)
Google 的視頻識別 API 在開發(fā)初期就缺乏 Amazon Rekognition 和 Microsoft Congnitive Services 提供的許多功能。目前,該 API 提供以下工具集:
標記對象并識別動作
識別明確的內(nèi)容
轉(zhuǎn)錄語音
雖然在功能級別上,Google AI 服務可能缺乏一些功能,但是 Google API 可以使用 Google 提供的大量數(shù)據(jù)集。
特定的 API 和工具
這一部分,我們將討論微軟和谷歌的特定 API 產(chǎn)品和工具。這里沒有亞馬遜,因為其 API 跟上面提到的文本分析和圖像視頻分析是一樣的。但是,一些其他公司提供的特定 API 的一些功能也集成于 Amazon 的產(chǎn)品中。
Azure Service Bot 框架
微軟為了給用戶提供更靈活的開發(fā)工具集付出了很多努力。該服務包含通過不同編程語言構建、測試和部署 bot 的完整環(huán)境。
有趣的是,bot 服務并不一定需要機器學習方法。微軟為 bot 工具提供了五種模板(基礎模板、形式模板、語言理解模板、主動模板和問答模板),只有語言理解模板需要高級的人工智能技術。
目前,你可以使用 .NET 和 Node.js 技術,利用 Azure 構建機器人,并將其部署到平臺和服務上:
Bing
Cortana
Skype
Web Chat
Office 365 email
GroupMe
Facebook Messenger
Slack
Kik
Telegram
Twilio
微軟提供了連接 Bing 核心引擎的七個 API,包括自動推薦、新聞、圖像和視頻搜索。
該 API 將文本分析與各種任務相結合:
Knowledge Exploration Service 允許您輸入自然語言的查詢以從數(shù)據(jù)庫中檢索數(shù)據(jù),可視化數(shù)據(jù)和自動完成查詢。
Entity Linking Intelligence API旨在突出表示適當實體的名稱,和短語(例如年齡),并確保消除歧義。
Academic Knowledge API可以完成單詞的自動補全,從單詞或者概念的角度,發(fā)現(xiàn)文檔之間的相似性, 并在文檔中搜索圖模式。
QnA Maker API可用于各種問題與答案的匹配,以構建客戶所關心的聊天機器人和應用程序。
Custom Decision Service是一種強化學習工具,可根據(jù)用戶的喜好對不同類型的內(nèi)容(如鏈接, 廣告等) 進行個性化和排名。
該 API 仍處于開發(fā)早期,但可能在不久的將來重新定義我們當前的職位搜索能力。與傳統(tǒng)的依賴精確的關鍵詞匹配的傳統(tǒng)求職引擎不同,Google 采用機器學習來找出高度不同的職位描述之間的相關聯(lián)系,并避免模棱兩可。例如,盡量減少不相關或者太廣泛的搜索結果,例如在你搜索「sales assistant」時,并不會返回所有含有「assistant」單詞的職位結果。這個 API 的主要特點:
修正工作搜索查詢中的拼寫錯誤
匹配所需的資歷水平
查找和區(qū)分可能具有不同表現(xiàn)形式和行業(yè)術語的相關工作(例如,查詢「server」(服務員)會返回「barista」(咖啡師)」,而不是「network specialist(網(wǎng)絡專家)」; 或者在查詢「biz dev「時,返回「engagement specialist」
處理首字母縮略詞,例如查詢「HR」返回人力資源助理
匹配不同的位置描述
IBM Watson 及其他
之前描述的所有三種平臺都提供了相當詳盡的文檔,可以從頭開始啟動機器學習項目的實驗,并在企業(yè)基礎架構中部署了訓練好的模型。還有一些其他的 ML-as-a-service 解決方案來自初創(chuàng)公司,并受到 PredicSis 和 BigML 等數(shù)據(jù)科學家的推崇。
那么 IBM Watson Analytics 怎么樣?
IBM Watson Analytics 還不是一個用于商業(yè)預測的完整機器學習平臺。目前,Watson 的優(yōu)勢是可視化數(shù)據(jù),以及描述不同數(shù)據(jù)之間的相互作用。它還有類似于 Google 提供的視覺識別服務和一些其他的認知服務(API)。Watson 目前的問題是,該系統(tǒng)只能執(zhí)行很少的一些相對簡單的非專業(yè)的任務,涉及到定制機器學習方法或者預測任務時,IBM Watson 就無能為力了。
數(shù)據(jù)存儲
如果團隊中的數(shù)據(jù)科學家有足夠的知識來操作流行的存儲解決方案,那么尋找合適的存儲方式來收集數(shù)據(jù),并通過機器學習進一步處理數(shù)據(jù)現(xiàn)在已經(jīng)不再是一個很大的挑戰(zhàn)。
在大多數(shù)情況下,機器學習需要將 SQL 和 NoSQL 兩種數(shù)據(jù)庫方案相結合,Hadoop 分布式文件系統(tǒng), Cassandra, Amazon S3 和 Redshift 等許多可靠的解決方案已經(jīng)支持這種存儲方案。因此,當開始機器學習項目時,數(shù)據(jù)存儲并不是一個難以解決的障礙。如果你打算使用 ML-as-a-service 系統(tǒng),最直接的方法就是,選擇一個能同時提供機器學習算法和存儲任務的供應商,這樣能夠減少很多花在配置數(shù)據(jù)庫上的時間。
但是,有些平臺也可以輕松與其他存儲供應商集成。例如,雖然 Azure ML 主要與微軟產(chǎn)品 Azure SQL, Azure Table,Azure Blob 集成,但是它也支持 Hadoop 和一些其他的數(shù)據(jù)源選項。這包括從桌面或者內(nèi)部服務器直接上傳數(shù)據(jù)。如果你的機器學習工作流程很多樣化,并且數(shù)據(jù)來自多個來源,如何集成多個數(shù)據(jù)源可能是一個挑戰(zhàn)。
建模和計算
我們已經(jīng)討論了主要提供計算能力的 ML-as-a-service 解決方案。但是如果模型學習的過程需要在公司內(nèi)部執(zhí)行,計算能力的挑戰(zhàn)遲早會出現(xiàn)。機器學習在大多數(shù)情況下需要很多計算能力。即使大數(shù)據(jù)時代已經(jīng)來臨,數(shù)據(jù)采樣(收集數(shù)據(jù)集)仍然是一個重要的問題。
雖然使用一個筆記本電腦就可以完成模型的構建,但是要用大型數(shù)據(jù)集來訓練模型,復雜模型需要更強大的硬件。數(shù)據(jù)預處理也是如此,在常規(guī)的辦公機器上可能需要幾天的時間。在截止日期緊張的情況下,(有些模型需要每周或者每天更換,或者需要重新訓練),這根本是不可能的。有三種可行的方法來解決這個問題:
加速硬件。如果執(zhí)行相對簡單的任務,并且不使用大數(shù)據(jù)訓練模型,請使用固態(tài)硬盤(SSD)執(zhí)行數(shù)據(jù)準備或分析等任務。可以使用一個或多個圖形處理單元(GPU)解決計算密集型操作。許多編程庫支持使用高級語言(例如 Python)控制 GPU 處理模型。
考慮分布式計算。分布式計算意味著有多臺機器分別處理任務。但是這種方法并不適用于所有的機器學習技術。
使用云計算實現(xiàn)可擴展化。如果你的模型需要處理高峰值客戶相關數(shù)據(jù),使用云計算可以快速實現(xiàn)可擴展化。對于需要內(nèi)部處理數(shù)據(jù)的公司,私有云的基礎架構是值得考慮的。
下一步
在如此多的選擇下,很容易迷失在各種可用的解決方案中。它們在算法上有所不同,所需的技能也不同,所以最終處理任務的結果也會不同。
對于這個年輕的市場,這種情況是非常常見的。即使是我們前面談到的三個領先解決方案,也不是完全處于相互競爭狀態(tài)。更重要的是,服務變化的速度常常出人意料。很可能當你堅持使用一個供應商的解決方案時,另一個供應商突然推出一些符合你業(yè)務需求的服務。
正確的做法是盡可能早的想清楚你打算用機器學習實現(xiàn)什么。這其實并不容易。如果你缺乏數(shù)據(jù)科學或者專業(yè)領域指示,那么在數(shù)據(jù)科學和商業(yè)價值之間的橋接就非常棘手。這通常是將一般化問題簡化為單一屬性的問題。無論是價格預測還是其他的數(shù)值,確定對象的類別還是將對象分組,一旦找到需要解決的屬性,決定供應商并選擇其所提供的服務就變得簡單起來了。
DCVC 創(chuàng)始合伙人 Bradford Cross 認為,ML-as-a-Services 不是一個可行的商業(yè)模型。根據(jù)他的說法,這個模式定位在了使用開源產(chǎn)品的數(shù)據(jù)科學家和想要購買全套服務的商業(yè)高管之間的空白處。然而,目前業(yè)界似乎正在克服該模式長期存在的問題,最終我們會看到更多公司轉(zhuǎn)向使用 ML-as-a-service 這種商業(yè)模式,以避免招聘工資高昂的數(shù)據(jù)科學家,并仍然能夠使用足夠多功能的數(shù)據(jù)工具。
Via kdnuggets
雷鋒網(wǎng) AI 研習社編譯整理
雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。