成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能 正文
    發(fā)私信給李尊
    發(fā)送

    4

    最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    本文作者: 李尊 2016-09-18 18:38
    導(dǎo)語(yǔ):KDnuggets算法調(diào)查,最新數(shù)據(jù)科學(xué)家使用的十大算法。

    導(dǎo)讀:本文來(lái)自于KDnuggets所做的十大算法調(diào)查,對(duì)于數(shù)據(jù)工程師常用的算法進(jìn)行排名,并對(duì)其在2011-2016年間的變化進(jìn)行介紹。

    最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    基于調(diào)查,KDnuggets總結(jié)出了數(shù)據(jù)科學(xué)家最常使用的十大算法,它們分別是:

    1. Regression 回歸算法

    2. Clustering 聚類(lèi)算法

    3. Decision Trees/Rules 決策樹(shù)

    4. Visualization 可視化

    5. k-Nearest Neighbor 鄰近算法

    6. PCA (Principal Component Analysis) 主成分分析算法

    7. Statistics 統(tǒng)計(jì)算法

    8. Random Forests 隨機(jī)森林算法

    9. Time series/Sequence 時(shí)間序列

    10. Text Mining 文本挖掘

    最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    其中,受訪者表示平均使用了8.1個(gè)算法,相比2011年類(lèi)似的調(diào)查大幅提高了。

    與2011年的類(lèi)似調(diào)查對(duì)比我們發(fā)現(xiàn)最流行的算法還是回歸算法、聚類(lèi)算法、決策樹(shù)和可視化。相對(duì)來(lái)說(shuō)最大的增長(zhǎng)是由 (pct2016 /pct2011 - 1) 測(cè)定的以下算法:

    • Boosting,從 2011 年的 23.5% 至 2016 年的 32.8%,同比增長(zhǎng) 40%

    • 文本挖掘,從 2011 年的 27.7% 至 2016 年的 35.9%,同比增長(zhǎng) 30%

    • 可視化,從 2011 年的 38.3% 至 2016 年的 48.7%,同比增長(zhǎng) 27%

    • 時(shí)間序列,從 2011 年的 29.6% 至 2016 年的 37.0%,同比增長(zhǎng) 25%

    • 異常/偏差檢測(cè),從 2011 年的 16.4% 至 2016 年的 19.5%,同比增長(zhǎng) 19%

    • 集成方法,從 2011 年的 28.3%至 2016 年的 33.6%,同比增長(zhǎng) 19%

    • 支持向量機(jī),從 2011 年的 28.6% 至 2016 年的 33.6%,同比增長(zhǎng) 18%

    • 回歸算法,從 2011 年的 57.9% 至 2016 年的 67.1%,同比增長(zhǎng) 16%

    另外,2016年最流行的新算法分別是:

    • K-近鄰,46%

    • 主成分分析,43%

    • 隨機(jī)森林算法,38%

    • 優(yōu)化,24%

    • 神經(jīng)網(wǎng)絡(luò) - 深度學(xué)習(xí),19%

    • 奇異值分解,16%

    下降最多的分別是:

    • 關(guān)聯(lián)規(guī)則,從 2011 年的 28.6% 至 2016 年的 15.3%,同比下降 47%

    • 增量模型,從 2011 年的 4.8% 至 2016 年的 3.1%,同比下降 36%

    • 因素分析,從 2011 年的 18.6% 至 2016 年的 14.2%,同比下降 24%

    • 生存分析,從 2011 年的 9.3% 至 2016 年的 7.9%,同比下降 15%

    不同領(lǐng)域使用的算法比例

    最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    我們注意到幾乎所有人都在使用監(jiān)督學(xué)習(xí)算法

    政府和工業(yè)界數(shù)據(jù)科學(xué)家比學(xué)生或者學(xué)術(shù)研究院使用更多不同的算法,而且工業(yè)界數(shù)據(jù)科學(xué)家更傾向于使用元算法。

    下面,我們繼續(xù)通過(guò)雇員的類(lèi)型來(lái)分析最流行的10個(gè)算法和深度學(xué)習(xí)。

     最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    為了讓這些差異更容易觀看,我們針對(duì)特定雇員類(lèi)型相關(guān)的平均算法使用量設(shè)計(jì)了一個(gè)算法。

    Bias(Alg,Type)=Usage(Alg,Type)/Usage(Alg,All) - 1.

    最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    我們注意到:

    • 工業(yè)界數(shù)據(jù)科學(xué)家更傾向于使用回歸算法、可視化、統(tǒng)計(jì)算法、隨機(jī)森林算法以及時(shí)間序列

    • 政府/非盈利組織更傾向于使用可視化、主成分分析算以及時(shí)間序列

    • 學(xué)術(shù)界研究人員更傾向于使用主成分分析算法和深度學(xué)習(xí)

    • 學(xué)生一般使用的算法較少,但是它們會(huì)做更多的文本挖掘以及深度學(xué)習(xí)

     另外,參與投票的讀者主要來(lái)自于

    • 美國(guó)/加拿大, 40%

    • 歐洲, 32%

    • 亞洲, 18%

    • 拉丁美洲, 5.0%

    • 非洲/中東, 3.4%

    • 澳大利亞/新西蘭, 2.2%

    在 2011 年的調(diào)查中,我們將產(chǎn)業(yè)/政府分在了同一組,將學(xué)術(shù)研究人員/學(xué)生分在了第二組,另外通過(guò)算法對(duì)于業(yè)界/政府的“親切度”進(jìn)行了計(jì)算:

    N(Alg,Ind_Gov) / N(Alg,Aca_Stu)

    ------------------------------- - 1

    N(Ind_Gov) / N(Aca_Stu)

    親切度為 0 的算法表示其在產(chǎn)業(yè)/政府和學(xué)術(shù)研究人員/學(xué)生之間的使用情況對(duì)等。IG親切度越高表示該算法越被產(chǎn)業(yè)界普遍使用,反之越“學(xué)術(shù)”。 

    其中,最“產(chǎn)業(yè)”的算法是:

    • 增量模型Uplift modeling,2.01

    • 異常檢測(cè)Anomaly Detection,1.61

    • 生存分析Survival Analysis,1.39

    • 因子分析Factor Analysis,0.83

    • 時(shí)間序列Time series/Sequences,0.69

    • 關(guān)聯(lián)規(guī)則Association Rules,0.5

    其中增量模型Uplift modeling又一次成了最“產(chǎn)業(yè)”的算法,但是令人驚訝的是其使用率確很低—只有3.1%,幾乎是這次調(diào)查中使用率最低的算法。

    最“學(xué)術(shù)”的算法是:

    • 神經(jīng)網(wǎng)絡(luò)Neural networks - regular, -0.35

    • 樸素貝葉斯Naive Bayes, -0.35

    • 支持向量機(jī)SVM, -0.24

    • 深度學(xué)習(xí)Deep Learning, -0.19

    • EM, -0.17

    下圖是所有算法以及它們?cè)诋a(chǎn)業(yè)界/學(xué)術(shù)界的親切度:

    最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    數(shù)據(jù)科學(xué)家最常使用的算法 工業(yè)界 vs 學(xué)術(shù)界

    2016數(shù)據(jù)科學(xué)家使用的算法調(diào)查匯總

    匯總表格中各項(xiàng)含義分別是:

    • N:根據(jù)使用度排名

    • Algorithm:算法名稱(chēng),

    • 類(lèi)型:S - 監(jiān)督,U - 無(wú)監(jiān)督,M - 元,Z - 其他,

    • %指代調(diào)查中使用這種算法的調(diào)查者比例

    • Change—變動(dòng)(%2016 年/2011% - 1),

    • Industry Affinity—產(chǎn)業(yè)親切度(前文中提到)

    最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    本文由雷鋒網(wǎng)獨(dú)家編譯,未經(jīng)許可拒絕轉(zhuǎn)載!

    via KDnuggets

    題圖來(lái)子Data Scientists at Work

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

    最新出爐——數(shù)據(jù)科學(xué)家最常使用的十大算法

    分享:
    相關(guān)文章
    當(dāng)月熱門(mén)文章
    最新文章
    請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
    姓名
    電話
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說(shuō)