0
全球高性能CPU市場又增加了一個重磅玩家。
2021年10月19日云棲大會,阿里巴巴旗下半導體公司平頭哥發布自研為云而生的高性能CPU倚天710,同時還推出搭載倚天710的“磐久”云原生服務器。這是繼2018年云棲大會發布的含光800云端AI推理芯片之后,平頭哥最新的自研芯片,也表明其自研高性能芯片的設計能力從專用AI芯片走向了通用CPU芯片。

阿里云智能總裁、達摩院院長張建鋒
雷鋒網了解到,倚天710采用最新的Armv9架構,基于最先進的5nm工藝,單芯片集成600億晶體管,CPU核心數高達128個,最高主頻為3.2GHZ。倚天710不僅是全球首款采用5nm工藝的服務器芯片,也集成了最新的內存DDR5和PCIE5.0。

也就是說,從架構到制造工藝,從CPU核心到內存和接口,倚天710都擁有當下CPU最先進的技術。
標準測試集SPECint2017的數據顯示,倚天710的分數達到440,超出業界標桿20%,能效比提升50%以上。

阿里花費數億美元打造一款高性能CPU的價值和目的何在?
倚天710集最先進技術于一身
概括倚天710的特性,那就是集先進技術于一身。
先看最底層指令集架構,倚天710采用的是Arm今年三月才發布的面向新十年的Armv9架構。根據Arm發布的產品,雷鋒網預計倚天710采用的是Arm Neoverse N2核心,兼具性能和能效。
一般而言,Arm只會為其最新的架構選擇少數幾家合作伙伴,阿里平頭哥作為首個宣布采用Armv9架構的公司,不僅顯示了雙方在合作上的深入,也能體現出平頭哥在芯片設計領域的能力。
基于最新的指令集,倚天710包含了高達128個核心。之所以說是高達,是因為今年3月AMD發布的最新一代服務器CPU EPYC,最高為64核128線程,4月英特爾發布的第三代至強可擴展處理器,核心數是40核。
與倚天710核數更為接近的,是同樣采用Arm架構的Ampere(安晟培)在2020年投產的80核云原生服務器CPU Ampere Altra。Ampere的128核CPU計劃在今年第三季度投產,同樣采用5nm工藝。

倚天710即將在阿里云數據中心部署,然后逐步服務云上企業。
再從底層架構轉向制造工藝,倚天710采用的是5nm工藝,這一節點已經被應用于蘋果A15芯片,但倚天710是首個采用5nm工藝的服務器CPU。最新的架構加上最新的工藝,自然會對芯片設計的能力有較高要求。
但相比之下,解決上百個核心帶來的帶寬瓶頸更考驗平頭哥。過去數年間,處理器核心性能的提升速度遠超帶寬的性能提升速度,這限制了CPU計算性能的提升,就像是“茶壺里面倒餃子”。
據悉,為了解決帶寬瓶頸,平頭哥對片上互聯作了特殊優化,采用新的流控算法,降低系統反壓,有效提升了系統效率和擴展性,使單核高性能有效地轉化為整個系統的高性能。
另外,倚天710通過新的系統地址到DRAM地址的轉換機制,支持安全、非安全隔離、多NUMA、異常通道隔離多種特性,同時DRAM讀寫效率大幅度提升。
除了從芯片設計的前端進行優化,倚天710在后端物理實現方面也克服了諸多挑戰,包括靈活調度多達30種不同EDA軟件、深度定制時鐘網絡和定制IP技術。
倚天710還采用了先進封裝技術,集成業界最領先的內存DDR5和接口PCIE5.0技術,有效提升芯片的傳輸速率,并且可適配云的不同應用場景,最終實現了性能和能效的優勢。
花費數億美元打造云CPU的價值
倚天710集成如此多先進技術,也意味著這款芯片的成本非常高昂。
市場研究機構International Business Strategies (IBS)的研究數據顯示,28nm之后芯片的成本迅速上升。28nm工藝的成本為0.629億美元,到了7nm和5nm,芯片的成本迅速暴增,5nm將增至4.76億美元。

來源BIS
芯片是一個典型需要以量取勝的行業,一款芯片從設計到制造,采用先進制程成本高達數億美元,只有芯片有足夠大的量,才能擁有成本優勢,這也是為什么只有手機這樣的產品才能持續采用最先進的制程。
倚天710作為一款阿里為云而定制的芯片,阿里明確表示不對外出售,這意味著其出貨量難以達到手機的數億量級。那么,從單顆芯片成本的角度看,平頭哥自研一款5nm的CPU芯片很難實現芯片的以量取勝。但如果從總體擁有成本和公司整體的競爭力來分析,自研高性能CPU有非常重要的價值。

IDC最新今年7月發布的2021年第一季度中國公有云市場數據顯示,季度內IaaS+PaaS市場規模達46.32億美元(301億人民幣),其中阿里云排名第一,市場份額為40%。另據Gartner 2021年報告,云基礎設施和平臺市場呈現穩固、集中格局,在全球范圍,超過90%的云市場向亞馬遜、微軟、阿里云、谷歌等前四家云廠商集中。
阿里云作為芯片的最大使用者之一,在全球建設了數百個云數據中心,能夠支撐阿里自研芯片。
但更重要的是,阿里云的競爭對手們也正在通過自研芯片來增強自身優勢。亞馬遜自研的Arm CPU已經展現出優勢,谷歌的TPU也已經在云中被廣泛使用。
這樣看來,阿里為云研發CPU和AI芯片成為其提供差異化服務,保持領導力的關鍵。
同樣,阿里自研芯片的優勢也已經展現,2020年10月30日開始,淘寶用戶的搜索請求均由含光800處理,其支持的淘寶主搜全鏈路吞吐率性能達到GPU性能的3倍左右。在杭州城市大腦的業務測試中,1顆含光800的算力相當于10顆GPU。
同時,基于對自身業務理解定制的AI芯片也能讓阿里云提供更多更好的AI云服務,比如圖像搜索、場景識別、視頻內容識別、自然語言處理等場景。
因此,無論從總體擁有成本,還是公司戰略的角度,自研芯片是阿里云的必然選擇。并且自研的芯片越早應用,自研芯片的決心越堅定,越有利于阿里云提供高性能,差異化的云服務,保持和提升領導力。
可以看到,倚天710從前端架構設計到后端物理實現都是自研,并且集成了最先進的技術。
阿里成芯片公司?
從2018年阿里平頭哥成立到現在,短短三年間阿里已經擁有了自研AI芯片含光800,自研云端CPU倚天710,還開發了十多款玄鐵系列嵌入式RISC-V指令集CPU IP核,累計出貨量超過25億顆。

這不禁讓人疑問,阿里是要取代現有的芯片公司了嗎?
答案是否定的,以阿里為代表的科技巨頭自研芯片的核心原因是市場上的芯片性能越來越難以滿足其包括AI在內的新興業務,以及提供差異化功能的需求。另外,最先進的CPU和GPU售價高昂,且功耗高,此時基于對自身業務的理解有針對性開發芯片成為了一個更好的選擇。
阿里云智能總裁、達摩院院長張建鋒表示:“基于阿里云‘一云多芯’和‘做深基礎’的商業策略,我們發布倚天710,希望滿足客戶多樣性的計算需求。我們將繼續與英特爾、英偉達、AMD等合作伙伴保持密切合作。”

對于第三方芯片公司來說,其業務的核心是盡可能多銷售芯片。
但對于阿里這樣的系統公司,直接為用戶提供系統級服務,芯片只是其提供更好、更具差異化服務的關鍵,銷售芯片并非其目標,既然如此,芯片的開發和應用策略和路徑和傳統芯片公司并不會相同。

比如,倚天710與飛天操作系統協同,能為云上客戶提供高性價比的云服務。還有,基于從云到端的芯片,阿里能夠更好的發展其AIoT生態,構建一個更強大的生態。
從處理器到服務器,再到操作系統,阿里正在從系統層級實現全面的自主,增強競爭力。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。