3
| 本文作者: 包永剛 | 2018-10-12 13:59 |
在10月10日開幕的華為2018全聯接大會上,華為輪值董事長徐直軍代表華為發布了AI發展戰略與全棧全場景AI解決方案,雷鋒網《華為ALL in Al:全面公布AI戰略及全棧全場景解決方案,AI芯片將不單獨對外銷售》一文做了詳細報道。華為這樣的重磅玩家All in AI讓本來就熱鬧的AI賽道的競爭變得更加激烈,不過在芯片層面最先受傷的可能是華為海思如今的AI合作伙伴寒武紀。
對于華為的全棧全場景AI解決方案,徐直軍這樣解釋:“我們提出的全場景,是指包括公有云、私有云、各種邊緣計算、物聯網行業終端以及消費類終端等部署環境。我們說的全棧是技術功能視角,是指包括芯片、芯片使能、訓練和推理框架和應用使能在內的全堆棧方案。”

兩款AI芯片——Ascend 910和Ascend 310
在華為的全棧全場景AI解決方案中,最底層可能也是此次最受關注的就是華為最新發布的兩款AI芯片——Ascend 910和Ascend 310。Ascend是華為全新的芯片產品線,中文名為昇騰,相比不久前引發熱議的阿里巴巴“平頭哥”,雖然在命名上華為沒有奪人眼球,但昇騰系列有針對不同場景的最優TOPS/W的不同產品。
徐直軍現場展示了一款已經商用的昇騰310 mini,而針對智能手機、智能附件、智能手表的Ascend-Lite、Ascend-Tiny、Ascend-Nano將在2019年第二季度商用。
會后,徐直軍接受雷鋒網等媒體采訪時表示:“昇騰310更多是用在邊緣計算產品上,但也可以用在云端,昇騰910更多是用在云端,提供強大的AI訓練算力。昇騰310的Lite、Tiny、Nano主要是用于物聯網、行業終端和智能手機、智能穿戴等消費終端,以IP方式跟其他芯片結合在一起服務于各個產品。”也就是說,華為并不會單獨銷售這兩款AI芯片,而是以芯片為基礎開發AI加速模組,AI加速卡,AI服務器,AI一體機,以及面向自動駕駛和智能駕駛的MDC(Mobile-DC)進行銷售。

當然,徐直軍也表示:“一個企業不可能擁有一個完整供應鏈,華為兩款AI芯片也不可能完全自己研發,不可能不依賴于第三方和合作伙伴。”對于一款芯片的研發,由于工藝制程已經到了7nm,設計的復雜性往往會讓設計廠商自主研發核心的IP,同時也采購第三方的IP,保證自主研發可控的前提下也能夠更快效率推出芯片。
受傷的寒武紀?

不過,華為具備AI功能的首款芯片是2017年發布的麒麟970,也被華為稱為首款人工智能移動計算平臺。余承東提及970主打的AI模塊用詞說的是"華為NPU",PPT中也寫的是"Kirin NPU"。發布會后中國科學院計算技術研究所給華為發去賀信,賀信寫到麒麟970芯片集成寒武紀1A處理器作為其核心人工智能處理單元(即余承東總在發布會中所述NPU),實現了手機上本地、實時、高效的智能處理。
對此,華為回應稱華為和寒武紀團隊共同面向終端,在 AI 方面進行了聯合開發與優化,NPU是麒麟970異構計算的一部分,華為對麒麟970異構系統中的每個處理器都非常重視,在CPU、GPU、ISP、DSP上都投入了重要力量進行技術開發和探索,投入大量力量進行優化,力求帶來最好的效果。可見華為海思并不愿多談與寒武紀的合作,與華為海思不同,寒武紀倒是在其官網上明確寫出2017年集成寒武紀1A處理器的世界首款人工智能手機芯片華為麒麟970正式發布并在華為Mate 10手機中投入大規模商用。
今年八月底,余承東發布了麒麟系列的新一代旗艦處理器麒麟980,搭雙核NPU。有報道稱,麒麟980并未搭載此前謠傳的寒武紀最新一代1M IP,而是采用麒麟970搭載的1A優化版本1H,加上雙核,圖像識別速度提升了220%。麒麟980芯片相關負責人表示原本他們是不打算做宣傳的,而是靠口碑營銷,因為“消費者只要用了就知道有多好”。
當然,華為海思確實也是這么做的,華為麒麟公眾號推送的文章在麒麟980 AI能力時更多的是從AI性能提升及應用的角度去介紹,并未對雙核NPU多做介紹。
大膽推測,麒麟900系列處理器集成寒武紀IP只是一個過渡方案,隨著昇騰系列IP以及達芬奇架構(Da Vinci)的正式發布,麒麟900系列處理器很快將集成自家的昇騰IP而非寒武紀的NPU,這或許也是華為為何一直不太愿意多說麒麟970和麒麟980里的寒武紀NPU。
雷鋒網的猜想也并非完全沒有道理,在接受采訪的時候,徐直軍表示:“構建新的達芬奇架構來支持我們的人工智能芯片是基于我們對人工智能的理解自然產生。我們開創性的達芬奇架構支持從云端到邊緣端,不同物聯網終端場景的人工智能需求,從極致的低功耗需求到極致的大算力需求全覆蓋。現在我們還沒有看到市場上有其它架構能夠做到這一點。”
華為首席網絡架構師黨文栓也表示:“我們設計這個芯片的時候從開始就考慮到要全場景輻射,這是我們不二選擇。”
在昇騰310芯片系列里,Ascend-Lite就是針對智能手機的IP,因此無論從成本還是昇騰處理器發展的角度來看,寒武紀NPU被麒麟900系列處理器棄用應該只是遲早的事情。但對于寒武紀這家中國大名鼎鼎的獨角獸來說,華為是其目前已知的最重要的終端客戶,如果遭到華為的棄用,結果將如何?
合作伙伴終變競爭對手

在10月10日的華為全聯接大會上徐直軍指出:“昇騰910是計算密度最大的單芯片,采用7nm工藝制程,最大功耗為350W,半精度為(FP 16)256 Tera FLOPS,比Nvidia V100的125 Tera FLOPS還要高出近1倍。若集齊1024個昇騰910,將會出現迄今為止全球最大的AI計算集群,性能也將達到256個P,不管多復雜的模型都能輕松訓練。”
昇騰910或許會是寒武紀更為感到不安的產品,為什么這么說?今年5月,寒武紀發布首款云端智能芯片 Cambricon MLU100 和板卡產品,實現了AI IP從終端到云端的布局。MLU100采用MLUv01架構,基于16nm工藝,平衡模式下等效理論峰值速度達每秒128萬億次定點運算,高性能模式下等效理論峰值速度達每秒166.4萬億次定點運算,典型板級功耗為80瓦,峰值功耗不超過110瓦。
可見,無論是在制造工藝還是性能上,寒武紀的產品都沒有優勢,要知道在對算力渴望程度極高的AI領域,高算力低功耗的芯片更加受到追捧。更為嚴峻的是,寒武紀能提供的是AI板卡,華為也能提供,同時還有全棧解決方案。黨文栓在回答媒體AI投資回報的問題時就表示:“全棧解決方案更能進一步加速投資回報周期,全棧解決方案意味擁有的完整能力支撐企業級關鍵任務應用場景,而且全棧的開放性、互動性的可以更好服務企業,未來也能提供更好的選擇。”
我們知道,AI的發展讓更多的公司意識到芯片與算法更加緊密結合的重要性,因此AI時代,芯片與其上層相關的工具、框架、應用都將會有更緊密的結合。從這個角度來看,像華為這樣的全棧解決方案提供商相比寒武紀具有明顯地優勢。雷鋒網了解到,雖然微軟并未開始大規模采購華為的AI芯片或者AI服務器,但華為確實和微軟有接觸。當然,寒武紀和中科曙光也有著合作相當緊密,二者利用寒武紀架構打造出針對推理應用優化的服務器。
至此不難發現,麒麟900系列處理器棄用寒武紀NPU應該是遲早的事情,并且無論是偏向終端的昇騰310還是云端的昇騰910,華為和寒武紀都會成為競爭關系。當然,這并不意味著在AI市場只能容得下華為或寒武紀,AI是伴隨物聯網發展的一個技術,因此AI也將被應用到非常豐富的應用當中,有實力的AI企業相信最終都能找到合適的生存空間。

只不過,華為與寒武紀,恰好代表了AI市場里兩類典型的玩家,一個規模巨大具有生態優勢的大玩家,另一個因AI浪潮而生有自己的技術優勢新勢力,他們的發展都代表了一類AI企業。那么,最終結果會如何?
相關文章:
傳華為推薦微軟在數據中心使用其AI芯片,自研GPU終于要面市?
華為ALL in Al:全面公布AI戰略及全棧全場景解決方案,AI芯片將不單獨對外銷售
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。