0

編輯 | 青暮
面對多樣化算力供應的需求,曙光智算早就做好充足準備,比如,曙光智算已經為許多大型企業提供AI應用的支撐。
靈活而多樣的算力配置是復雜的數學問題,但曙光智算卻化繁為簡,只對外提供即插即用式的接口,這正是「智算+」API新模式。
「智算+」API新模式,依托于曙光智算API接口。基于該API接口,AI研究人員無需任何算力配置的專業知識,便可輕松接入資源龐大的曙光計算服務平臺,實現AI模型訓練、推理等操作,從而加快、簡易化整個研發流程。
無界的兩大含義——向內多樣化、向外簡易化,被「智算+」API詮釋透徹。

圖注:曙光智算服務架構
通過開放API,曙光智算可為SAAS服務提供商、應用軟件提供商、第三方算力服務商提供多樣化的算力服務,分別對應3種集成模式:
首先是平臺集成。該模式主要面向第三方算力服務商,具體來說是,基于曙光智算AC平臺服務和「智算+」API,將第三方算力服務商平臺入口集成到曙光統一服務平臺(AC平臺),底層使用曙光自運營算力。
AC平臺將多個智能計算中心通過數據互聯互通,從而進行跨中心的管理和調度,并以API或非API的形式對外服務。
其中,智能計算中心采用專有的調度引擎,來協同計算資源。所謂調度也就是對于特定的問題,選擇不同的建模(比如SVM、CNN等)和計算方式(比如BLAS、AVX等并行模式)。
其次是應用集成。該模式主要面向應用軟件提供商,為包含多個軟件的應用商城提供強大而靈活的算力。具體來說是,將第三方應用部署到曙光智算現有算力資源中,并依托平臺監控管理模塊對應用程序進行管理、調度、性能監控、提供優化指導等。
目前應用商城已經集成海量商業應用Portal和開源應用軟件,比如人工智能類軟件包括了TensorFlow、PyTorch等深度學習框架,以及Hadoop、Spark等數據分析框架。
例如在人工智能領域,百度飛槳與曙光智算合作,已實現「智算+」API與Paddle2.x的適配,國產X86及其加速卡版作為常用分支合入官方GitHub倉庫,支持安裝包直接安裝,實現與GPU的API接口統一。此外,通過將「智算+」API對接AI Studio,百度飛槳還可為開發者提供人工智能學習、實訓、比賽的算力資源。
曙光智算還助力復旦大學類腦智能科學與技術研究院,構建并利用多模態多尺度腦數據庫,發展了模式識別、深度學習等類腦智能方法。其中,「智算+」API為研究院提供了數百獨占節點+上千個動態節點,協助完成了從CUDA生態到國產異構加速生態的代碼遷移、應用優化等工作。

在AI領域中,深度學習盛行的當下,人工智能近乎有了一致的數學語言,同時也就有了更加靈活的協同效應,而耦合與解耦的協同也在深度學習領域發揮重要作用。比如在一般的全連接神經網絡自身效率不高時,就要通過內部“橫向耦合”來深入地探索合適的機制,最終具有更強適應性的Transformer架構脫穎而出。之后,與數據、任務等要素“縱向解耦”,Transformer成為如今適用多種任務的大模型的標配,并且不僅僅限于類人智能,蛋白質結構預測等科學計算任務亦被證實利用Transformer是可行的,基于Transformer的大模型也在通用AI的探索路徑上被寄予厚望。
可以說,AI的技術演變如今也呈現向內多樣化、向外簡易化的模式。
同樣,算力的耦合與解耦的協同也在曙光智算的設想之中。基于這種協同作用,并憑借20多年的從業經驗、統一和商業化的運營模式、豐富的多類型資源、超高速的計算/存儲網絡、安全的設計標準,曙光智算將打造算力的“無界”生態。
首先,AC平臺將不同的智能計算中心進行內部“橫向耦合”,如同調整神經網絡中錯綜復雜的連接和激活機制一般,通過深度的融合來得到“強適應的Transformer”,也就是規劃出多樣的算力配置方案,體現資源無界優勢;其次,「智算+API」則像經過千錘百煉的Transformer模型,以“好用、通用黑箱”的、“縱向解耦”的方式,最大限度推動硬件資源、算力網絡、算法應用之間的協調適配,以實現計算價值最大化,體現技術無界優勢。
最后,在資源無界、技術無界的推動下,曙光智算得以打造全產業鏈共享的算力生態,以“零門檻”方式最大限度接入產業鏈上下游相關方,破除信息孤島,推動打造超連接、共進化的無界生態系統,實現無界生態的持續創新、升級。
「智算+」API新模式,詮釋了曙光智算的算力“無界”的終極奧義,從資源、技術、生態三個層面構建“開放無界”的算力平臺,引領計算產業邁入互利共贏的新時代。
雷峰網(公眾號:雷峰網) 雷峰網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。