0
“我們總是高估未來2年會發生的改變,低估了未來10年將發生的變化。”比爾蓋茨這句名言用到如今的高性能計算(HPC)領域再貼切不過.
十年前,誰能想到高性能計算能夠讓普通人在智能手機上就能點外賣,電影大片的特效渲染也需要高性能計算的加持。
十年前,幾乎沒有人能料想到英偉達和高通在2022年發布的智能汽車芯片AI算力能高達2000T,未來的智能汽車將是“裝了四個輪子的超級計算機”。
高性能計算的應用早已不再局限于天氣預測、藥物研發、油田分析等少數應用,如今的高性能計算正在進入次世代,應用的領域不僅更加廣泛,與普通人的生活聯系的也更加緊密。
新思科技研究團隊早在幾年前就預測,高性能計算和云將會被用于多種不同類型的應用中,無論大小。
在AI、元宇宙、智能汽車等諸多技術和應用的推動下,面對越來越大的芯片和越來越復雜系統,高性能計算的計算、存儲、網絡挑戰應該如何解決?
最近幾年,高性能計算受到越來越多的關注。新冠疫情下,高性能計算對于疫苗和藥物的研發發揮了重要的作用。越來越智能的汽車也依賴算力的大幅度提升。還有近兩年備受關注的元宇宙,也需要高性能計算作為支撐。
而這些大大小小的應用,也正是推動高性能計算進入下一個時代的動力。知名市場分析機構Mordor Intelligence在2021年的一份報告中指出,高性能計算市場在2020年到2025年預計將以每年6%以上的速度增長。
高性能計算的主要作用其實就是為數據中心的運行提供所需的計算能力。
過去,數據中心處理的數據只是某個特定組織業務運營的輸出,通過對由人機交互生成的大量數據進行測量、推理或分析實現更高商業價值,比如藥物研發和油田分析。
如今,數據不再由人類實踐所生成,比如,一輛自動駕駛汽車每行駛1小時可以生成5TB的數據,隨著自動駕駛汽車數量的增多,產生的數據量也將十分驚人。研究型數據統計公司Statista預計,2010年全球的數據量為2ZB,這一數據在2025年將增長至181ZB,數據正在以超乎想象的速度增長。
數據生成方式發生根本性轉變的同時,數據處理和存儲技術近十年間也發正了變革。這進一步引發了數據中心架構的重大變化,分布式網絡應運而生。
CPU已經不能滿足數據爆炸式增長帶來的計算需求,需要性能更強的專用處理器。同時,新的數據中心架構對于通信性能的要求也大幅提升,獨立網卡(NIC)和服務器機架上的架頂式交換機的性能和延遲,對于在數據中心內部高效移動數據而言也不再適用。
數據爆發對于存儲技術和容量帶來的挑戰,也需要創新性技術滿足云計算和高性能計算的需求。IDC預測,從2020年到2025年,全球存儲容量將以每年19.2%的速度增長。
新的應用確實在推動高性能計算進入次世代,但在摩爾定律放緩的背景下,高性能計算無論是提升計算性能,還是降低通信延遲和實現存儲技術創新,都面臨著諸多挑戰。
過去幾十年間,得益于摩爾定律,芯片的性能持續快速提升。然而,先進的制程正在接近物理極限,這一方面讓依靠先進制程提升單芯片性能的難度和復雜度越來越高。另一方面,想要將小芯片集成到單個系統中也帶來了復雜性和設計的挑戰。
這就意味著,無論采用何種方式提升計算性能,都同樣面臨著更高復雜度的設計挑戰。
先看提升單芯片性能面臨的挑戰,單芯片性能的提升正在將裸片尺寸推向制造工藝的極限,這就不僅要克服單芯片設計規模的挑戰,還面臨整體成本增加的問題。
3DIC Complier是一個不錯的解決方案,它可以將設計分解為多個集成芯片設計。要使用3DIC Complier設計性能強大的芯片,從一開始,開發者就需要使用新思科技的3DIC Compiler 等工具進行更多的早期版圖規劃和基于封裝的信號完整性分析。
3DIC Compiler是統一的多裸晶芯片設計實現平臺,不僅效率高,還能擴展容量和性能,為各種異構工藝和堆疊裸片提供無縫支持。
新思科技已經與臺積電緊密合作,無縫集成了基于臺積公司3DFabric技術的設計方法, 為客戶提供完整的“初步規劃到簽核”的設計平臺,能夠滿足芯片開發者對性能、功耗和晶體管數量密度的要求。
為應對不斷增長的單芯片設計規模的挑戰,開發者則需要使用像新思科技的Fusion Design Platform,這一平臺能讓芯片開發者在不斷增加的計算內核上進行操作,并且這些工具能在云環境中使用。在云環境中,開發者可以訪問成千上萬的計算資源,這對提升芯片的整體性能以及加快上市時間有重要意義。
今年,新思科技也和三星達成合作,通過Fusion Design Platform提供經認證的數字實現、時序和物理簽核參考流程,開發者可以利用新思科技平臺的自動化功能和集成優勢來提高工作效率,并在三星的先進工藝節點上最大限度地提高PPA,還能加速高性能計算芯片的設計。
Arm也已利用新思科技的Fusion Design Platform和Verification Continuum Platform,實現了Neoverse V1和N2云端到邊緣基礎設施內核的快速開發和理想PPA指標,加快了高性能計算和AI應用領域中基于Arm的產品上市時間。
提升單芯片性能的設計難度,以及先進制程帶來的高成本都是大部分芯片設計公司難以承受的。從系統的角度看,下一代高性能計算架構將出現分解架構和異構系統的爆炸式增長,不同的專用處理架構將集成在單個節點中,在模塊之間實現精密、靈活的切換。
于是,將不同性能和功能的芯片封裝在一起的小芯片技術受到歡迎,Die-to-Die接口對于不受封裝成本和裝配限制的高性能計算應用SoC非常有吸引力。
小芯片的設計可以根據應用需求集成各種小芯片和IP資源,但即使是較大的公司也負擔不起所有IP的開發費用,采購第三方IP可以節省時間和金錢,是更理想的選擇。
作為全球頂級的IP提供商,新思科技提供一系列Die-to-Die IP,包括UCIe和基于SerDes的PHY和控制器。
一邊提升單芯片的性能,一邊通過小芯片的設計不斷提升性能,高性能計算在解決計算挑戰的同時,還需解決網絡和存儲的挑戰。
用于大數據處理、模擬和預測的模型越來越復雜,推動了對更高計算能力和更大存儲容量,以及更低網絡延遲的需求,這是一個全面硬實力的考驗。
據估算,數據中心的運行和冷卻服務器的用電各占約40%,20%的用電用于存儲和網絡。只有同時解決新型數據中心計算、存儲和網絡的挑戰,才能邁入高性能計算的新時代,實現數據中心的碳中和。
高性能計算要實現性能提升,就要求數據網絡和設備接口需要增加帶寬滿足計算和存儲節點間的數據傳輸需求。這給高性能計算的存儲系統帶來了包括帶寬、容量、延遲、安全性、訪問管理、功率等諸多挑戰。
十年前,人們對于帶寬需求的估計很低,大概是現在的一半甚至三分之一。但如今,全球對帶寬的需求以前所未有的速度增長,以太網正在成為數據中心高性能計算的選擇。以太網、PCIe和其它接口技術都在逐漸增加帶寬以滿足需求,以太網正在從100Gbps過渡到800Gbps。
雖然訪問支持10Gbps到800Gbps以太網的各種配置的IP很重要,但SoC開發者也在尋找能夠提供更多差異化的解決方案,比如可根據特定設計需求進行配置的最低延遲以太網IP;能夠縮短上市時間的集成MAC、PCS和PHY的解決方案等。
作為業界為數不多能夠提供高性能計算端到端解決方案的公司,新思科技也有高質量的IP解決方案幫助開發者應對網絡挑戰。
新思科技全面的112G以太網PHY解決方案結合了自身的布線可行性研究、封裝基板指南、信號和電源完整性模型以及深入的串擾分析,可實現快速可靠的SoC集成。112G以太網PHY是新思科技面向高性能計算應用的綜合IP產品組合的一部分,除此之外還包括廣泛使用的協議如PCI Express 、DDR、HBM、Die-to-Die、CXL和 CCIX。
網絡性能的提升的同時,存儲設備上的數據接口速度也在提高,NVMe SSD采用PCIe 5.0和6.0,傳輸速率可以達到32Gbps和64Gbps。
與提升產品性能一樣重要的,是對芯片全生命周期的追蹤,特別是高性能計算這樣對芯片品質、安全性和可靠性要求極高的應用。生命周期管理(SLM)的出現,讓設備運作的一整個生命周期都可持續提供資料反饋和優化,幫助開發者設計出更優秀芯片。
SLM很可能會改變整個先進工藝設計領域的游戲規則,新思科技也將發揮重要作用。得益于在TEST和DFT領域豐富的經驗和強大的實力,新思科技建立了SLM平臺,并且,新思科技還將SLM平臺與領先的EDA和IP技術相整合,建構了完整的一體化平臺,幫助芯片設計團隊最大化芯片的PPA,加速產品上市。
另外,一些額外的存儲技術也能滿足次世代高性能計算的需求。比如持久內存技術、遠程直接內存訪問(RDMA)和RoCE、NVMe-oF、計算存儲。
新思科技與業界一起解決高性能計算的存儲挑戰,提供廣泛的高性能IP產品組合,例如DDR、HBM、以太網和PCIe PHY和控制器、ARC處理器以及設計工具。
一個很好的例子是,Socionext采用了新思科技的HBM2E IP,運行速度為3.6Gbps的HBM2E IP,滿足了Socionext創新AI引擎和加速器片上系統(SoC)對于容量、功耗和計算性能的嚴苛要求,成功將5nm工藝HBM2E IP部署于AI和高性能計算SoC。
人們常說,科技改變生活。芯片作為技術革命底層的支撐,一直在影響著科技未來的走向。隨著高性能計算的持續發展,以及高性能計算更加廣泛的應用,我們將迎來更加智能的生活,體驗到云計算帶來的數字化普及帶來的便利,智能汽車帶來的全新體驗,以及元宇宙的全新世界。這一切的背后,新思科技高性能計算端到端的全面解決方案,以及高效、安全的IP和工具,更是支撐高性能計算進入新時代的關鍵。
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。