0
| 本文作者: 包永剛 | 2024-04-11 18:53 |

英特爾本周召開了年度Intel Vision大會(huì),大部分人會(huì)首先被比英偉達(dá)H100訓(xùn)練性能高70%,推理性能高50%,能效高40%,擁有TCO(總體擁有成本)的Gaudi 3吸引。
英特爾CEO帕特·基辛格發(fā)布Gaudi 3的時(shí)候也開心地跟隨現(xiàn)場(chǎng)伴奏搖晃起身體。
相比之下,Intel Vision上英特爾宣布將創(chuàng)建一個(gè)開放平臺(tái)助力企業(yè)推動(dòng)AI創(chuàng)新很容易被忽略。
但這才是英特爾在生成式AI時(shí)代分走蛋糕最有效的利器,只有擁有開放且繁榮的生態(tài),至強(qiáng)6、Gaudi3、酷睿Ultra、英特爾AI網(wǎng)絡(luò)連接卡才更容易備受青睞。
為什么開放生態(tài)是利器?
所有人都在說CUDA生態(tài)才是英偉達(dá)在AI領(lǐng)域里最強(qiáng)的護(hù)城河,這是英偉達(dá)耗費(fèi)近20年建立的龐大生態(tài)。
可是現(xiàn)在大多數(shù)程序員都在AI框架級(jí)別或者更高級(jí)別進(jìn)行編程,使用CUDA進(jìn)行低級(jí)編程已經(jīng)不那么普遍。
這就意味著,英偉達(dá)的軟件生態(tài)護(hù)城河已經(jīng)不像原來那樣堅(jiān)不可摧。開放生態(tài)是一個(gè)追趕甚至超越英偉達(dá)的機(jī)會(huì)。
“傳統(tǒng)模式中,幾家領(lǐng)導(dǎo)公司組建一個(gè)開放聯(lián)盟,各自有明確的分工,那時(shí)更多是一個(gè)選擇問題。”英特爾公司副總裁、英特爾中國(guó)軟件和先進(jìn)技術(shù)事業(yè)部總經(jīng)理李映說,“這一次基于AI大模型的變化,是第一次出現(xiàn)開放、開源和整個(gè)行業(yè)或者說和技術(shù)創(chuàng)新的爆發(fā)點(diǎn)結(jié)合在一起。現(xiàn)在開放、開源和閉源同時(shí)出現(xiàn)的時(shí)候,不是選擇,而是自然演變、發(fā)展的過程。”
開放、開源的生態(tài),將會(huì)對(duì)AI未來發(fā)展起到非常重要作用的趨勢(shì)已經(jīng)非常明顯。
這也讓所有人看到,區(qū)別于以往一個(gè)開放平臺(tái)或者聯(lián)盟成立的時(shí)候只有幾家聯(lián)盟成員,英特爾聯(lián)合Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick和Zilliz共同宣布,將創(chuàng)建的開放平臺(tái)宣布之時(shí)就有大量聯(lián)盟成員。

英特爾院士、大數(shù)據(jù)技術(shù)全球首席技術(shù)官、大數(shù)據(jù)分析和人工智能創(chuàng)新院院長(zhǎng)戴金權(quán)指出,“一個(gè)開放的生態(tài),可以讓同一個(gè)生態(tài)系統(tǒng)中的創(chuàng)新相互促進(jìn)。并且在同一生態(tài)里的新應(yīng)用場(chǎng)景可以互通。”
英特爾要構(gòu)建一個(gè)什么樣的AI開放生態(tài)?Intel Vision上基辛格給出的答案是企業(yè)AI。

根據(jù)cnvrg.io的調(diào)研結(jié)果,2023年,有10%的企業(yè)成功將其生成式AI項(xiàng)目產(chǎn)品化。Gartner預(yù)計(jì),2026年80%的企業(yè)將使用生成式AI。
這樣看來企業(yè)AI是一個(gè)確定性很高且潛力巨大的市場(chǎng)。
為企業(yè)AI構(gòu)建開放的生態(tài),需要包含三個(gè)方面:開放的軟件堆棧、開放的平臺(tái)、英特爾開發(fā)者云平臺(tái)。這也是一層層突破英偉達(dá)強(qiáng)大的AI生態(tài)壁壘。

“我們推出的開放聯(lián)盟去搭建面向企業(yè)AI的開放平臺(tái),能夠真正的幫助各個(gè)不同的RAG(檢索增強(qiáng)生成)組件中實(shí)現(xiàn)互聯(lián)互通,能夠?qū)崿F(xiàn)共同的努力,去構(gòu)建架構(gòu)藍(lán)圖這種的,保證在企業(yè)AI當(dāng)中,有一個(gè)整體的可工作的框架。”李映同時(shí)表示,
“英特爾開發(fā)者云平臺(tái)不僅能幫助開發(fā)者最早接觸到英特爾最新的硬件,更重要的是能夠保證各種開源框架、組件在一個(gè)環(huán)境中,能夠保證這種框架之間的兼容性,開發(fā)者能夠擁有更好的用戶體驗(yàn),提升開發(fā)效率。”
RAG對(duì)于企業(yè)AI來說至關(guān)重要。因?yàn)槟壳癆I模型比較通用,企業(yè)的數(shù)據(jù)與這些AI模型不太相關(guān),把企業(yè)的隱私數(shù)據(jù)和通用的模型結(jié)合在一起就變成了一個(gè)很大的挑戰(zhàn)。
“很多人都非常堅(jiān)定RAG可以解決企業(yè)的數(shù)據(jù)知識(shí)增強(qiáng)的問題。因?yàn)橛幸粋€(gè)開放的生態(tài)系統(tǒng),有一個(gè)類似的實(shí)施標(biāo)準(zhǔn)的平臺(tái),就很容易把數(shù)據(jù)中心級(jí)別的RAG系統(tǒng)運(yùn)行在企業(yè)的AIPC上,可以變成一個(gè)個(gè)人知識(shí)庫(kù)。”戴金權(quán)說。

英特爾公司市場(chǎng)營(yíng)銷集團(tuán)副總裁、中國(guó)區(qū)云與行業(yè)解決方案部總經(jīng)理梁雅莉就說,對(duì)于企業(yè)AI而言,開放、易部署、可擴(kuò)展、可靠非常重要。
英特爾AI的最新全景圖
構(gòu)建開放、繁榮的AI生態(tài),是英特爾分走AI蛋糕,需要與眾多生態(tài)合作伙伴一起努力的方向。
藏開英特爾企業(yè)AI生態(tài)之下的,就是英特爾完整的AI生態(tài)全景圖,包含了至強(qiáng)6、Gaudi3、酷睿Ultra、英特爾AI網(wǎng)絡(luò)連接卡在內(nèi)的一系列硬件及oneAPI等軟件產(chǎn)品。

Intel Vision上英特爾展示的硬實(shí)力,最受關(guān)注是Gaudi3,直接看數(shù)據(jù),相比上一代Gaudi 2,Gaudi 3在BF16精度下可提供4倍的AI計(jì)算能力、1.5倍的內(nèi)存帶寬、2倍的網(wǎng)絡(luò)帶寬,支持大規(guī)模系統(tǒng)橫向擴(kuò)展,最多可擴(kuò)展至8192個(gè)芯片的參考架構(gòu)。
對(duì)比英偉達(dá)H100,訓(xùn)練Llama 7B、13B以及GPT-3 175B模型,Gaudi3速度比H100快40%~70%。

推理Llama 7B、70B以及Falcon 180B模型,速度比H100快50%,能效提高40%,在較長(zhǎng)輸入和輸出序列上的推理性能優(yōu)勢(shì)更大。比H200也有30%的速度優(yōu)勢(shì)。
相比英偉達(dá)的GPU,英特爾Gaudi提出了TCO的優(yōu)勢(shì),這是Gaudi3打動(dòng)客戶的重要特性。
除了專用的AI加速器,英特爾的另一個(gè)殺手锏是至強(qiáng)處理器。
去年生成式AI更關(guān)注模型的訓(xùn)練,對(duì)成本和功耗沒那么重視,企業(yè)都希望訓(xùn)練一個(gè)自己的通用大模型。
“今年企業(yè)的關(guān)注重點(diǎn)轉(zhuǎn)到了推理。對(duì)企業(yè)來說,大模型訓(xùn)練出來是需要推理變現(xiàn)且能夠盈利。”英特爾公司市場(chǎng)營(yíng)銷集團(tuán)副總裁、中國(guó)區(qū)數(shù)據(jù)中心銷售總經(jīng)理、中國(guó)區(qū)運(yùn)營(yíng)商銷售總經(jīng)理莊秉翰說,“目前的利潤(rùn)大多基于通用數(shù)據(jù)中心的應(yīng)用,尤其是現(xiàn)在CPU的迭代非常迅速,每一代CPU又會(huì)帶來新的性能提升和能耗減少。”
英特爾為面向數(shù)據(jù)中心、云和邊緣的下一代處理器進(jìn)行了品牌煥新,即英特爾至強(qiáng)6。
“至強(qiáng)6全新的簡(jiǎn)潔品牌則是一個(gè)產(chǎn)品組合,可以解決數(shù)據(jù)中心在性能、功耗,以及多元工作負(fù)載等方面的各種問題。”莊秉翰介紹,配備能效核(E-cores)的英特爾至強(qiáng)6處理器將于2024年第二季度推出,提供卓越的效率,配備性能核(P-cores)的英特爾至強(qiáng)6處理器將緊隨其后推出,帶來更高的AI性能。

能效核的英特爾至強(qiáng)6處理器(代號(hào)為Sierra Forest),與第二代英特爾至強(qiáng)處理器相比,每瓦性能提高2.4倍,機(jī)架密度提高2.7倍。客戶能以近3:1的比例替換舊系統(tǒng),大幅降低能耗,實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo)。
性能核的英特爾至強(qiáng)6處理器(代號(hào)為Granite Rapids),包含了對(duì)MXFP4數(shù)據(jù)格式的軟件支持,與使用FP16的第四代英特爾至強(qiáng)處理器相比,可將下一個(gè)令牌(token)的延遲時(shí)間最多縮短6.5倍,能夠運(yùn)行700億參數(shù)的Llama-2模型。
雷峰網(wǎng)了解到,對(duì)于130億參數(shù)以下的大模型,英特爾至強(qiáng)CPU都能滿足。
“對(duì)企業(yè)來說,大模型也處在初始階段,不需要立即部署一個(gè)很大的GPU集群,這對(duì)于運(yùn)維和開發(fā)來說都是很大的挑戰(zhàn)。如果采用逐步部署生成式AI的節(jié)奏,可以通過CPU先做一些應(yīng)用部署。”莊秉翰指出。

在邊緣端,英特爾發(fā)布了涵蓋英特爾酷睿Ultra、英特爾酷睿、英特爾凌動(dòng)處理器和英特爾銳炫顯卡系列產(chǎn)品在內(nèi)的全新邊緣芯片,主要面向零售、工業(yè)制造和醫(yī)療等關(guān)鍵領(lǐng)域。英特爾邊緣AI產(chǎn)品組合內(nèi)的所有新品將于本季度上市,并將在今年年內(nèi)獲得英特爾Tiber邊緣平臺(tái)的支持。
在客戶端的AI PC,英特爾展示了即將推出的產(chǎn)品。包括將于2024年推出的下一代英特爾酷睿Ultra客戶端處理器家族(代號(hào)Lunar Lake),將具備超過100 TOPS平臺(tái)算力,其中神經(jīng)網(wǎng)絡(luò)處理單元(NPU)將有超過46 TOPS的算力。

在AI全景圖里,還有互聯(lián)產(chǎn)品。

英特爾中國(guó)網(wǎng)絡(luò)與邊緣事業(yè)部首席技術(shù)官、英特爾高級(jí)首席AI工程師張宇說,“現(xiàn)在的AI系統(tǒng)還是采用馮諾依曼的架構(gòu),這個(gè)系統(tǒng)不僅要看它的算能,還要看它數(shù)據(jù)傳輸?shù)哪芰Α!?/p>
通過超以太網(wǎng)聯(lián)盟(UEC),英特爾正在驅(qū)動(dòng)面向AI高速互聯(lián)技術(shù)(AI Fabrics)的開放式以太網(wǎng)網(wǎng)絡(luò)創(chuàng)新,并推出一系列針對(duì)AI優(yōu)化的以太網(wǎng)解決方案。
英特爾的產(chǎn)品組合包括英特爾AI網(wǎng)絡(luò)連接卡(AI NIC)、集成到XPU的AI連接芯粒、基于Gaudi加速器的系統(tǒng),以及一系列面向英特爾代工的AI互聯(lián)軟硬件參考設(shè)計(jì)。
從客戶端到邊緣端再到云端的推理和訓(xùn)練,再加上網(wǎng)絡(luò)和軟件,英特爾展示了最新的AI全景圖,最重要的是英特爾宣布組建開放的企業(yè)AI生態(tài),這才是英特爾能用強(qiáng)大的硬件在AI市場(chǎng)分到蛋糕的關(guān)鍵。
并且,英特爾在生成式AI從訓(xùn)練轉(zhuǎn)向推理的關(guān)鍵節(jié)點(diǎn),選擇企業(yè)AI這一對(duì)生成式AI更有付費(fèi)能力的市場(chǎng)構(gòu)建開放生態(tài),在恰當(dāng)?shù)臅r(shí)間點(diǎn)選擇了正確的戰(zhàn)略。
接下來就是英特爾的執(zhí)行力以及生成式AI能否幫助企業(yè)盈利的問題。雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。