0
| 本文作者: nebula | 2025-02-07 14:05 |
春節期間,DeepSeek 一躍成為全球矚目的焦點。它以僅約十分之一的超低訓練成本,成功推出了性能與OpenAI o1近乎相當的開源模型,對全球科技領域帶來巨大沖擊,先后引發美國科技股的大幅下跌,以及硅谷科技巨頭和各國政要的紛紛回應,如今全球各大芯片廠商和智算云服務廠商更是積極響應、跟進適配。半個月來,DeepSeek相關話題熱度居高不下,熱搜頻頻,已成為全球科技、經濟乃至政治領域的重要話題。
在全球人工智能技術競爭日趨白熱化的當下,中國科技企業正憑借獨特的創新路徑,深度參與這場意義深遠的變革當中。業界評論普遍認為,DeepSeek的最大特點在于其作為開源模型,通過在模型架構、工程設計上的大量創新,實現了極致的效率提升,以更少的數據量和算力需求,達到了比肩全球領先閉源模型的性能表現,大幅降低了業界的開發成本和應用門檻,甚至改變了全球人工智能的發展思路。
DeepSeek 的成功,也將更多優秀的中國 AI 企業推向世界舞臺的聚光燈下。近日,由麻省理工學院全資擁有的科技商業化智庫《麻省理工科技評論》(MIT Technology Review)刊發了一篇題為《關注DeepSeek之外的四家中國人工智能初創公司》的報道,指出階躍星辰(Stepfun)、面壁智能(ModelBest)、智譜AI(Zhipu)、無問芯穹(Infinigence AI)四家企業同樣展現出不遜于DeepSeek的技術實力與全球競爭力。

《麻省理工科技評論》于1899年在美國麻省理工學院創刊,是世界上最權威的科技商業媒體之一,也是世界上最古老的技術雜志及影響力最大的科技商業化智庫之一,其每年發布的 “十大突破性技術”榜單,更被視為全球科技發展的權威指南。
獲得《麻省理工科技評論》點名的這四家備受矚目的AI新銳中,首先是成立于2023 年4月,由前微軟高級副總裁姜大昕創立的階躍星辰。報道認為,雖然階躍星辰起步相對較晚,但其憑借著一系列基礎模型的成功,迅速嶄露頭角。去年,階躍星辰已經發布了11款基礎AI模型,涵蓋了語言、視覺、視頻、音頻以及多模態系統等多個領域,其大型語言模型Step-2參數超1萬億,在第三方基準測試網站LiveBench上,僅次于ChatGPT、DeepSeek、Claude和Gemini的模型。
面壁智能由清華大學知名研究團隊于2022年共同創立。報道指出,面壁智能專注于效率提升,順應端側模型發展趨勢,推出了MiniCPM系列模型,被形象地稱為“小鋼炮”。該系列模型專為智能手機、個人電腦、汽車系統、智能家居設備乃至機器人等終端設備的實時處理設計,其最新的MiniCPM 3.0 僅有40 億參數,但在多個基準測試中,性能與GPT-3.5不相上下;另一款模型MiniCPM-o 2.6,在平板電腦上實現了GPT-4o級別的效果。
同樣源于清華大學的智譜 AI,已發展成為一家與政府、學術界聯系緊密的企業。智譜AI既專注于基礎模型研發,也基于模型開發了對話模型ChatGLM和視頻生成工具清影(Ying)等一系列AI產品。其最先進的大語言模型 GLM-4-Plus 通過高質量合成數據訓練,降低成本的同時,還實現了與GPT-4相媲美的性能表現;視覺模型 GLM-4V-Plus則在賦予AI更多“智能體”能力上邁出了重要一步。
同樣是清華系的初創企業無問芯穹,雖然僅僅成立不滿兩年,但卻已經吸引了近10億元(1.4億美元)的融資,并被譽為“中國CoreWeave”。報道指出,該公司專注于AI基礎設施領域而非模型開發,其核心競爭力在于通過“多元異構、軟硬協同”的核心技術,打造連接“M種模型”和“N種芯片”的“MxN”AI基礎設施新范式,實現多種大模型算法在多元芯片上的高效協同部署,相當于將來自不同品牌的芯片整合在一起形成“異構計算集群”來執行各類AI任務。無問芯穹推出的Infini-AI異構云平臺基于多元芯片算力底座,向大模型開發者提供極致性價比的高性能算力和原生工具鏈,為大模型從開發到部署的全生命流程降本增效,同時其大規模模型的異構分布式混合訓練系統HETHUB,可將AI模型訓練時長壓縮30%,進而打造具有中國特色的高效解決方案。
從DeepSeek到四大新銳,中國AI企業正以獨特的發展路徑重塑全球AI的競爭格局。憑借在原創技術和工程層面實現突破,進而以更高的創新效率,快速追趕國際巨頭、構建全新商業模式,乃至樹立全球人工智能發展新標準,正是這些中國創新企業的共同特質。隨著越來越多中國AI企業在全球舞臺上嶄露頭角,不僅將成為推動中國 AI 產業穩健前行的關鍵力量,更將為全球AI發展貢獻更多中國智慧,引領人工智能產業邁向新的發展階段。
雷峰網(公眾號:雷峰網)
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。