出品|搜狐科技
作者|楊錦
一向遮遮掩掩的神秘的昇騰900系列芯片,第一次被華為系統(tǒng)又具體地公之于眾。
9月18日,在上海世博中心,上千人的華為全聯(lián)接大會現(xiàn)場,華為副董事長、輪值董事長徐直軍難掩激動地公布了昇騰芯片未來3年的演進計劃。
未來3年,華為將以每年一迭代地節(jié)奏,推出昇騰950、昇騰960及昇騰970三代芯片,最早的昇騰950系列將于明年一季度上市。
華為最大的算力追趕目標(biāo)及對手英偉達,在年初的GTC大會上,也公布了三年計劃:Blackwell Ultra、Rubin和Feynman三代芯片。換句話說,未來3年,他們在高端市場的較量將更為激烈,算力在華為的戰(zhàn)略地位也正在上升。
徐直軍逐一講解了昇騰芯的技術(shù)參數(shù),亮出了代表著華為最先進計算戰(zhàn)斗力的家底。
“算力將是中國人工智能的關(guān)鍵”,徐直軍表示,要講算力,首先要講芯片,昇騰芯片是華為AI戰(zhàn)略的基礎(chǔ),
昇騰芯片一向甚少對外,這次為何大尺度披露技術(shù)細節(jié)?一位華為內(nèi)部人士對搜狐科技表示,他們今年陸續(xù)收到一些客戶反饋,表示希望了解華為芯片更清晰、更長期的戰(zhàn)略,這是比較重要的原因之一。
昇騰950、960、970系列首次亮相,未來3年每年一迭代
2025年第一季度,華為發(fā)布昇騰910C芯片。目前,910B/910C也是昇騰主要在推的產(chǎn)品。
徐直軍還提到了華為與DeepSeek的合作細節(jié)。他說,DeepSeek的爆火,讓所有的大模型訓(xùn)練者有了不少不眠之夜,也對華為帶來了巨大的沖擊?!皬拇汗?jié)開始,華為云夜以繼日協(xié)助 DeepSeek接入全球用戶,一直到4月底,終于把910B/910C的推理能力調(diào)試到符合客戶要求的水平?!?/p>
展開全文
按照華為公布的計劃和目標(biāo),未來3年,華為將直接跳過930、940,以每年一迭代的節(jié)奏,陸續(xù)推出昇騰950、昇騰960、昇騰970系列芯片,支持華為自研低成本HBM技術(shù)。
這三代芯片,將主要在算力、規(guī)模、互聯(lián)帶寬等核心性能上進行升級。
其中,昇騰950系列算力分別達到1P和2P,互聯(lián)帶寬相比昇騰910C提升了2.5倍,達到2TB/s。這顆芯片將在2026年一季度推出,首先支持的產(chǎn)品形態(tài)是標(biāo)卡和超節(jié)點服務(wù)器。
規(guī)劃中的芯片Ascend 960,在算力、內(nèi)存訪問帶寬、內(nèi)存容量、互聯(lián)端口數(shù)等規(guī)格上相比再950翻倍,將在2027年四季度推出。
最后一顆是970,計劃在2028年四季度推出,這顆芯片的一些規(guī)格華為還在討論中。總體方向是:在各項指標(biāo)上大幅度升級,全面升級訓(xùn)練和推理性能。目前的初步規(guī)劃是,相比960,它的FP4算力、FP8算力、互聯(lián)帶寬要翻倍,內(nèi)存訪問帶寬至少增加1.5倍。
單顆算力不敵英偉達,超節(jié)點集群補短板
由于受到美國制裁的原因,華為的芯片無法在臺積電投片,與當(dāng)前最先進的芯片制造工藝無緣,這導(dǎo)致昇騰的單顆芯片的算力遲遲無法和英偉達拉平。
一位人形機器人公司的工程師告訴搜狐科技,他們公司目前主要使用昇騰910B芯片做訓(xùn)練芯片,“推理還不太行,因為算力太慢了?!?/p>
也有AI廠商對搜狐科技表示,昇騰910B/910C芯片是能夠用來作為推理芯片使用的,只不過需要優(yōu)化。
北京大學(xué)SCOW算力系統(tǒng)平臺的一位老師對搜狐科技透露,華為和英偉達性能還有大概百分之二三十的差距。他們之前主要使用英偉達芯片,這幾年,華為給學(xué)校捐贈了大量硬件,“華為與英偉達的芯片使用占比基本五五分了?!?/p>
有研報指出,當(dāng)前國產(chǎn)算力芯片呈現(xiàn)“啞鈴型”結(jié)構(gòu),高端市場被英偉達的產(chǎn)品壟斷,華為在單顆芯片的性能與英偉達還存在代際差距。
以昇騰910B為例,這顆芯片的算力4096 TFLOPS(每秒浮點運算次數(shù),也被稱為每秒峰值速度),低于H100的6240 TFLOPS,內(nèi)存帶寬為600GB/s ,遠低于H100的2039GB/s。
華為清醒地認識到,中國半導(dǎo)體制造工藝將在相當(dāng)長時間處于落后狀態(tài),它試圖通過超節(jié)點集群、新物理材料的應(yīng)用等動作,來彌補這一短板。
群在物理學(xué)中是指元素的集合,要曲線突圍,最大的創(chuàng)新當(dāng)屬“超節(jié)點+集群”算力解決方案。
超節(jié)點由多臺機器組成,但邏輯上以一臺機器學(xué)習(xí)、思考、推理。華為發(fā)布的最新超節(jié)點產(chǎn)品 Atlas 950 SuperPoD和Atlas 960 SuperPoD,分別支持8192及15488張昇騰卡,官方稱是全球最強算力的超節(jié)點。
搜狐科技在現(xiàn)場看到了頗受關(guān)注的昇騰384超節(jié)點,華為ICT集群業(yè)務(wù)某員工告訴搜狐科技,這一集群集成了 384 顆 910C 芯片,售價在1-2 億元人民幣。
搜狐科技了解到,華為還在物理層面應(yīng)用了光纜材料,相比打英偉達的銅纜,光的傳播更快,能夠?qū)崿F(xiàn)低時延和高帶寬的目標(biāo)。
硅基流動政企商業(yè)化負責(zé)人吳凡對搜狐科技表示,他們和華為云聯(lián)合推出的解決方案,用昇騰 384 超節(jié)點加上硅基流動SiliconLLM推理框架,其核心性能已經(jīng)能夠比肩英偉達的H100 部署。
評論