華為超節(jié)點:用系統(tǒng)創(chuàng)新重構(gòu) AI 算力新范式
飛象網(wǎng)訊 (計育青/文)伴隨著AI的快速崛起,專為AI提供充足算力支撐的“超節(jié)點”技術(shù)在2025年迅速走紅,華為先后推出了基于昇騰芯片的萬卡超節(jié)點產(chǎn)品和50萬卡、百萬卡超節(jié)點集群產(chǎn)品,阿里、字節(jié)、騰訊、浪潮等企業(yè)也陸續(xù)發(fā)布了自己的超節(jié)點解決方案。
近日,華為計算產(chǎn)品線營銷運作部部長張愛軍在接受記者采訪時表示,華為正在與合作伙伴一道,通過“集群+超節(jié)點”創(chuàng)新,為全球AI產(chǎn)業(yè)提供真正大規(guī)模、高效、開放合作的算力支撐。
“超節(jié)點”是AI算力的解決之道
當(dāng)前AI技術(shù)演進正呈現(xiàn)出兩個大趨勢,一是多模態(tài)走向融合統(tǒng)一,二是各行各業(yè)全面擁抱AI。從單模態(tài)大語言模型到多模態(tài)融合統(tǒng)一,需要AI能夠統(tǒng)一處理文本、圖片、視頻、聲音等不同類型的數(shù)據(jù)信息,從而像人類一樣,更加全面地認識、理解現(xiàn)實世界。不過多模態(tài)時代的到來也帶來了不少新的挑戰(zhàn),比如AI模型需要理解、生成的上下文長度將從K級邁入兆級,模型訓(xùn)練需要的數(shù)據(jù)規(guī)模將從10TB級增長到100TB級,競爭加劇導(dǎo)致AI模型更新?lián)Q代周期從半年縮短到一兩個月。另一方面,各行各業(yè)都在積極引入AI技術(shù),它們對AI算力提出了更多細化的要求,比如金融風(fēng)控工作期待AI識別、反饋的時延不能高于20毫秒,新興的AI代理應(yīng)用需要在執(zhí)行多任務(wù)協(xié)同、多輪推理迭代的同時快速響應(yīng)用戶。這兩大趨勢都對算力基礎(chǔ)設(shè)施提出了更高的要求。
面對爆炸式增長的算力需求,人們不能繼續(xù)依賴單顆芯片的性能提升,必須通過發(fā)展多芯片互聯(lián)技術(shù)、構(gòu)造大規(guī)模計算節(jié)點來解決問題。傳統(tǒng)集群計算方案主要利用現(xiàn)成技術(shù),通過服務(wù)器堆疊、以太網(wǎng)聯(lián)接的模式來提升算力規(guī)模,不過由于服務(wù)器之間帶寬不足、時延大,導(dǎo)致集群規(guī)模越大,算力的利用率反而越低。與此同時,算力集群的規(guī)模擴張還導(dǎo)致系統(tǒng)總體可靠性下降,一個環(huán)節(jié)出問題就會連累整個集群的運行中斷,使得算力設(shè)施難以充分釋放自身的價值。張愛軍表示,這需要引入新的互聯(lián)協(xié)議、計算架構(gòu),從而突破服務(wù)器擴展的硬件限制,滿足未來規(guī)模算力供給!俺(jié)點就是為此提供的解決方案,可以讓AI訓(xùn)練更高效、時延更短、可靠性更高!睆垚圮娬f。
“大帶寬+低時延+內(nèi)存統(tǒng)一編址”才是真“超節(jié)點”
傳統(tǒng)的高性能計算設(shè)備就是一臺以CPU為核心、采用單一操作系統(tǒng)的大型機或服務(wù)器,卡間互聯(lián)采用PCIe或以太網(wǎng)方式,跨服務(wù)器互聯(lián)帶寬多為200-400Gb/s,時延一般在幾十微秒,難以滿足千億參數(shù)AI模型訓(xùn)練所需!俺(jié)點”則是多個分布式設(shè)備各自搭載操作系統(tǒng),通過新的技術(shù)互聯(lián)形成一個邏輯上的整體,各個分布式設(shè)備上的計算單元、存儲單元、內(nèi)存單元等形成資源池,供邏輯上的整體統(tǒng)一調(diào)用。
張愛軍表示,“超節(jié)點”方案中的每個CPU、NPU或內(nèi)存單元都可以平等地進行互聯(lián),互聯(lián)通道不再采用傳統(tǒng)的PCIe模式,而是以全新的協(xié)議、總線能力來服務(wù)AI計算的高需求。因此張愛軍認為,真正的超節(jié)點應(yīng)具備三個核心特征,即大帶寬、低時延、內(nèi)存統(tǒng)一編址。
超節(jié)點借助高效的互聯(lián)協(xié)議打破傳統(tǒng)架構(gòu)限制,支持更大規(guī)模AI芯片的高效協(xié)同,支持更大范圍、更高流量的數(shù)據(jù)傳輸。以華為昇騰 384超節(jié)點產(chǎn)品為例,系統(tǒng)集成了384個昇騰NPU和192個鯤鵬CPU,與傳統(tǒng)服務(wù)器架構(gòu)相比,其通信帶寬提升了15倍、RTT通信時延從7微秒降到了3微秒。超節(jié)點的大帶寬、低時延不僅局限在單臺服務(wù)器內(nèi)部,還可以擴展到整機和跨機柜的大規(guī)模集群,整個超節(jié)點范圍內(nèi)都可以靈活并行切分資源、匹配業(yè)務(wù)需求。實測表明,在DeepSeek、Qwen等多模態(tài)、MoE模型訓(xùn)練中,超節(jié)點的性能是傳統(tǒng)集群的3倍以上。
“內(nèi)存統(tǒng)一編址”是指超節(jié)點內(nèi)所有互聯(lián)設(shè)備的內(nèi)存地址全局唯一,無論數(shù)據(jù)位于哪臺設(shè)備、哪塊內(nèi)存,都只有一個“全局地址”,CPU、NPU/GPU之間可以直接通過這個地址訪問。這使得大模型訓(xùn)練中頻繁的參數(shù)同步操作可以直接通過內(nèi)存語義通信完成,提升小包數(shù)據(jù)傳輸、離散隨機訪存通信效率,并在超節(jié)點域內(nèi)實現(xiàn)更大的共享內(nèi)存池。昇騰384超節(jié)點已經(jīng)實現(xiàn)了128TB的全局內(nèi)存統(tǒng)一編址。
大帶寬、低時延、內(nèi)存統(tǒng)一編址三大能力相互協(xié)同,才能真正實現(xiàn)讓集群像一臺計算機一樣工作,成為真正的超節(jié)點。相比之下,一些AI算力設(shè)施仍然在AI處理器間以PCIe+RoCE協(xié)議互聯(lián),跨服務(wù)器帶寬、時延受限,且不支持“內(nèi)存統(tǒng)一編址” 能力,本質(zhì)上仍然是傳統(tǒng)服務(wù)器的堆疊,不是真正的“超節(jié)點”。
需求無止境,創(chuàng)新才有未來
在已經(jīng)過去的2025年,業(yè)界對AI算力的建設(shè)和發(fā)展一直存在爭議,既有算力不足的呼吁,也有算力過剩的憂慮。張愛軍認為,與實際需求相比,現(xiàn)有AI算力還遠遠不夠!皬男袠I(yè)用戶到個人用戶,使用AI越來越多,token用量一直呈現(xiàn)指數(shù)級增長!睆垚圮娬f,“據(jù)統(tǒng)計,2025年國內(nèi)平均每天消耗300萬億token,未來可能突破每日千萬億token!
要滿足快速增長的需求,必須堅持創(chuàng)新。在2025年,華為不僅推出了創(chuàng)新的新一代超節(jié)點智算產(chǎn)品,還率先將智能計算的超節(jié)點技術(shù)引入到了通用計算領(lǐng)域,發(fā)布了全球首款通算超節(jié)點。張愛軍表示,其實通用計算與智算一樣,都需要不斷提高性能表現(xiàn),因此也都是大帶寬、低時延、統(tǒng)一內(nèi)存編址等新技術(shù)的用武之地。
張愛軍告訴記者,華為面向超節(jié)點開發(fā)的高速互聯(lián)協(xié)議靈衢是完全開放的,有興趣的企業(yè)和個人都可以到靈衢官網(wǎng)下載詳盡的技術(shù)資料,業(yè)界所有開發(fā)者都可以獲取這項技術(shù),在此基礎(chǔ)上打造自己的超節(jié)點產(chǎn)品!叭A為希望這些新技術(shù)、新能力可以為更多的企業(yè)選用,從而打造一個完整的產(chǎn)業(yè)生態(tài),共同努力為數(shù)字化、智能化時代提供堅強的算力支撐!睆垚圮娬f。
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
盤點2025|光纖光纜:周期性放緩之下,確定性開始凸顯
在2025年,光纖光纜廠商們習(xí)慣于用“周期性”一詞來描述當(dāng)前的困難,相比于寬帶普及、4G升級換代帶來的流量需求猛增這一巨大業(yè)務(wù)增長?扇缃裨谒⒅桃曨l、看著帶貨的新日常生活常態(tài)下,盡..[詳細]
盤點2025|人工智能:破局前行、以智啟新,同赴人機共生新未來
2025年,人工智能行業(yè)迎來技術(shù)迭代與價值落地的雙重關(guān)口。這一年里既延續(xù)著近年來的高速增長態(tài)勢,也迎來從野蠻生長向規(guī)范提質(zhì)的深刻轉(zhuǎn)型。 [詳細]
盤點2025|算力行業(yè):量質(zhì)齊升的進階之路
在數(shù)字經(jīng)濟加速滲透全球經(jīng)濟社會各領(lǐng)域的今天,算力已成為繼電力、水資源之后的關(guān)鍵生產(chǎn)要素,是支撐數(shù)字中國建設(shè)、推動高質(zhì)量發(fā)展的核心基礎(chǔ)設(shè)施。算力的規(guī)模與質(zhì)量直接決定了數(shù)字經(jīng)濟的發(fā)..[詳細]
盤點2025|芯片:AI依舊是挖潛點,應(yīng)用進一步多樣化
時至2025年年底,人們已經(jīng)開始漸漸習(xí)慣,有事聽聽AI給出的參考意見。其背后的算力支撐也在逐步加強,像是更先進的制程,以及向更多端側(cè)設(shè)備的拓展。另一方面,AI又一石激起千層浪,機遇與需..[詳細]
盤點2025 | 從5G到6G:深耕與突破并行,開啟智能連接新紀(jì)元
2025年,全球通信產(chǎn)業(yè)站在了一個關(guān)鍵的歷史交匯點。這一年既是“十四五”規(guī)劃的收官年,5G建設(shè)成果全面轉(zhuǎn)化的驗收年,也是“十五五”規(guī)劃啟幕,6G布局從技術(shù)探索邁向工程落地的奠基之年,更..[詳細]
盤點2025|量子信息:三大領(lǐng)域技術(shù)持續(xù)演進,產(chǎn)業(yè)發(fā)展未來可期
以量子計算、量子通信和量子精密測量為代表的量子信息技術(shù)是挑戰(zhàn)人類調(diào)控微觀世界能力極限的世紀(jì)系統(tǒng)工程,是對傳統(tǒng)技術(shù)體系產(chǎn)生沖擊、進行重構(gòu)的重大顛覆性創(chuàng)新,將引領(lǐng)新一輪科技革命和產(chǎn)..[詳細]
盤點2025|2025年智能終端趨勢洞察:AI重構(gòu)體驗,超級終端時代加速到來
2025年,全球智能終端行業(yè)站在了技術(shù)革新與生態(tài)重構(gòu)的十字路口。AI技術(shù)的規(guī);瘽B透、折疊屏形態(tài)的成熟落地、跨設(shè)備協(xié)同的深度演進,正在重塑終端產(chǎn)品的價值邏輯與市場格局。[詳細]
2026手機市場開局遇寒流 市場結(jié)構(gòu)悄然生變
2026年伊始,尚處于溫和復(fù)蘇階段的全球智能手機市場,便遭遇了一記“寒流”。據(jù)媒體消息,受上游供應(yīng)鏈存儲漲價影響,多家手機廠商近日下調(diào)全年整機訂單數(shù)量,小米、OPPO下調(diào)超20%,vivo下調(diào)..[詳細]
2026十大AI技術(shù)趨勢:應(yīng)用拓展、模式探索與底層技術(shù)齊頭并進
在2025年,人工智能技術(shù)不僅繼續(xù)向著更快、更強、更多能的方向發(fā)展,還在向著小而精的新方向發(fā)展,并因此得以大步走出實驗室,以令人吃驚的速度快速融入各行各業(yè)的業(yè)務(wù)應(yīng)用。時間進入2026年..[詳細]
XR3.0時代,產(chǎn)業(yè)已邁入發(fā)展“快車道”
虛擬(增強)現(xiàn)實(簡稱XR)是新一代信息技術(shù)的重要前沿方向,是數(shù)字經(jīng)濟的重大前瞻領(lǐng)域,將深刻改變?nèi)祟惖纳a(chǎn)生活方式,各國政府重視該領(lǐng)域的發(fā)展布局,美韓持續(xù)推進沉浸式技術(shù)戰(zhàn)略,我國..[詳細]













