首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

信通院李論:關(guān)于人工智能軟硬件產(chǎn)品創(chuàng)新及生態(tài)構(gòu)建的幾點(diǎn)思考

2025年7月18日 07:01  中國信通院  

人工智能快速迭代,大模型時期僅依靠算力堆疊已無法實(shí)現(xiàn)模型性能的同步線性提升,模型算法與底層硬件、軟件棧、開發(fā)框架間的協(xié)同效果最終影響其訓(xùn)推效率與性能表現(xiàn),人工智能軟硬件生態(tài)重要性凸顯。中國信息通信研究院人工智能研究所軟硬件與創(chuàng)新生態(tài)部主任李論分享了人工智能軟硬件產(chǎn)品創(chuàng)新及生態(tài)構(gòu)建的幾點(diǎn)思考,助力我國盡快構(gòu)建起技術(shù)領(lǐng)先、良性發(fā)展的軟硬件生態(tài)體系。

一、大模型的創(chuàng)新迭代與軟硬件系統(tǒng)深度耦合

大模型的升級迭代需要在龐大的軟硬件系統(tǒng)上進(jìn)行實(shí)驗(yàn)。模型的原始創(chuàng)新和應(yīng)用迭代落地已非常依賴先進(jìn)的軟硬件協(xié)同技術(shù)生態(tài)體系,框架、芯片、集群、網(wǎng)絡(luò)等與算法間的協(xié)同愈發(fā)緊密。當(dāng)前以DeepSeek為代表的模型憑借工程化創(chuàng)新,實(shí)現(xiàn)性能的大幅度提升。特別是通過模型架構(gòu)、硬件算力和互聯(lián)通信等方面的極致優(yōu)化和協(xié)同來提升訓(xùn)練和推理的效能。從全球范圍看,Meta、字節(jié)等國內(nèi)外頭部企業(yè)也均在加快更大規(guī)模集群的軟硬件協(xié)同優(yōu)化,如創(chuàng)新集群網(wǎng)絡(luò)架構(gòu)、構(gòu)建先進(jìn)的運(yùn)維工具、優(yōu)化分布式并行策略等。我們預(yù)計(jì),在下個階段,軟硬件協(xié)同和生態(tài)體系的構(gòu)建會是全球大模型創(chuàng)新和算力設(shè)施建設(shè)的競爭焦點(diǎn)。

二、我國在軟硬件協(xié)同和適配方面發(fā)展現(xiàn)狀

模型和底層硬件的適配是硬件能力能否充分釋放的關(guān)鍵。以業(yè)界典型的開源大模型DeepSeek為例,目前在國內(nèi)主流廠商的軟硬件產(chǎn)品上運(yùn)行DeepSeek模型,仍然需要結(jié)合實(shí)際應(yīng)用場景進(jìn)行深度優(yōu)化,從而滿足精度、性能以及產(chǎn)品服務(wù)等延伸需求。

我們把軟硬件適配分為三個階段,第一階段是完成軟硬件產(chǎn)品的基礎(chǔ)適配,保障模型在軟硬件系統(tǒng)上運(yùn)行無報錯,達(dá)到“基本可用”狀態(tài)。第二階段是完成系統(tǒng)性能調(diào)優(yōu),如精度對齊,提升吞吐、延遲等指標(biāo)表現(xiàn),初步達(dá)到“好用”狀態(tài)。第三階段是和實(shí)際的場景結(jié)合,通過用戶、業(yè)務(wù)提供商、供應(yīng)商等多方協(xié)作,進(jìn)一步提升落地應(yīng)用效果。

在此背景下,中國信通院通過構(gòu)建人工智能軟硬件基準(zhǔn)體系A(chǔ)ISHPerf,推動國產(chǎn)化適配測試工作。我們發(fā)現(xiàn)大量國產(chǎn)軟硬件系統(tǒng)已能支持DeepSeek運(yùn)行,通過一系列的優(yōu)化,能夠在數(shù)天內(nèi)實(shí)現(xiàn)“可用”,且部分廠商模型適配效果已與官方技術(shù)報告實(shí)現(xiàn)精度對齊,同時,短期內(nèi)出現(xiàn)多種工具包及一體機(jī)、公有云服務(wù)等產(chǎn)品形態(tài),模型易用性不斷提升。

三、人工智能算力設(shè)施及軟硬件產(chǎn)品發(fā)展路徑

從整體發(fā)展來看,我們認(rèn)為規(guī)模定律在未來幾年仍將延續(xù)。業(yè)界主要有兩種發(fā)展思路:一是擴(kuò)大訓(xùn)練算力規(guī)模,增加模型尺寸,提升模型精度。二是聚焦參數(shù)一定范圍內(nèi)的模型改造與高效訓(xùn)練,特別在計(jì)算受限下,通過模型參數(shù)與訓(xùn)練數(shù)據(jù)有效配比和算法架構(gòu)改造提升訓(xùn)練效能,是廠商技術(shù)比拼的關(guān)鍵。

在這樣的發(fā)展路徑下,有三個創(chuàng)新重點(diǎn):一是聚焦系統(tǒng)性能、提升算力利用率。算力需求雖仍在大幅度增長,但當(dāng)前大量集群的算力利用率仍不足50%,需要進(jìn)行計(jì)算、存儲、通信的軟硬件深度協(xié)同,來實(shí)現(xiàn)系統(tǒng)性能提升。二是聚焦推理優(yōu)化方面的創(chuàng)新。大模型推理成為落地應(yīng)用的關(guān)鍵環(huán)節(jié),通過硬件、軟件一體化集成,及分布式并行推理等技術(shù)能有效提升推理效率,出現(xiàn)一體機(jī)、推理集群等新的產(chǎn)品服務(wù)形式。三是面向多樣場景的適配是落地關(guān)鍵。DeepSeek等開源模型生態(tài)有望進(jìn)一步促進(jìn)行業(yè)應(yīng)用需求增長,但各個場景性能指標(biāo)存在差異,存在大量點(diǎn)對點(diǎn)適配問題,需深度適配優(yōu)化。

四、我國需面向應(yīng)用需求持續(xù)推動軟硬件產(chǎn)品創(chuàng)新和生態(tài)建設(shè)

應(yīng)用模型的高效部署和生態(tài)協(xié)同范式的建立是下階段AI產(chǎn)品的創(chuàng)新關(guān)鍵。為了進(jìn)一步凝聚產(chǎn)業(yè)共識,降低軟硬件選型技術(shù)難度和開發(fā)門檻,依托工信部人工智能標(biāo)準(zhǔn)化技術(shù)委員會,中國信通院基于人工智能軟硬件基準(zhǔn)AISHPerf工作組已推進(jìn)十余項(xiàng)標(biāo)準(zhǔn)制定工作,覆蓋算子、計(jì)算設(shè)備、訓(xùn)推集群、框架工具、邊端系統(tǒng)、智算的互聯(lián)、網(wǎng)絡(luò)等領(lǐng)域。此外,我們在北京亦莊建設(shè)了首個人工智能軟硬件協(xié)同創(chuàng)新與適配驗(yàn)證中心,面向包括芯片、服務(wù)器、不同類型的計(jì)算設(shè)備、集群、開發(fā)框架及平臺、一體機(jī)等在內(nèi)的人工智能軟硬件產(chǎn)品,去提供相應(yīng)的實(shí)驗(yàn)驗(yàn)證、測試和產(chǎn)業(yè)培育等工作。下一步,我們將持續(xù)開展大模型軟硬一體設(shè)備、框架軟件與工具、大規(guī)模智算集群等系列測試驗(yàn)證工作,舉辦“興智杯”全國人工智能創(chuàng)新應(yīng)用大賽、大模型創(chuàng)新發(fā)展與軟硬件協(xié)同生態(tài)論壇等大型賽會活動,希望能夠有序引導(dǎo)人工智能模型和軟硬件廠商間的協(xié)同創(chuàng)新,集聚各方力量盡快構(gòu)建起技術(shù)領(lǐng)先、良性發(fā)展的產(chǎn)業(yè)生態(tài)體系。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
飛象訪談:對話InterDigital副總裁兼無線實(shí)驗(yàn)室負(fù)責(zé)人Milind Kulkarni
精彩視頻
飛象趣談第二十九期!物流無人機(jī),低空經(jīng)濟(jì)崛起中的“雙輪引擎”
未來出行的芯力量 向“智能移動終端”躍遷
飛象訪談:對話InterDigital副總裁兼無線實(shí)驗(yàn)室負(fù)責(zé)人Milind Kulkarni
2025MWC上海丨中興通訊副總裁熊杰就AI萬兆全光園區(qū)話題進(jìn)行交流
精彩專題
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會
2025世界電信和信息社會日大會
第八屆數(shù)字中國建設(shè)峰會
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像