首頁|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|大數(shù)據(jù)|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 飛象原創(chuàng) >> 正文

當(dāng)“超級(jí)大腦”遇上“順風(fēng)耳”,移遠(yuǎn)通信為機(jī)器人注入智能靈魂

2025年7月8日 14:51  CCTIME飛象網(wǎng)  作 者:魏德齡

飛象原創(chuàng)(魏德齡/文)在2025MWC上海,早已對(duì)機(jī)器人演示項(xiàng)目司空見慣的觀眾,卻在不斷對(duì)著移遠(yuǎn)通信展臺(tái)前的一臺(tái)產(chǎn)品進(jìn)行對(duì)話交互。

這臺(tái)機(jī)器人詮釋了關(guān)于“火種”與“變形金剛”間的故事,讓很多業(yè)內(nèi)人士開始考量,自己的傳統(tǒng)設(shè)備是否也需要加上一個(gè)“靈魂大腦”,來實(shí)現(xiàn)語音交互、信息查詢與指令執(zhí)行等一系列功能。

對(duì)此,不妨先從系統(tǒng)架構(gòu)的角度來剖析下,這臺(tái)機(jī)器人是如何擁有了“靈魂大腦”的。

當(dāng)機(jī)器人有了“靈魂大腦”

觀眾之所以能聯(lián)想到自身行業(yè)的機(jī)器人產(chǎn)品升級(jí),關(guān)鍵在于移遠(yuǎn)通信展示的機(jī)器人采用了一套融合方案,即機(jī)器人本體為逐際動(dòng)力提供,通過連接一塊搭載移遠(yuǎn)高算力AI模組SG885G、集成端側(cè)本地模型的主控板,來幫助機(jī)器人解決思考與下達(dá)指令的問題。在實(shí)現(xiàn)交互方面,則配置麥克風(fēng)陣列和喇叭,從而實(shí)現(xiàn)對(duì)現(xiàn)場(chǎng)觀眾的語音感知。

移遠(yuǎn)通信在2025MWC上海期間發(fā)布的“Robrain AI機(jī)器人解決方案”,如同“火種”一樣,迅速讓機(jī)器人獲得“靈魂大腦”。該方案采用創(chuàng)新的端云協(xié)同架構(gòu)及麥克風(fēng)陣列拾音技術(shù),深度融合端側(cè)智能與云端大模型優(yōu)勢(shì),賦予機(jī)器人接近人類的“思考”與“傾聽”能力。有效攻克了AI模型定制、輕量化部署及低延遲交互響應(yīng)等關(guān)鍵挑戰(zhàn),推動(dòng)機(jī)器人從“機(jī)械執(zhí)行”躍升為“主動(dòng)感知、智能思考、自然交流”的AI智能體。

據(jù)了解,本次的演示機(jī)器人采用的是一套輕度融合方案,好處在于整合容易,相當(dāng)于只需為固有設(shè)備提供一顆“大腦”,可以選擇內(nèi)置在本體或外掛,就能讓機(jī)器人擁有“靈魂”,由于各模塊相對(duì)獨(dú)立,系統(tǒng)對(duì)接簡(jiǎn)單。

同時(shí),移遠(yuǎn)通信還提供深度融合方案,采用一體化軟硬件設(shè)計(jì)。在依舊沿用機(jī)器人本體的情況下,將機(jī)器人大腦主板與小腦主板合二為一。盡管需要產(chǎn)品人員具有一定開發(fā)能力,但整機(jī)可靠性更高,在生產(chǎn)過程中也更具成本優(yōu)勢(shì)。

而對(duì)于機(jī)器人的最終體驗(yàn)好壞與否來說,在融合方案內(nèi)部的“超級(jí)大腦”與“順風(fēng)耳”到底能夠發(fā)揮怎樣的作用正是關(guān)鍵所在。

當(dāng)“超級(jí)大腦”遇上“順風(fēng)耳”

從演示機(jī)器人的運(yùn)轉(zhuǎn)流程來看,主要分為三個(gè)部分:感知、決策、執(zhí)行。

由于機(jī)器人采用語音交互的方式,所以在感知層需要進(jìn)行前端聲學(xué)處理,降低會(huì)場(chǎng)中的雜音,確定正在進(jìn)行交流的聲源內(nèi)容,最終將準(zhǔn)確的信息內(nèi)容傳遞給決策層。

在決策層通過意圖識(shí)別后,通過移遠(yuǎn)端&云混合大模型進(jìn)行指令處理,端側(cè)大模型與RAG本地知識(shí)庫結(jié)合,確保實(shí)時(shí)控制中的快速反應(yīng)與準(zhǔn)確作答,云端大模型的接入讓用戶的一些查詢、提問能夠通過聯(lián)網(wǎng)獲取信息。

最終處理完的控制指令將通過機(jī)器人執(zhí)行,機(jī)器人也能以語音播報(bào)的形式進(jìn)行反饋。

顯然,感知層的“順風(fēng)耳”與決策層“超級(jí)大腦”的產(chǎn)品能力,塑造了冰冷機(jī)器人的“有趣靈魂”。

“Robrain AI機(jī)器人解決方案”還擁有全鏈路音頻處理能力,讓機(jī)器人能夠“聽得見”,更能“聽得清”。以2025MWC上海的會(huì)場(chǎng)環(huán)境為例,現(xiàn)場(chǎng)有著嘈雜的人聲,不同展臺(tái)的喇叭也在不時(shí)播放著自家的宣傳,在巨大的室內(nèi)環(huán)境中還存在著回聲問題;同時(shí),機(jī)器人內(nèi)部也會(huì)在運(yùn)轉(zhuǎn)過程中伴有震動(dòng)、電機(jī)、風(fēng)扇等噪音。

移遠(yuǎn)通信Robrain AI機(jī)器人解決方案通過“麥克風(fēng)陣列拾音+全鏈路音頻算法”,為機(jī)器人添上了“順風(fēng)耳”的功能。6麥克風(fēng)均勻分布在設(shè)備的圓環(huán)上,可以360度全向拾音,最大收錄距離可達(dá)10米,喚醒率高達(dá)95%,±10.0°的DOA精度可以確保聲源區(qū)域被增強(qiáng)。

有效的聲音信號(hào)被收集后,相關(guān)算法會(huì)首先去除其中的干擾信號(hào)以及密閉空間中的回聲,并通過AI降噪獲得單純的人聲,同時(shí)還會(huì)自動(dòng)調(diào)節(jié)音頻增益,讓輸出音量保持在合適的幅度。

“回聲消除、聲源定位、波束成型、降噪、去混響、自動(dòng)增益以及語音喚醒等一系列前端數(shù)據(jù)處理,確保了大模型識(shí)別的準(zhǔn)確率!币七h(yuǎn)通信產(chǎn)品經(jīng)理王宗武表示。

當(dāng)清晰明了的聲音內(nèi)容輸入到“超級(jí)大腦”后,Robrain AI機(jī)器人解決方案中的端&云混合大模型同樣分工明確。其中,為了讓機(jī)器人能夠如同真人一樣在溝通交流中做出及時(shí)反饋,并且不依賴于網(wǎng)絡(luò)環(huán)境,85%的運(yùn)算將在端側(cè)大模型進(jìn)行,做到時(shí)延小于1秒,并且不占用過多算力資源。對(duì)于一些與產(chǎn)品相關(guān)的問題,端側(cè)大模型還能讀取本地RAG知識(shí)庫,滿足商業(yè)化需求,減少通用大模型在專業(yè)領(lǐng)域容易出現(xiàn)的“幻覺”問題。移遠(yuǎn)通信產(chǎn)品經(jīng)理王柯將這一過程比喻為:“大模型在本地進(jìn)行‘開卷考試’,機(jī)器人如同自帶一個(gè)本地學(xué)霸!睆某杀緜(cè)考慮,RAG的方式也比企業(yè)根據(jù)自身數(shù)據(jù)內(nèi)容進(jìn)行私域訓(xùn)練耗費(fèi)資源更少,且落地更快。

方案中的云端大模型則提供了擴(kuò)充整體方案的能力,通過與通用大模型進(jìn)行合作,可以輕松接入互聯(lián)網(wǎng)資源,幫助進(jìn)行內(nèi)容搜索、新聞播報(bào),或提供影音娛樂服務(wù)。例如在2025MWC上海的展區(qū)演示中,當(dāng)現(xiàn)場(chǎng)觀眾詢問“明天天氣怎么樣?”的時(shí)候,演示機(jī)器人能夠快速做出回答。

實(shí)際上,移遠(yuǎn)通信在2025MWC上海展示的機(jī)器人并非“超級(jí)大腦”+“順風(fēng)耳”這對(duì)天作之合的孤例。依托移遠(yuǎn)通信端側(cè)AI整體解決方案,今年3月聯(lián)合德壹所發(fā)布的全能王AI具身機(jī)器人,在無需理療師介入、無網(wǎng)絡(luò)連接的環(huán)境下,可快速且準(zhǔn)確地理解用戶通過自然語言提出的指令和意圖,高效完成通用聊天、醫(yī)療領(lǐng)域RAG問答、指令控制等任務(wù)。該機(jī)器人搭載高通QCS8550平臺(tái),其意圖識(shí)別小于1s、Prefill時(shí)間小于2s,同時(shí),超過15 tokens/s解碼速率也確保了交互的實(shí)時(shí)性。

正如這臺(tái)能夠代替一定理療師工作的機(jī)器人,當(dāng)具身智能來到生活中的每個(gè)場(chǎng)景,移遠(yuǎn)通信正在準(zhǔn)備將這對(duì)“天作之合”的能力進(jìn)行進(jìn)一步升級(jí)。

當(dāng)具身智能走向未來

“我的個(gè)人建議是把大模型當(dāng)做人一樣。”王柯表示,大模型方案將在如今文本和語音基礎(chǔ)上,引入視覺能力的支持,屆時(shí),機(jī)器人將能夠通過視覺看到交流者的表情,從而提升和擴(kuò)展方案的適用性。與此同時(shí),在與多名對(duì)象的交流過程中,視覺也能幫助機(jī)器人更好地判斷說話人的轉(zhuǎn)換。最終,視覺將與文本、語音一并,構(gòu)成機(jī)器人的多模態(tài)感知能力。

移遠(yuǎn)通信還正在思考,如何解決當(dāng)前Transformer架構(gòu)下的主流大模型對(duì)算力內(nèi)存消耗比較大的問題。目前正在關(guān)注非Transformer架構(gòu)的RWKV大語言模型,并已在SG885G模組上成功運(yùn)行RWKV7模型,將為機(jī)器人帶來更高效、內(nèi)存占用更小的能力。

在語音交互的演進(jìn)方面,移遠(yuǎn)通信同樣聚焦在多維感知的方向上。例如,在目前的交互開啟環(huán)節(jié),語音喚醒還只是基礎(chǔ)層面,如果需要能夠鎖定個(gè)人對(duì)象的識(shí)別開啟,就需要引入聲紋識(shí)別或人臉喚醒。同時(shí),聲紋或聲源與人臉、人體的結(jié)合,更有利于保持交互狀態(tài),從而做出更準(zhǔn)確的語義判斷。人臉鎖定功能也可以在多人對(duì)話中,通過重新鎖定人臉來切換對(duì)話信息的收集。另外,在最后結(jié)束交互的環(huán)節(jié),移遠(yuǎn)通信也正在讓機(jī)器人能夠以比較友好的方式進(jìn)行表達(dá),比如說“我累了”或“我想休息了”。

當(dāng)“超級(jí)大腦”遇上“順風(fēng)耳”,正在如同兒時(shí)動(dòng)畫片中的“火種”一般,為眾多機(jī)器人賦予全新的智能靈魂,讓冰冷的機(jī)身展現(xiàn)出思考與表達(dá)的“火花”。隨著具身智能開始走向生活中的每一個(gè)角落,移遠(yuǎn)通信也正在推動(dòng)兒時(shí)的科幻想象成為美好現(xiàn)實(shí)。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
飛象訪談:對(duì)話InterDigital副總裁兼無線實(shí)驗(yàn)室負(fù)責(zé)人Milind Kulkarni
精彩視頻
飛象趣談第二十九期!物流無人機(jī),低空經(jīng)濟(jì)崛起中的“雙輪引擎”
未來出行的芯力量 向“智能移動(dòng)終端”躍遷
飛象訪談:對(duì)話InterDigital副總裁兼無線實(shí)驗(yàn)室負(fù)責(zé)人Milind Kulkarni
2025MWC上海丨中興通訊副總裁熊杰就AI萬兆全光園區(qū)話題進(jìn)行交流
精彩專題
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會(huì)
2025世界電信和信息社會(huì)日大會(huì)
第八屆數(shù)字中國(guó)建設(shè)峰會(huì)
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像