AI+機器人!當機器人碰上大模型,將帶來哪些變革? | 研報推薦
疊加AI大模型(特別是多模態(tài)AI大模型)的賦能,移動機器人的能力有望大幅提升。
進入2024年,機器人領域迎來了一場大爆發(fā),科技巨頭們紛紛帶來驚艷的演示視頻,展示出令人瞠目結(jié)舌的產(chǎn)品。
這其中,大部分視頻展示的是外表酷似人形的“具身智能體”,它們可以完成各類復雜任務。
然而,這些演示視頻也引發(fā)了不少的爭議,有人懷疑這些機器人是否真的在自主執(zhí)行任務。
例如斯坦福大學推出的Mobile ALOHA系統(tǒng)機器人,就被曝出是真人遠程操作,在自主模式下曾多次“翻車”,可見AI機器人離落地應用還有很大差距。
不過在工業(yè)制造、倉儲物流等場景里,工業(yè)機器人已經(jīng)在大模型(LLM)的加持下展現(xiàn)出一定的智能性與自主性。
在近期國投證券發(fā)布的報告《人工智能行業(yè)專題:大模型帶來機器人變革》一文里,分析師以“AMR機器人”為例,介紹了大模型給工業(yè)機器人帶來的影響與變革。
以下內(nèi)容為報告重點內(nèi)容精選:
AMR行業(yè)快速增長,軟件和算法是核心
(鎂客網(wǎng)注:在此部分,分析師介紹了AMR機器人的定義、技術路徑、技術核心等內(nèi)容,并介紹了英偉達等海外大廠的AMR機器人方案。)
移動機器人,指在復雜環(huán)境下工作,具有自行組織、自主運行、自主規(guī)劃的智能機器人,主要可以分為自主移動機器人(AMR)、關節(jié)型機器人、人機協(xié)作機器人等。
根據(jù)GGII數(shù)據(jù),從全球維度來看,22年全球移動機器人市場規(guī)模約292億,預計27年增長至1874億元,對應22-27年CAGR為45.07%;
從國內(nèi)維度來看,22年中國移動機器人市場規(guī)模約97億元,預計27年增長至462億元,對應22-27年CAGR為36.74%,市場規(guī)模快速增長。
其中,自主移動機器人(AMR)是一種能夠獨立理解環(huán)境并在環(huán)境中移動的機器人。
AMR與其前身自動導引車 (AGV) 不同,后者依賴于軌道或預定義路徑,并且通常需要操作員監(jiān)督。而AMR使用一組復雜的傳感器、人工智能、機器學習和計算來進行路徑規(guī)劃,以解釋和導航其環(huán)境,不受有線電源的束縛。
AMR的背后有兩大關鍵技術路徑:
1、容器化的SDK工具集——包含感知、導航軟件堆棧;好用的開發(fā)環(huán)境,模擬工具;后續(xù)優(yōu)化升級Containers;
2、邊緣微服務器支撐——包括無線通信,安全設備,協(xié)作SLAM Fleet管理。
AMR技術核心:
1、架構(gòu)
(1)AMR本體能力:具備傳感和智能路徑規(guī)劃,運動控制、安全和人機交互HMI,機器視覺和智能導航等能力, 賦能制造業(yè)向柔性化、智能化發(fā)展。
(2)云端交互任務處理:AMR本體通過網(wǎng)絡(WIFI/以太)與云端計算中心交互,在云端完成數(shù)據(jù)分析,推理,模擬等工作,需要云端AI芯片支持(例如英偉達H100等)。
(3)架構(gòu)組成:目前主要由控制系統(tǒng)、導航傳感系統(tǒng)、驅(qū)動模塊、安全監(jiān)測模塊、交互模塊、通訊模塊、動力模塊(電池等)、執(zhí)行機構(gòu)(機械裝置)組成,不同場景品類的機器人對配置要求不同。
2、硬件
硬件部分主要包括TMT零部件(控制系統(tǒng)相關硬件、導航傳感器、驅(qū)動模塊、通訊模塊等)、電池(動力模塊)、機械裝置(執(zhí)行機構(gòu)等),隨著定位導航、機器視覺、規(guī)劃執(zhí)行等環(huán)節(jié)對芯片需求的增長,以及激光雷達等新型傳感器的應用,機器人中TMT零部件的價值量持續(xù)提升。
未來,AI將走出計算機,進而影響外部世界(物理世界),而機器人是AI最佳載體之一;隨著智能機器人的發(fā)展,機器人傳感器、執(zhí)行器將同AI相結(jié)合,具備模擬(用于仿真的虛擬空間)、映射(實時地圖創(chuàng)建能力)、自主(獨立運行)等能力,需要強大的端側(cè)算力支撐,移動GPU嵌入AMR本體是發(fā)展趨勢。
3、軟件、算法
在實際應用中,移動機器人通常以集群的方式系統(tǒng)完成特定任務;
未來,成百上千臺機器人規(guī)劃化集群作業(yè)是發(fā)展的必然趨勢,即逐步從單體智能向群體智能演進,軟件和算法成為構(gòu)筑核心競爭力的壁壘,例如統(tǒng)一環(huán)境下完成作業(yè)調(diào)度、找到全局最優(yōu)方案提升集群機器人工作總效率等。
因此分析師認為,隨著行業(yè)應用場景的豐富和技術的發(fā)展,產(chǎn)品模塊化、軟件模塊化將成為AMR發(fā)展的必然趨勢。
目前,端側(cè)(即機器人本體)軟件、算法主要有ROS 2、地圖規(guī)劃算法、AI算法、樣點算法等,支撐路徑規(guī)劃、障礙躲避、運動控制等功能;
而云側(cè)(及邊緣)軟件、算法主要有集群管理算法、訓練、遠端推理、遠端SLAM、數(shù)據(jù)分析算法等,支撐算力調(diào)度、機器人集群協(xié)作、數(shù)據(jù)分析等功能。
目前,各頭部廠商擁有自己的解決方案,技術路徑隨大模型的發(fā)展,快速迭代。
以Intel為例,其提供相應的開發(fā)工具和平臺,使開發(fā)者可以快速、低成本地搭建、管理AMR機器人。
除此以外,英偉達旗下的ISAAC集成式端到端解決方案、Jetson系列產(chǎn)品以及特斯拉的FSD+Dojo都是目前業(yè)內(nèi)比較領先的解決方案。
值得一提的是,當前機器人價值鏈劃分里面沒有智能系統(tǒng)。
分析師認為,機器人是典型的機電軟一體化產(chǎn)品,軟件與硬件是相互限制又相互促進的矛盾體;邊緣算力硬件將會制約機器人相關應用的發(fā)展,邊緣算力硬件的突破使得機器人可以承載更強大的AI,同時機器人應用的發(fā)展會倒逼邊緣算力硬件的提升。
當下的機器人智能停留在視覺(vision)階段,機器人缺乏智能系統(tǒng)(即機器人的大腦);在未來,在AI對機器人賦能的大背景下,機器人可以逐步理解物理世界,未來有可能向具身智能方向發(fā)展,智能系統(tǒng)對機器人的重要性愈發(fā)凸顯。
巨變:多模態(tài)大模型賦能機器人
(鎂客網(wǎng)注:在此部分,分析師介紹了多模態(tài)大模型如何賦能機器人。)
多模態(tài)大模型賦能機器人,主要體現(xiàn)為多模態(tài)感知和多模態(tài)交互。
• 多模態(tài)感知:通過多類型傳感器的配合,機器人處理多個模態(tài)接收的信息,從而實現(xiàn)對文本、圖像、視頻、音頻等模態(tài)信息的學習和理解。
• 多模態(tài)交互:用戶可以同時使用語音、手勢、文本等與機器人交互,同單模態(tài)交互相比,多模態(tài)交互具有減輕用戶認知負擔(交互更自然)、消除任 務歧義(交互更準確)、降低環(huán)境干擾(交互更加魯棒)等優(yōu)勢,使交互更加靈活和高效。
此外,大語言模型(LLM)賦能機器人語義理解,從傳統(tǒng)的關鍵詞語義識別,進化到可以理解人類復雜的語音命令;同時,通過預訓練大模型將“記憶”移植到智能機器人終端,機器人具備理解任務的能力。
由于機器人本體計算能力有限,需要通過強大的云端計算能力給機器人賦能。由此構(gòu)成了“云-網(wǎng)-端”架構(gòu)
“端”:是機器人本體及本體自身的控制系統(tǒng),嵌入式AI芯片逐步替代傳統(tǒng)嵌入式芯片,機器人本體的智能性快速提升;
“網(wǎng)”:主要指通過Wifi、5G及其他無線通信網(wǎng)絡將機器人連接起來,實現(xiàn)機器人本體和云端大腦的連接;
“云”:通過機器學習,不斷進化,進而使前端機器人本體的智能隨之提升。
未來,隨著模型植入機器人本體。云端大模型泛化出基本能力,并把這部分“記憶”植入機器人邊緣端(通過蒸餾等方式壓縮模型大?。M 而機器人本體可以將識別到的視覺、雷達、語音交互數(shù)據(jù)進行處理,并規(guī)劃動作,完成反饋。
在該部分,分析師以Google RT2 為例,介紹了新模型如何賦能機器人執(zhí)行各項任務。這是一個視覺-語言-動作(VLA)模型,符號理解、推理、人類識別等領域能力大幅提升,且泛化能力大幅提升。
國內(nèi)機器人產(chǎn)業(yè)蓬勃發(fā)展
(鎂客網(wǎng)注:在此部分,分析師介紹了國內(nèi)機器人產(chǎn)業(yè)的最新情況。)
國內(nèi)機器人產(chǎn)業(yè):機器人產(chǎn)業(yè)鏈上游包括核心零部件、配套零部件和軟件系統(tǒng)開發(fā),中游為機器人本體的生產(chǎn)及系統(tǒng)集成,目前主要集 中在工業(yè)機器人和服務機器人領域,下游主要包括工業(yè)應用(汽車制造、家電制造、航空航天等)和服務應用(餐飲服務、酒店服務、
醫(yī)療服務、物流服務等);近兩年一些做算法的軟件公司借助海外大模型的風,開始自研垂直小模型,并供給下游終端廠。
創(chuàng)業(yè)公司情況:根據(jù)中國機器人網(wǎng)統(tǒng)計數(shù)據(jù),2023年中國機器人行業(yè)共發(fā)生134起融資事件,其中近億/過億元級融資事件52起,2023年融資金額總計為200億元左右;2023年融資事件主要發(fā)生在工業(yè)機器人相關(37起左右)、醫(yī)療機器人(29起左右)、服務機器人(24起左右)、人形機器人(12起左右)等領域。
上市公司情況:目前上市公司以提供終端硬件為主,并逐步優(yōu)化機器人軟件(模型、算法等),提升機器人性能表現(xiàn)。
在此部分,研報列舉了??禉C器人等國內(nèi)多家優(yōu)秀機器人企業(yè),這里就不詳細展開介紹。
最后,記得關注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關注技術驅(qū)動創(chuàng)新
