2070 TFLOPS的智慧大腦:全新NVIDIA Jetson Thor引領(lǐng)人形機(jī)器人進(jìn)化
全球重工業(yè)正迎來一場深刻的智能化轉(zhuǎn)型,50萬億美元的市場規(guī)模正被AI技術(shù)悄然重塑。約20萬個(gè)倉庫、1000萬個(gè)工廠、15億輛汽車和卡車、20億個(gè)攝像頭構(gòu)成了當(dāng)前的基礎(chǔ)設(shè)施,而未來數(shù)十億人形機(jī)器人的潛在崛起則預(yù)示著物流、制造和智能交通領(lǐng)域的無限可能。這種趨勢不僅推動(dòng)了現(xiàn)有產(chǎn)業(yè)的數(shù)字化升級(jí),更為智慧城市和極端環(huán)境中的機(jī)器人應(yīng)用打開了新篇章。從自動(dòng)化叉車到未來的人形助手,工業(yè)自動(dòng)化和人機(jī)協(xié)同的未來圖景正在逐步清晰。
2025年8月26日,NVIDIA在全球范圍內(nèi)正式發(fā)布了Jetson Thor,這款專為人形機(jī)器人設(shè)計(jì)的邊緣AI計(jì)算平臺(tái)被譽(yù)為“物理AI和通用機(jī)器人時(shí)代的終極超級(jí)計(jì)算機(jī)”。作為NVIDIA Jetson系列的最新力作,Jetson Thor憑借其卓越的計(jì)算能力、能效和對生成式AI的支持,為人形機(jī)器人行業(yè)帶來了革命性的突破。
對于人形機(jī)器人行業(yè),Jetson Thor的發(fā)布標(biāo)志著一個(gè)轉(zhuǎn)折點(diǎn)。它推動(dòng)機(jī)器人從單一任務(wù)的自動(dòng)化工具,轉(zhuǎn)變?yōu)槟軌蛟趶?fù)雜環(huán)境中感知、推理和交互的通用智能體。無論是制造業(yè)的流水線、醫(yī)院的手術(shù)室,還是智慧城市的街頭,Jetson Thor都將成為推動(dòng)人形機(jī)器人智能飛躍的核心引擎,為全球技術(shù)創(chuàng)新開辟新的可能性。
全新Jetson Thor:性能提高7.5倍,能效提升3.5倍
NVIDIA Jetson Thor基于最新的Blackwell GPU架構(gòu),集成了高性能的系統(tǒng)級(jí)芯片(SoC),專為邊緣計(jì)算和機(jī)器人應(yīng)用優(yōu)化。這款計(jì)算平臺(tái)的設(shè)計(jì)理念是滿足人形機(jī)器人對高算力、低延遲和低功耗的嚴(yán)苛需求。Thor的性能在上一代Jetson AGX Orin的基礎(chǔ)上實(shí)現(xiàn)了顯著提升,提供2070 FP4 TFLOPS的AI算力,相比Orin提高了7.5倍,能效提升到3.5倍。這種算力飛躍使其能夠輕松處理復(fù)雜的多模態(tài)AI工作負(fù)載,例如大型語言模型(LLM)、視覺語言模型(VLM)和視覺語言動(dòng)作模型(VLA),這些模型是實(shí)現(xiàn)通用機(jī)器人智能的關(guān)鍵。
Thor配備128 GB LPDDR5X內(nèi)存,為同時(shí)運(yùn)行多個(gè)生成式AI模型提供了充足的存儲(chǔ)空間,確保實(shí)時(shí)推理的高吞吐量和低延遲。此外,它支持4x 25 GbE網(wǎng)絡(luò)接口和專用相機(jī)卸載引擎,能夠處理多個(gè)高分辨率攝像頭、LiDAR和超聲波雷達(dá)的實(shí)時(shí)數(shù)據(jù)流,I/O性能比Orin提升了10倍以上。這種高帶寬設(shè)計(jì)特別適合人形機(jī)器人需要快速處理多傳感器數(shù)據(jù)流的場景。
在能效方面,Jetson Thor的功耗范圍在40至130瓦之間,可通過軟件動(dòng)態(tài)調(diào)整,相比Orin提升了3.5倍的能源效率。這種靈活的功耗管理使其非常適合電池供電的機(jī)器人,延長運(yùn)行時(shí)間的同時(shí)保持高性能。Thor還采用了最新的Arm CPU架構(gòu),結(jié)合Blackwell GPU的多實(shí)例圖形處理能力,支持多個(gè)AI程序并行運(yùn)行,顯著提升實(shí)時(shí)處理效率。這些技術(shù)特性共同構(gòu)成了Jetson Thor的核心優(yōu)勢,使其成為人形機(jī)器人邊緣計(jì)算的理想選擇。
高算力+低延遲:賦能人形機(jī)器人智能飛躍
人形機(jī)器人的核心挑戰(zhàn)在于實(shí)現(xiàn)實(shí)時(shí)、通用智能,尤其是在動(dòng)態(tài)環(huán)境中與人類和物體進(jìn)行復(fù)雜交互。這需要強(qiáng)大的計(jì)算能力來處理多模態(tài)傳感器數(shù)據(jù)、運(yùn)行大型AI模型,并快速執(zhí)行動(dòng)作決策。Jetson Thor通過其卓越的性能優(yōu)勢,直接推動(dòng)了人形機(jī)器人在感知、推理和動(dòng)作執(zhí)行方面的智能化飛躍。
首先,Jetson Thor在實(shí)時(shí)多模態(tài)AI處理方面表現(xiàn)出色。人形機(jī)器人通常配備多個(gè)傳感器,包括頭部、胸部或腿部附近的攝像頭,用于環(huán)境感知和安全監(jiān)測;還有LiDAR、超聲波雷達(dá)和語音輸入設(shè)備,用于導(dǎo)航和交互。這些傳感器生成的高速數(shù)據(jù)流需要實(shí)時(shí)處理,以支持目標(biāo)識(shí)別、自然語言理解和自主決策。在NVIDIA的測試中,Thor在處理16個(gè)傳感器數(shù)據(jù)并運(yùn)行LLaMA(LLM)和阿里巴巴Qwen(VLM)時(shí),首次生成時(shí)間低于200毫秒,輸出生成時(shí)間低于50毫秒,相當(dāng)于每秒生成超過25個(gè)token的吞吐量。相比Orin,Thor的推理速度提高5倍,結(jié)合NVIDIA FP4量化和推測解碼技術(shù)后,總性能提升約10倍。
這種實(shí)時(shí)推理能力對人形機(jī)器人至關(guān)重要。例如,Agility Robotics在其第五代機(jī)器人Digit中集成了Jetson平臺(tái),并計(jì)劃在第六代中采用Thor,以實(shí)現(xiàn)更復(fù)雜的視覺推理和動(dòng)作控制。Boston Dynamics的Atlas機(jī)器人也利用Thor的服務(wù)器級(jí)計(jì)算能力和高帶寬數(shù)據(jù)處理能力,在非結(jié)構(gòu)化環(huán)境中執(zhí)行復(fù)雜的操作任務(wù)。這些案例表明,Thor的性能能夠顯著提升機(jī)器人在動(dòng)態(tài)環(huán)境中的智能表現(xiàn)。
其次,Jetson Thor對生成式AI和大型模型的支持為人形機(jī)器人帶來了通用智能的可能性。傳統(tǒng)機(jī)器人依賴感知和規(guī)劃算法,通常以30赫茲運(yùn)行,而高級(jí)推理任務(wù)可能需要數(shù)百毫秒甚至數(shù)秒。然而,人形機(jī)器人需要快速執(zhí)行動(dòng)作(以數(shù)百至千赫茲運(yùn)行),同時(shí)處理多模態(tài)輸入。Thor通過支持大型語言模型(如LLaMA、Qwen)和視覺語言模型(如NVIDIA的Cosmos Reason 1),為機(jī)器人提供了推理和決策能力。Cosmos Reason 1是一個(gè)專為推理設(shè)計(jì)的開源VLM,在不到一個(gè)月內(nèi)下載量超過50萬次,充分體現(xiàn)了其受歡迎程度。Thor能夠高效運(yùn)行此類模型,支持機(jī)器人在復(fù)雜環(huán)境中生成動(dòng)作計(jì)劃,例如在工廠中搬運(yùn)物體或在醫(yī)療場景中協(xié)助手術(shù)。
此外,Thor支持所有主流AI框架,包括JAX、PyTorch、vLLM和TensorRT-LLM,確保開發(fā)者能夠快速適配最新的生成式AI模型。無論是xAI的最新模型還是阿里巴巴的Qwen,Thor都能在發(fā)布當(dāng)天即運(yùn)行,展現(xiàn)了其100%軟件可編程的靈活性。這種開放性和適應(yīng)性為人形機(jī)器人開發(fā)者提供了強(qiáng)大的技術(shù)支持。
在邊緣計(jì)算場景中,Jetson Thor的低延遲和高能效尤為關(guān)鍵。人形機(jī)器人通常依賴電池供電,且在某些環(huán)境中(如地下操作或隧道中的自動(dòng)駕駛)無法依賴云端計(jì)算。云端推理可能引入1-3秒的延遲,而精細(xì)的電機(jī)控制任務(wù)需要以數(shù)百至千赫茲運(yùn)行,延遲敏感度極高。Thor通過其低延遲推理和高能效設(shè)計(jì)解決了這些挑戰(zhàn)。開發(fā)者可以通過軟件調(diào)整功耗,在40-130W范圍內(nèi)平衡性能與能效。Thor提供兩種模塊:T5000提供2070 TFLOPS的最高性能,而T4000以更低的成本和功耗提供1200 TFLOPS,適合升級(jí)現(xiàn)有Orin 64GB模塊的用戶。
Figure公司的創(chuàng)始人兼首席執(zhí)行官Brett Adcock表示:“人形機(jī)器人的發(fā)展依賴于在機(jī)器人上直接運(yùn)行強(qiáng)大的AI模型,以實(shí)現(xiàn)實(shí)時(shí)學(xué)習(xí)和交互。Jetson Thor的服務(wù)器級(jí)性能和緊湊的低功耗設(shè)計(jì),使我們能夠在復(fù)雜、非結(jié)構(gòu)化環(huán)境中部署大規(guī)模生成式AI模型,讓機(jī)器人感知、推理和行動(dòng)。”
人形機(jī)器人應(yīng)用,全面鋪開
Jetson Thor的性能優(yōu)勢為人形機(jī)器人在多個(gè)行業(yè)開辟了新的應(yīng)用前景,在工業(yè)的諸多關(guān)鍵場景,Thor將會(huì)推動(dòng)機(jī)器人技術(shù)的實(shí)際應(yīng)用。
在制造業(yè)和工業(yè)自動(dòng)化領(lǐng)域,人形機(jī)器人需要執(zhí)行重復(fù)性、繁重或危險(xiǎn)的任務(wù),如搬運(yùn)重物、組裝零件或在危險(xiǎn)環(huán)境中操作。Thor支持實(shí)時(shí)目標(biāo)識(shí)別和動(dòng)作規(guī)劃,使機(jī)器人能夠在非結(jié)構(gòu)化環(huán)境中靈活操作。例如,在倉庫中,機(jī)器人可以利用Thor的高速傳感器處理能力,快速識(shí)別和抓取物體,同時(shí)通過VLM進(jìn)行環(huán)境推理,避免障礙物。這種能力顯著提高了生產(chǎn)效率和安全性。
在醫(yī)療領(lǐng)域,Thor支持的手術(shù)輔助機(jī)器人通過多攝像頭數(shù)據(jù)流和Holoscan傳感器處理平臺(tái),為外科醫(yī)生提供實(shí)時(shí)指導(dǎo)。Thor能夠處理多個(gè)高分辨率攝像頭的數(shù)據(jù),結(jié)合VLM生成精確的視覺推理,輔助醫(yī)生在復(fù)雜手術(shù)中導(dǎo)航。這不僅提高了手術(shù)的精準(zhǔn)性,還減輕了醫(yī)務(wù)人員的負(fù)擔(dān)。
在智慧城市中,Thor支持的服務(wù)機(jī)器人可以執(zhí)行送貨、巡邏或公共交互任務(wù)。通過NVIDIA Metropolis平臺(tái)的實(shí)時(shí)推理和總結(jié)藍(lán)圖,Thor可以在多個(gè)攝像頭和傳感器上運(yùn)行LLM和VLM,分析實(shí)時(shí)視頻流以監(jiān)測安全或優(yōu)化城市服務(wù)。例如,機(jī)器人可以根據(jù)實(shí)時(shí)數(shù)據(jù)調(diào)整巡邏路線,增強(qiáng)公共安全。
在農(nóng)業(yè)和資源開采等場景中,機(jī)器人需要在惡劣環(huán)境中執(zhí)行任務(wù),如溫室種植或石油勘探。Thor的高性能和能效使其能夠在這些環(huán)境中運(yùn)行復(fù)雜的AI模型,確保機(jī)器人能夠自主導(dǎo)航和執(zhí)行任務(wù),同時(shí)保持低功耗以延長運(yùn)行時(shí)間。
人形機(jī)器人智能的轉(zhuǎn)折點(diǎn)
NVIDIA通過提供三個(gè)計(jì)算平臺(tái)——DGX用于訓(xùn)練、Omniverse用于仿真、Jetson Thor用于運(yùn)行時(shí)部署——構(gòu)建了一個(gè)完整的機(jī)器人開發(fā)生態(tài)系統(tǒng)。Project GR00T作為人形機(jī)器人的基礎(chǔ)模型,進(jìn)一步加速了開發(fā)流程。全球超過200萬開發(fā)者和7000多家公司正在使用Jetson平臺(tái),其中包括中國的領(lǐng)先企業(yè),如Agibot、Galbot、UBTech、Unitree,以及智慧城市技術(shù)提供商Wangyi和醫(yī)療公司United Imaging。
NVIDIA與Infineon等公司的合作進(jìn)一步增強(qiáng)了Thor的生態(tài)系統(tǒng)。Infineon的微控制器、傳感器和智能執(zhí)行器與Thor無縫集成,為人形機(jī)器人提供了高效的電機(jī)控制解決方案。這種生態(tài)系統(tǒng)支持確保開發(fā)者能夠快速構(gòu)建和部署機(jī)器人應(yīng)用。
NVIDIA表示Jetson Thor現(xiàn)已在全球范圍內(nèi)通過分銷商提供,中國開發(fā)者可立即購買開發(fā)者套件(定價(jià)3499美元),T5000模塊已上市,T4000模塊將于2025年第四季度推出。
全新Jetson Thor的發(fā)布,或可真正助力“物理AI和機(jī)器人領(lǐng)域的ChatGPT時(shí)刻”到來。憑借2070 TFLOPS的算力、低延遲推理和對生成式AI的支持,Thor為人形機(jī)器人提供了前所未有的智能能力。從實(shí)時(shí)多模態(tài)處理到高能效邊緣計(jì)算,Thor解決了機(jī)器人技術(shù)中的核心挑戰(zhàn),并通過NVIDIA的生態(tài)系統(tǒng)和持續(xù)軟件優(yōu)化,為開發(fā)者提供了長期價(jià)值。