機(jī)器人的“思考腦力”提升+“運動表現(xiàn)”增強(qiáng)，英偉達(dá)發(fā)布全新Isaac GR00T N1.6、Newton物理引擎和全新世界基礎(chǔ)模型

時間：2025-09-29 23:14:11

關(guān)鍵字：機(jī)器人 NVIDIA 英偉達(dá) Isaac GR00T Newton 世界基礎(chǔ)模型

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]在CoRL 2025上，英偉達(dá)發(fā)布了全新的Isaac GR00T N1.6人形機(jī)器人基礎(chǔ)模型和Newton物理引擎。Isaac GR00T N1.6預(yù)集成了Cosmos Reason作為核心組件，將大幅提升機(jī)器人的“腦力”，而Newton來自與Google DeepMind、Disney Research合作的成果，將會增強(qiáng)機(jī)器人在復(fù)雜物理世界中的“運動表現(xiàn)”。除此外，英偉達(dá)也帶來了全新的世界基礎(chǔ)模型更新，包括即將推出的Cosmos Predict 2.5和Cosmos Transfer 2.5。

機(jī)器人的“思考腦力”提升+“運動表現(xiàn)”增強(qiáng)，英偉達(dá)發(fā)布全新Isaac GR00T N1.6、Newton物理引擎和全新世界基礎(chǔ)模型

如何讓人形機(jī)器人變得更加“類人化”？這是業(yè)界探索的方向。在學(xué)習(xí)能力上，我們期望機(jī)器人具備泛化能力、模糊指令的推理能力；在運動表現(xiàn)上，我們希望其能夠應(yīng)對真實物理世界的各種復(fù)雜環(huán)境、實現(xiàn)更好的環(huán)境感知和更高難度復(fù)雜動作。而在整個的訓(xùn)練過程中，我們又期待能夠進(jìn)一步縮短Sim2Real的差距，加速機(jī)器人的開發(fā)和部署。所有的這些背后，離不開強(qiáng)大的仿真引擎、推理模型和更全面的工具集。

在CoRL 2025上，英偉達(dá)發(fā)布了全新的Isaac GR00T N1.6人形機(jī)器人基礎(chǔ)模型和Newton物理引擎。Isaac GR00T N1.6預(yù)集成了Cosmos Reason作為核心組件，將大幅提升機(jī)器人的“腦力”，而Newton來自與Google DeepMind、Disney Research合作的成果，將會增強(qiáng)機(jī)器人在復(fù)雜物理世界中的“運動表現(xiàn)”。除此外，英偉達(dá)也帶來了全新的世界基礎(chǔ)模型更新，包括即將推出的Cosmos Predict 2.5和Cosmos Transfer 2.5。

NVIDIA Newton：可微分物理能力提升復(fù)雜任務(wù)訓(xùn)練效率

NVIDIA Newton 是一個開源、GPU 加速的物理引擎，于今年3月在GTC San Jose首次宣布，由 NVIDIA 聯(lián)合 Google DeepMind 和 Disney Research 共同開發(fā)，基于 NVIDIA Omniverse 平臺和 OpenUSD 格式構(gòu)建。該引擎專為機(jī)器人研究人員設(shè)計，旨在通過高保真、可微分的物理模擬加速機(jī)器人訓(xùn)練與開發(fā)。其 Beta 版本現(xiàn)已向所有機(jī)器人開發(fā)者開放，由 Linux Foundation 托管，確保其開源性和社區(qū)驅(qū)動特性。

Newton 的設(shè)計目標(biāo)是解決機(jī)器人訓(xùn)練中的關(guān)鍵挑戰(zhàn)，特別是人形機(jī)器人和其他復(fù)雜機(jī)器人系統(tǒng)在關(guān)節(jié)、平衡和運動方面的復(fù)雜性。它通過提供靈活、模擬器無關(guān)的架構(gòu)，與多種機(jī)器人學(xué)習(xí)框架（如 Joker 和 NVIDIA Isaac Lab）無縫兼容。Newton 具備可微分物理能力，使機(jī)器人能夠通過試錯學(xué)習(xí)動作如何影響環(huán)境結(jié)果，類似于人類通過反復(fù)嘗試優(yōu)化行為。使用可微分物理模擬器訓(xùn)練控制策略，梯度可以直接從任務(wù)目標(biāo)（如末端執(zhí)行器位置）反向傳播到控制輸入。這種方式相比強(qiáng)化學(xué)習(xí)的路徑更高效，樣本利用率高，因此這種特性特別適用于訓(xùn)練機(jī)器人執(zhí)行移動和物體操縱等復(fù)雜任務(wù)。

此外，Newton 支持多種求解器協(xié)同工作，能夠處理復(fù)雜的多場景模擬，提升了其靈活性和擴(kuò)展性。全球領(lǐng)先的學(xué)術(shù)機(jī)構(gòu)，包括蘇黎世聯(lián)邦理工學(xué)院機(jī)器人系統(tǒng)實驗室、慕尼黑工業(yè)大學(xué)和北京大學(xué)，已開始采用 Newton，用于機(jī)器人研究和開發(fā)。NVIDIA Omniverse和模擬技術(shù)副總裁Rev Lebaredian強(qiáng)調(diào)，Newton 的開源性質(zhì)使其成為社區(qū)驅(qū)動的工具，旨在推動全球機(jī)器人學(xué)界的合作與創(chuàng)新。

通過 Newton，NVIDIA 為機(jī)器人開發(fā)者提供了強(qiáng)大的模擬工具，助力生成物理準(zhǔn)確的合成數(shù)據(jù)，減少對成本高昂且潛在危險的現(xiàn)實世界數(shù)據(jù)的依賴，從而加速物理 AI 的開發(fā)和部署。

泛化能力提升，更具“類人”推理能力——NVIDIA Isaac GR00T N1.6集成“深度思考大腦”

自O(shè)penAI 的 CLIP（Contrastive Language–Image Pretraining）模型的成功之后，VLA實現(xiàn)了處理靜態(tài)視覺信息和語言關(guān)聯(lián)方面的成功，為機(jī)器人感知環(huán)境奠定了基礎(chǔ)。但Rev Lebaredian指出：“它們（VLA）尚未能夠解決多步任務(wù)，也無法處理歧義或新奇體驗。人類可以基于日常經(jīng)驗導(dǎo)航物理世界中多樣化場景的長尾。但人形機(jī)器人需要推理能力來理解歧義指令并適應(yīng)全新的、陌生的情境?！?

換言之，現(xiàn)在的VLA模型很擅長認(rèn)東西、找規(guī)律，但遇到需要多步操作、模糊指令或全新場景時就“懵了”。而我們?nèi)祟惪咳粘＝?jīng)驗?zāi)茌p松應(yīng)對各種復(fù)雜情況，但機(jī)器人要想做到類似的事，必須有“思考”、“推理”能力，能理解模糊的話、適應(yīng)沒見過的情景。而這就是NVIDIA Isaac GR00T N1.6將要幫助機(jī)器人“進(jìn)化”的下一步目標(biāo)。

此次發(fā)布的NVIDIA Isaac GR00T N1.6 是開源機(jī)器人基礎(chǔ)模型的全新版本，即將登陸Hugging Face平臺。相比Isaac GR00T N1.5，它最大的特點在于——集成了Cosmos Reason作為核心組件，能夠大幅提升機(jī)器人在不同場景中的泛化能力。

從人類學(xué)習(xí)的角度看，泛化能力是一種核心認(rèn)知機(jī)制。幼童通過有限互動學(xué)會用勺子吃飯后，能將技能泛化到不同餐具或環(huán)境，源于大腦提取抽象規(guī)則而非死記硬背。這種能力遷移到機(jī)器人，即從有限訓(xùn)練數(shù)據(jù)中習(xí)得知識，應(yīng)用于未見環(huán)境、物體或任務(wù)，避免僅在特定場景有效。而推理能力是這種泛化的認(rèn)知基礎(chǔ)，通過語義解析、知識遷移和動態(tài)調(diào)整，機(jī)器人能理解模糊指令（如“拿那個東西”）并適應(yīng)新場景（如未知廚房等）。通過推理能力來提取通用規(guī)則，然后才能實現(xiàn)機(jī)器人的泛化表現(xiàn)，實現(xiàn)機(jī)器人從“專才”向“通才”的轉(zhuǎn)型，類似人類通過邏輯應(yīng)對復(fù)雜世界。提升泛化需增強(qiáng)推理，如通過多模態(tài)訓(xùn)練或因果推理模塊優(yōu)化。

Cosmos Reason是一個開源且可定制的推理視覺語言模型，專為物理AI設(shè)計。而將Cosmos Reason引入 Isaac GR00T N1.6，就類似于為人形機(jī)器人注入一個“深度思考大腦”，它能處理模糊指令和從未見過的罕見場景，利用先驗知識、常識以及物理原理，將這些指令轉(zhuǎn)化為步步推進(jìn)的行動計劃，從而實現(xiàn)跨任務(wù)的泛化能力。這使得 Isaac GR00T N1.6在執(zhí)行物理世界中的類人任務(wù)時顯著提升了推理水平，不再僅依賴預(yù)訓(xùn)練數(shù)據(jù)，而是能實時規(guī)劃和適應(yīng)新環(huán)境，解決了傳統(tǒng)機(jī)器人模型在泛化方面的瓶頸。

除了Cosmos Reason的引入外，Isaac GR00T 1.6 還增強(qiáng)了人形機(jī)器人的運動與物體操作能力，提供了更大的軀干和手臂自由度，使機(jī)器人能夠應(yīng)對更具挑戰(zhàn)性的任務(wù)，例如打開沉重的門。

世界基礎(chǔ)模型更新，加速Sim2Real進(jìn)程

與基于互聯(lián)網(wǎng)海量人類知識訓(xùn)練的傳統(tǒng)大語言模型（LLM）不同，物理 AI 模型的訓(xùn)練面臨數(shù)據(jù)稀缺的挑戰(zhàn)。現(xiàn)實世界數(shù)據(jù)的采集成本高昂且存在潛在風(fēng)險，預(yù)訓(xùn)練的局限性也限制了模型的迭代能力。機(jī)器人要實現(xiàn)從基礎(chǔ)感知到高級智能的演進(jìn)，就需要具備足夠高質(zhì)量的數(shù)據(jù)支持。通過人類演示和合成數(shù)據(jù)生成（結(jié)合強(qiáng)化學(xué)習(xí)和物理模擬），能夠顯著提升機(jī)器人的模型能力。

Rev Lebaredian強(qiáng)調(diào)，仿真對于開發(fā)和部署機(jī)器人至關(guān)重要，其作用主要體現(xiàn)在兩個方面。首先，仿真是生成訓(xùn)練機(jī)器人智能所需數(shù)據(jù)的主要方式。機(jī)器人需要一種通用的智能，使其能夠在物理世界中工作，而這種智能的訓(xùn)練依賴于物理準(zhǔn)確、豐富多樣且能夠代表現(xiàn)實世界中各種情境的數(shù)據(jù)。由于在現(xiàn)實世界中收集這些數(shù)據(jù)的難度大、成本高，有時甚至在物理上不可行或存在危險，因此必須通過仿真來生成這些數(shù)據(jù)。其次，仿真在將新AI部署到物理機(jī)器人之前，用于測試其性能和安全性。在AI進(jìn)入現(xiàn)實世界之前，我們需要確保其行為可靠，不會對自身或他人造成傷害，并能達(dá)到預(yù)期的表現(xiàn)。仿真提供了一個快速、安全且成本效益高的測試環(huán)境。因此，仿真不僅用于生成訓(xùn)練AI所需的適當(dāng)數(shù)據(jù)，還用于以安全、可擴(kuò)展的方式測試AI的性能，從而確保機(jī)器人在現(xiàn)實世界中的可靠性和安全性。

仿真是橋接虛擬與現(xiàn)實（Sim2Real）的關(guān)鍵橋梁，而英偉達(dá)正通過其最新創(chuàng)新來進(jìn)一步強(qiáng)化這一橋梁。此次英偉達(dá)宣布將會帶來世界基礎(chǔ)模型的重大升級版，其中包括即將發(fā)布的Cosmos Predict 2.5和Cosmos Transfer 2.5。這一升級不僅能助力生成海量基于物理的合成數(shù)據(jù)，幫助開發(fā)者克服現(xiàn)實世界數(shù)據(jù)收集的瓶頸，還能無縫集成到Omniverse模擬環(huán)境中，實現(xiàn)更精確的場景構(gòu)建和AI測試，讓機(jī)器人開發(fā)變得更具可擴(kuò)展性。

據(jù)悉，即將發(fā)布的Cosmos Predict 2.5能夠從初始狀態(tài)預(yù)測未來狀態(tài)，實現(xiàn)三個獨立模型的統(tǒng)一，從而減少后訓(xùn)練時間、復(fù)雜性和計算成本；其輸出質(zhì)量明顯高于先前版本以及同等規(guī)模的開源模型；此外，它現(xiàn)支持多視圖輸出，適用于多傳感器機(jī)器人和自動駕駛車輛，并能生成長達(dá)30秒的視頻。

而即將發(fā)布的Cosmos Transfer 2.5則負(fù)責(zé)世界到世界（world to world）的風(fēng)格轉(zhuǎn)移，旨在彌合模擬環(huán)境和現(xiàn)實世界之間的感知鴻溝。其最新版本模型大小僅為上一代模型的 1/3.5，從而降低計算成本，并便于開發(fā)者增強(qiáng)和擴(kuò)展訓(xùn)練數(shù)據(jù)。這些模型的結(jié)合，使得生成數(shù)百個虛擬的、傳感器豐富的環(huán)境用于機(jī)器人訓(xùn)練成為可能，從而顯著減少對現(xiàn)實世界數(shù)據(jù)的依賴。

從感知AI到物理AI，英偉達(dá)三臺計算機(jī)加速行業(yè)協(xié)作

AI的快速發(fā)展正在推動技術(shù)從感知AI向生成AI、代理AI，最終邁向物理AI的轉(zhuǎn)型。這一演進(jìn)歷程始于十多年前AlexNet的出現(xiàn)，AI由此進(jìn)入大爆炸式發(fā)展階段，感知AI時代正式。當(dāng)時，神經(jīng)網(wǎng)絡(luò)專注于單一任務(wù)，如圖像分類和語音識別。隨后，Transformer模型的發(fā)明引領(lǐng)了生成AI時代，模型規(guī)模更大、訓(xùn)練數(shù)據(jù)更多，具備通用性，能執(zhí)行多種任務(wù)。目前，我們正步入代理AI時代，自主系統(tǒng)能夠在信息和知識領(lǐng)域使用工具、編寫代碼或執(zhí)行復(fù)雜任務(wù)。緊隨其后的是物理AI時代，代理AI被賦予物理實體，進(jìn)入機(jī)器人領(lǐng)域。這一時代建立在過去十年的技術(shù)積累之上，尤其在自動駕駛汽車等特定機(jī)器人領(lǐng)域已顯現(xiàn)成熟跡象。自動駕駛作為運輸機(jī)器人的一種，因其主要任務(wù)是避免碰撞，相較于需與環(huán)境直接交互的通用機(jī)器人，技術(shù)實現(xiàn)相對簡單，但仍是物理AI的重要起點。

Rev Lebaredian強(qiáng)調(diào)，構(gòu)建物理AI和人形機(jī)器人是一項極其復(fù)雜的挑戰(zhàn)，涉及眾多行業(yè)和子任務(wù)，單一公司難以獨立完成。所需的研究、工程以及商業(yè)模式創(chuàng)新規(guī)模龐大，因此需要整個行業(yè)生態(tài)系統(tǒng)的協(xié)作。英偉達(dá)在這一生態(tài)系統(tǒng)中定位明確，專注于為機(jī)器人和物理AI提供三種關(guān)鍵計算平臺：一是嵌入機(jī)器人內(nèi)部的Jetson Thor和IGX Orin計算機(jī)；二是生成機(jī)器人“大腦”的DGX和HGX AI工廠計算機(jī)；三是基于RTX Pro Blackwell平臺的Omniverse模擬計算機(jī)，用于AI大腦的開發(fā)與測試。這些計算平臺對機(jī)器人生態(tài)系統(tǒng)至關(guān)重要，但英偉達(dá)并非獨自承擔(dān)所有任務(wù)。行業(yè)需要其他公司開發(fā)機(jī)器人硬件、操作系統(tǒng)、管理工具以及特定場景的AI模型。英偉達(dá)的獨特優(yōu)勢在于其廣泛的合作網(wǎng)絡(luò)，幾乎所有從事物理AI或機(jī)器人的公司都在使用至少一種英偉達(dá)的計算平臺，許多公司甚至同時使用兩種或三種。這種合作模式凸顯了英偉達(dá)在推動物理AI和機(jī)器人產(chǎn)業(yè)向前發(fā)展中的核心角色，同時也反映了行業(yè)協(xié)作的必要性，以應(yīng)對機(jī)器人技術(shù)發(fā)展的復(fù)雜性和多樣性。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅(qū)動方式相比，共陰恒流驅(qū)動在能效有哪些優(yōu)勢

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動電源

[電源]

工業(yè)電機(jī)驅(qū)動電源設(shè)計：反電動勢抑制與過流保護(hù)的集成方案

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下，工業(yè)電機(jī)作為核心動力設(shè)備，其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié)，集成化方案的設(shè)計成為提升電機(jī)驅(qū)動性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機(jī) 驅(qū)動電源

[電源]

如何解決 LED 驅(qū)動電源的易損壞問題

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而，在實際應(yīng)用中，LED 驅(qū)動電源易損壞的問題卻十分常見，不僅增加了維護(hù)成本，還影響了用戶體驗。要解決這一問題，需從設(shè)計、生...

關(guān)鍵字：驅(qū)動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設(shè)計中LED驅(qū)動電源的公式

根據(jù)LED驅(qū)動電源的公式，電感內(nèi)電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設(shè)計驅(qū)動電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機(jī)驅(qū)動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字：電動汽車新能源驅(qū)動電源

[電源]

合理的驅(qū)動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設(shè)中，街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步，高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動電源 LED

[消費電子]