www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 原創(chuàng) > 劉巖軒
[導(dǎo)讀]在CoRL 2025上,英偉達(dá)發(fā)布了全新的Isaac GR00T N1.6人形機(jī)器人基礎(chǔ)模型和Newton物理引擎。Isaac GR00T N1.6預(yù)集成了Cosmos Reason作為核心組件,將大幅提升機(jī)器人的“腦力”,而Newton來自與Google DeepMind、Disney Research合作的成果,將會增強(qiáng)機(jī)器人在復(fù)雜物理世界中的“運動表現(xiàn)”。除此外,英偉達(dá)也帶來了全新的世界基礎(chǔ)模型更新,包括即將推出的Cosmos Predict 2.5和Cosmos Transfer 2.5。

機(jī)器人的“思考腦力”提升+“運動表現(xiàn)”增強(qiáng),英偉達(dá)發(fā)布全新Isaac GR00T N1.6、Newton物理引擎和全新世界基礎(chǔ)模型

如何讓人形機(jī)器人變得更加“類人化”?這是業(yè)界探索的方向。在學(xué)習(xí)能力上,我們期望機(jī)器人具備泛化能力、模糊指令的推理能力;在運動表現(xiàn)上,我們希望其能夠應(yīng)對真實物理世界的各種復(fù)雜環(huán)境、實現(xiàn)更好的環(huán)境感知和更高難度復(fù)雜動作。而在整個的訓(xùn)練過程中,我們又期待能夠進(jìn)一步縮短Sim2Real的差距,加速機(jī)器人的開發(fā)和部署。所有的這些背后,離不開強(qiáng)大的仿真引擎、推理模型和更全面的工具集。

在CoRL 2025上,英偉達(dá)發(fā)布了全新的Isaac GR00T N1.6人形機(jī)器人基礎(chǔ)模型和Newton物理引擎。Isaac GR00T N1.6預(yù)集成了Cosmos Reason作為核心組件,將大幅提升機(jī)器人的“腦力”,而Newton來自與Google DeepMind、Disney Research合作的成果,將會增強(qiáng)機(jī)器人在復(fù)雜物理世界中的“運動表現(xiàn)”。除此外,英偉達(dá)也帶來了全新的世界基礎(chǔ)模型更新,包括即將推出的Cosmos Predict 2.5和Cosmos Transfer 2.5。


NVIDIA Newton:可微分物理能力提升復(fù)雜任務(wù)訓(xùn)練效率

NVIDIA Newton 是一個開源、GPU 加速的物理引擎,于今年3月在GTC San Jose首次宣布,由 NVIDIA 聯(lián)合 Google DeepMind 和 Disney Research 共同開發(fā),基于 NVIDIA Omniverse 平臺和 OpenUSD 格式構(gòu)建。該引擎專為機(jī)器人研究人員設(shè)計,旨在通過高保真、可微分的物理模擬加速機(jī)器人訓(xùn)練與開發(fā)。其 Beta 版本現(xiàn)已向所有機(jī)器人開發(fā)者開放,由 Linux Foundation 托管,確保其開源性和社區(qū)驅(qū)動特性。

Newton 的設(shè)計目標(biāo)是解決機(jī)器人訓(xùn)練中的關(guān)鍵挑戰(zhàn),特別是人形機(jī)器人和其他復(fù)雜機(jī)器人系統(tǒng)在關(guān)節(jié)、平衡和運動方面的復(fù)雜性。它通過提供靈活、模擬器無關(guān)的架構(gòu),與多種機(jī)器人學(xué)習(xí)框架(如 Joker 和 NVIDIA Isaac Lab)無縫兼容。Newton 具備可微分物理能力,使機(jī)器人能夠通過試錯學(xué)習(xí)動作如何影響環(huán)境結(jié)果,類似于人類通過反復(fù)嘗試優(yōu)化行為。使用可微分物理模擬器訓(xùn)練控制策略,梯度可以直接從任務(wù)目標(biāo)(如末端執(zhí)行器位置)反向傳播到控制輸入。這種方式相比強(qiáng)化學(xué)習(xí)的路徑更高效,樣本利用率高,因此這種特性特別適用于訓(xùn)練機(jī)器人執(zhí)行移動和物體操縱等復(fù)雜任務(wù)。

此外,Newton 支持多種求解器協(xié)同工作,能夠處理復(fù)雜的多場景模擬,提升了其靈活性和擴(kuò)展性。全球領(lǐng)先的學(xué)術(shù)機(jī)構(gòu),包括蘇黎世聯(lián)邦理工學(xué)院機(jī)器人系統(tǒng)實驗室、慕尼黑工業(yè)大學(xué)和北京大學(xué),已開始采用 Newton,用于機(jī)器人研究和開發(fā)。NVIDIA Omniverse和模擬技術(shù)副總裁Rev Lebaredian強(qiáng)調(diào),Newton 的開源性質(zhì)使其成為社區(qū)驅(qū)動的工具,旨在推動全球機(jī)器人學(xué)界的合作與創(chuàng)新。

通過 Newton,NVIDIA 為機(jī)器人開發(fā)者提供了強(qiáng)大的模擬工具,助力生成物理準(zhǔn)確的合成數(shù)據(jù),減少對成本高昂且潛在危險的現(xiàn)實世界數(shù)據(jù)的依賴,從而加速物理 AI 的開發(fā)和部署。


泛化能力提升,更具“類人”推理能力——NVIDIA Isaac GR00T N1.6集成“深度思考大腦”

自O(shè)penAI 的 CLIP(Contrastive Language–Image Pretraining)模型的成功之后,VLA實現(xiàn)了處理靜態(tài)視覺信息和語言關(guān)聯(lián)方面的成功,為機(jī)器人感知環(huán)境奠定了基礎(chǔ)。但Rev Lebaredian指出:“它們(VLA)尚未能夠解決多步任務(wù),也無法處理歧義或新奇體驗。人類可以基于日常經(jīng)驗導(dǎo)航物理世界中多樣化場景的長尾。但人形機(jī)器人需要推理能力來理解歧義指令并適應(yīng)全新的、陌生的情境?!?

換言之,現(xiàn)在的VLA模型很擅長認(rèn)東西、找規(guī)律,但遇到需要多步操作、模糊指令或全新場景時就“懵了”。而我們?nèi)祟惪咳粘=?jīng)驗?zāi)茌p松應(yīng)對各種復(fù)雜情況,但機(jī)器人要想做到類似的事,必須有“思考”、“推理”能力,能理解模糊的話、適應(yīng)沒見過的情景。而這就是NVIDIA Isaac GR00T N1.6將要幫助機(jī)器人“進(jìn)化”的下一步目標(biāo)。

此次發(fā)布的NVIDIA Isaac GR00T N1.6 是開源機(jī)器人基礎(chǔ)模型的全新版本,即將登陸Hugging Face平臺。相比Isaac GR00T N1.5,它最大的特點在于——集成了Cosmos Reason作為核心組件,能夠大幅提升機(jī)器人在不同場景中的泛化能力。

從人類學(xué)習(xí)的角度看,泛化能力是一種核心認(rèn)知機(jī)制。幼童通過有限互動學(xué)會用勺子吃飯后,能將技能泛化到不同餐具或環(huán)境,源于大腦提取抽象規(guī)則而非死記硬背。這種能力遷移到機(jī)器人,即從有限訓(xùn)練數(shù)據(jù)中習(xí)得知識,應(yīng)用于未見環(huán)境、物體或任務(wù),避免僅在特定場景有效。而推理能力是這種泛化的認(rèn)知基礎(chǔ),通過語義解析、知識遷移和動態(tài)調(diào)整,機(jī)器人能理解模糊指令(如“拿那個東西”)并適應(yīng)新場景(如未知廚房等)。通過推理能力來提取通用規(guī)則,然后才能實現(xiàn)機(jī)器人的泛化表現(xiàn),實現(xiàn)機(jī)器人從“專才”向“通才”的轉(zhuǎn)型,類似人類通過邏輯應(yīng)對復(fù)雜世界。提升泛化需增強(qiáng)推理,如通過多模態(tài)訓(xùn)練或因果推理模塊優(yōu)化。

Cosmos Reason是一個開源且可定制的推理視覺語言模型,專為物理AI設(shè)計。而將Cosmos Reason引入 Isaac GR00T N1.6,就類似于為人形機(jī)器人注入一個“深度思考大腦”,它能處理模糊指令和從未見過的罕見場景,利用先驗知識、常識以及物理原理,將這些指令轉(zhuǎn)化為步步推進(jìn)的行動計劃,從而實現(xiàn)跨任務(wù)的泛化能力。這使得 Isaac GR00T N1.6在執(zhí)行物理世界中的類人任務(wù)時顯著提升了推理水平,不再僅依賴預(yù)訓(xùn)練數(shù)據(jù),而是能實時規(guī)劃和適應(yīng)新環(huán)境,解決了傳統(tǒng)機(jī)器人模型在泛化方面的瓶頸。

除了Cosmos Reason的引入外,Isaac GR00T 1.6 還增強(qiáng)了人形機(jī)器人的運動與物體操作能力,提供了更大的軀干和手臂自由度,使機(jī)器人能夠應(yīng)對更具挑戰(zhàn)性的任務(wù),例如打開沉重的門。


世界基礎(chǔ)模型更新,加速Sim2Real進(jìn)程

與基于互聯(lián)網(wǎng)海量人類知識訓(xùn)練的傳統(tǒng)大語言模型(LLM)不同,物理 AI 模型的訓(xùn)練面臨數(shù)據(jù)稀缺的挑戰(zhàn)。現(xiàn)實世界數(shù)據(jù)的采集成本高昂且存在潛在風(fēng)險,預(yù)訓(xùn)練的局限性也限制了模型的迭代能力。機(jī)器人要實現(xiàn)從基礎(chǔ)感知到高級智能的演進(jìn),就需要具備足夠高質(zhì)量的數(shù)據(jù)支持。通過人類演示和合成數(shù)據(jù)生成(結(jié)合強(qiáng)化學(xué)習(xí)和物理模擬),能夠顯著提升機(jī)器人的模型能力。

Rev Lebaredian強(qiáng)調(diào),仿真對于開發(fā)和部署機(jī)器人至關(guān)重要,其作用主要體現(xiàn)在兩個方面。首先,仿真是生成訓(xùn)練機(jī)器人智能所需數(shù)據(jù)的主要方式。機(jī)器人需要一種通用的智能,使其能夠在物理世界中工作,而這種智能的訓(xùn)練依賴于物理準(zhǔn)確、豐富多樣且能夠代表現(xiàn)實世界中各種情境的數(shù)據(jù)。由于在現(xiàn)實世界中收集這些數(shù)據(jù)的難度大、成本高,有時甚至在物理上不可行或存在危險,因此必須通過仿真來生成這些數(shù)據(jù)。其次,仿真在將新AI部署到物理機(jī)器人之前,用于測試其性能和安全性。在AI進(jìn)入現(xiàn)實世界之前,我們需要確保其行為可靠,不會對自身或他人造成傷害,并能達(dá)到預(yù)期的表現(xiàn)。仿真提供了一個快速、安全且成本效益高的測試環(huán)境。因此,仿真不僅用于生成訓(xùn)練AI所需的適當(dāng)數(shù)據(jù),還用于以安全、可擴(kuò)展的方式測試AI的性能,從而確保機(jī)器人在現(xiàn)實世界中的可靠性和安全性。

仿真是橋接虛擬與現(xiàn)實(Sim2Real)的關(guān)鍵橋梁,而英偉達(dá)正通過其最新創(chuàng)新來進(jìn)一步強(qiáng)化這一橋梁。此次英偉達(dá)宣布將會帶來世界基礎(chǔ)模型的重大升級版,其中包括即將發(fā)布的Cosmos Predict 2.5和Cosmos Transfer 2.5。這一升級不僅能助力生成海量基于物理的合成數(shù)據(jù),幫助開發(fā)者克服現(xiàn)實世界數(shù)據(jù)收集的瓶頸,還能無縫集成到Omniverse模擬環(huán)境中,實現(xiàn)更精確的場景構(gòu)建和AI測試,讓機(jī)器人開發(fā)變得更具可擴(kuò)展性。

據(jù)悉,即將發(fā)布的Cosmos Predict 2.5能夠從初始狀態(tài)預(yù)測未來狀態(tài),實現(xiàn)三個獨立模型的統(tǒng)一,從而減少后訓(xùn)練時間、復(fù)雜性和計算成本;其輸出質(zhì)量明顯高于先前版本以及同等規(guī)模的開源模型;此外,它現(xiàn)支持多視圖輸出,適用于多傳感器機(jī)器人和自動駕駛車輛,并能生成長達(dá)30秒的視頻。

而即將發(fā)布的Cosmos Transfer 2.5則負(fù)責(zé)世界到世界(world to world)的風(fēng)格轉(zhuǎn)移,旨在彌合模擬環(huán)境和現(xiàn)實世界之間的感知鴻溝。其最新版本模型大小僅為上一代模型的 1/3.5,從而降低計算成本,并便于開發(fā)者增強(qiáng)和擴(kuò)展訓(xùn)練數(shù)據(jù)。這些模型的結(jié)合,使得生成數(shù)百個虛擬的、傳感器豐富的環(huán)境用于機(jī)器人訓(xùn)練成為可能,從而顯著減少對現(xiàn)實世界數(shù)據(jù)的依賴。


從感知AI到物理AI,英偉達(dá)三臺計算機(jī)加速行業(yè)協(xié)作

AI的快速發(fā)展正在推動技術(shù)從感知AI向生成AI、代理AI,最終邁向物理AI的轉(zhuǎn)型。這一演進(jìn)歷程始于十多年前AlexNet的出現(xiàn),AI由此進(jìn)入大爆炸式發(fā)展階段,感知AI時代正式。當(dāng)時,神經(jīng)網(wǎng)絡(luò)專注于單一任務(wù),如圖像分類和語音識別。隨后,Transformer模型的發(fā)明引領(lǐng)了生成AI時代,模型規(guī)模更大、訓(xùn)練數(shù)據(jù)更多,具備通用性,能執(zhí)行多種任務(wù)。目前,我們正步入代理AI時代,自主系統(tǒng)能夠在信息和知識領(lǐng)域使用工具、編寫代碼或執(zhí)行復(fù)雜任務(wù)。緊隨其后的是物理AI時代,代理AI被賦予物理實體,進(jìn)入機(jī)器人領(lǐng)域。這一時代建立在過去十年的技術(shù)積累之上,尤其在自動駕駛汽車等特定機(jī)器人領(lǐng)域已顯現(xiàn)成熟跡象。自動駕駛作為運輸機(jī)器人的一種,因其主要任務(wù)是避免碰撞,相較于需與環(huán)境直接交互的通用機(jī)器人,技術(shù)實現(xiàn)相對簡單,但仍是物理AI的重要起點。

Rev Lebaredian強(qiáng)調(diào),構(gòu)建物理AI和人形機(jī)器人是一項極其復(fù)雜的挑戰(zhàn),涉及眾多行業(yè)和子任務(wù),單一公司難以獨立完成。所需的研究、工程以及商業(yè)模式創(chuàng)新規(guī)模龐大,因此需要整個行業(yè)生態(tài)系統(tǒng)的協(xié)作。英偉達(dá)在這一生態(tài)系統(tǒng)中定位明確,專注于為機(jī)器人和物理AI提供三種關(guān)鍵計算平臺:一是嵌入機(jī)器人內(nèi)部的Jetson Thor和IGX Orin計算機(jī);二是生成機(jī)器人“大腦”的DGX和HGX AI工廠計算機(jī);三是基于RTX Pro Blackwell平臺的Omniverse模擬計算機(jī),用于AI大腦的開發(fā)與測試。這些計算平臺對機(jī)器人生態(tài)系統(tǒng)至關(guān)重要,但英偉達(dá)并非獨自承擔(dān)所有任務(wù)。行業(yè)需要其他公司開發(fā)機(jī)器人硬件、操作系統(tǒng)、管理工具以及特定場景的AI模型。英偉達(dá)的獨特優(yōu)勢在于其廣泛的合作網(wǎng)絡(luò),幾乎所有從事物理AI或機(jī)器人的公司都在使用至少一種英偉達(dá)的計算平臺,許多公司甚至同時使用兩種或三種。這種合作模式凸顯了英偉達(dá)在推動物理AI和機(jī)器人產(chǎn)業(yè)向前發(fā)展中的核心角色,同時也反映了行業(yè)協(xié)作的必要性,以應(yīng)對機(jī)器人技術(shù)發(fā)展的復(fù)雜性和多樣性。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機(jī)驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機(jī)驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉