物理AI革命提速,英偉達(dá)全新仿真技術(shù)助力行業(yè)應(yīng)用全景展開
在全球人工智能(AI)和機(jī)器人技術(shù)浪潮的推動(dòng)下,2025年正成為物理AI發(fā)展的關(guān)鍵節(jié)點(diǎn)。根據(jù)Market Research Future的預(yù)測(cè),全球機(jī)器人市場(chǎng)2024年規(guī)模為740億美元,預(yù)計(jì)到2032年將增長(zhǎng)至4470億美元,年復(fù)合增長(zhǎng)率(CAGR)達(dá)18.4%。與此同時(shí),Statista數(shù)據(jù)顯示,AI驅(qū)動(dòng)的機(jī)器人市場(chǎng)2024年為190億美元,到2030年將達(dá)到643.5億美元,CAGR為23.37%。這一快速增長(zhǎng)的背后,是物理AI作為核心技術(shù)的崛起——它將AI從數(shù)字領(lǐng)域擴(kuò)展到物理世界,使機(jī)器能夠通過(guò)傳感器和實(shí)時(shí)計(jì)算與現(xiàn)實(shí)環(huán)境直接互動(dòng)。從工業(yè)生產(chǎn)中的機(jī)械臂,到城市街道上的自動(dòng)駕駛汽車,再到服務(wù)于日常生活的人形機(jī)器人,物理AI正在重塑多個(gè)行業(yè)的未來(lái)。這一宏大前景的實(shí)現(xiàn),不僅依賴于算力的提升,更需要仿真技術(shù)、合成數(shù)據(jù)和生態(tài)協(xié)作的全面突破。而NVIDIA,作為AI硬件與軟件的領(lǐng)導(dǎo)者,正通過(guò)其在GTC 2025上的最新戰(zhàn)略,試圖引領(lǐng)這一變革的前沿。
近日,NVIDIA在GTC上舉辦了一場(chǎng)備受矚目的新聞?lì)A(yù)簡(jiǎn)報(bào)會(huì),主題聚焦于“物理AI”的最新進(jìn)展。這場(chǎng)會(huì)議匯集了英偉達(dá)Omniverse與仿真技術(shù)副總裁拉爾夫·利伯蒂(Ralph Liberty)和英偉達(dá)汽車部門副總裁奧利·肯尼(Ollie Kenny),向全球媒體和行業(yè)觀察者展示了NVIDIA在機(jī)器人、自動(dòng)駕駛和仿真技術(shù)領(lǐng)域的宏偉藍(lán)圖。會(huì)議透露的內(nèi)容不僅勾勒出人工智能從數(shù)字世界走向物理現(xiàn)實(shí)的清晰路徑,還預(yù)示著一個(gè)由AI驅(qū)動(dòng)的機(jī)器人時(shí)代即將來(lái)臨。NVIDIA通過(guò)此次簡(jiǎn)報(bào),向外界傳遞了一個(gè)明確信號(hào):物理AI將成為其未來(lái)戰(zhàn)略的核心支柱,旨在重塑多個(gè)行業(yè)的運(yùn)作方式并推動(dòng)技術(shù)邊界的進(jìn)一步拓展。
物理AI:從數(shù)字到現(xiàn)實(shí)的橋梁
物理AI(Phy-AI)是一種基于傳感器輸入(如攝像頭、激光雷達(dá)、雷達(dá)、超聲波等)和指令生成動(dòng)作的人工智能技術(shù)。這種技術(shù)將AI從傳統(tǒng)的計(jì)算任務(wù)擴(kuò)展到物理世界,使其能夠驅(qū)動(dòng)機(jī)器人執(zhí)行復(fù)雜的現(xiàn)實(shí)任務(wù)。物理AI的三大應(yīng)用領(lǐng)域包括:設(shè)施機(jī)器人(如工廠和倉(cāng)庫(kù)中的自動(dòng)化設(shè)備)、運(yùn)輸機(jī)器人(以自動(dòng)駕駛汽車為代表)以及人形機(jī)器人或機(jī)械手。這一分類清晰地勾勒出NVIDIA對(duì)物理AI的全面布局。
物理AI的核心在于其“感知-決策-行動(dòng)”的閉環(huán)能力。傳統(tǒng)的AI模型擅長(zhǎng)處理數(shù)據(jù)和生成預(yù)測(cè),但物理AI需要實(shí)時(shí)處理來(lái)自現(xiàn)實(shí)世界的多模態(tài)輸入,并在動(dòng)態(tài)環(huán)境中做出決策。例如,一個(gè)工廠機(jī)器人需要根據(jù)攝像頭捕捉的物體位置調(diào)整抓取動(dòng)作,而一輛自動(dòng)駕駛汽車則需在毫秒內(nèi)判斷是否剎車。這種實(shí)時(shí)性、復(fù)雜性和對(duì)物理規(guī)律的依賴,使得物理AI的開發(fā)遠(yuǎn)比數(shù)字AI更具挑戰(zhàn)性。
NVIDIA的應(yīng)對(duì)之道是“三位一體”的“三計(jì)算機(jī)”技術(shù)體系:DGX用于AI模型的預(yù)訓(xùn)練和后訓(xùn)練,Omniverse與Cosmos提供仿真環(huán)境以進(jìn)行訓(xùn)練、測(cè)試和驗(yàn)證,而AGX則將精煉后的模型部署到現(xiàn)實(shí)世界。這一體系不僅展示了NVIDIA在硬件和軟件上的綜合實(shí)力,也凸顯了其對(duì)仿真技術(shù)的重視——Ralph表示,物理AI“誕生于仿真之中”,需要海量的、物理上準(zhǔn)確的合成數(shù)據(jù)來(lái)驅(qū)動(dòng)。
Omniverse與Cosmos:仿真驅(qū)動(dòng)的創(chuàng)新引擎
要實(shí)現(xiàn)物理AI的高效仿真,Omniverse和Cosmos無(wú)疑是NVIDIA物理AI戰(zhàn)略的核心技術(shù)。Omniverse作為一個(gè)數(shù)字孿生和仿真操作系統(tǒng),允許開發(fā)者構(gòu)建虛擬世界,整合來(lái)自工程設(shè)計(jì)和傳感器生態(tài)系統(tǒng)的現(xiàn)實(shí)數(shù)據(jù)。而Cosmos則是一個(gè)世界基礎(chǔ)模型平臺(tái),旨在通過(guò)AI增強(qiáng)這些虛擬環(huán)境,提供對(duì)物理世界的理解和預(yù)測(cè)能力。
Omniverse:數(shù)字孿生的基石
Omniverse以庫(kù)、API和微服務(wù)的形式提供,封裝為一系列“藍(lán)圖”(Blueprints),為開發(fā)者提供了從設(shè)計(jì)到部署的參考工作流程。在本次GTC上,NVIDIA宣布了多個(gè)藍(lán)圖的更新和擴(kuò)展,例如:
·AI工廠數(shù)字孿生藍(lán)圖:與Cadence、ETAP、施耐德電氣等合作伙伴共同開發(fā),用于設(shè)計(jì)和優(yōu)化千兆瓦級(jí)AI工廠。這一藍(lán)圖在建設(shè)開始前即可模擬布局,最大化總體擁有成本(TCO)和電力使用效率。
·MEGA藍(lán)圖:用于在工業(yè)數(shù)字孿生中測(cè)試機(jī)器人隊(duì)伍,已進(jìn)入早期訪問(wèn)階段。Keyence子公司Denso將其集成到倉(cāng)庫(kù)管理軟件中,而人形機(jī)器人開發(fā)者(如梅賽德斯-奔馳、Agility Robotics等)也在利用其為部署做準(zhǔn)備。
·Earth-2天氣分析藍(lán)圖:提供高分辨率、節(jié)能的天氣預(yù)測(cè)和災(zāi)害準(zhǔn)備能力,吸引了G42、Spire等氣候科技公司的采用。
這些藍(lán)圖的意義在于,它們將復(fù)雜的仿真技術(shù)模塊化,使開發(fā)者能夠快速構(gòu)建適用于特定行業(yè)的解決方案。發(fā)言人指出,Omniverse的開放性正在吸引更多軟件生態(tài)系統(tǒng)采用其庫(kù),從而統(tǒng)一和協(xié)調(diào)物理世界與工業(yè)數(shù)據(jù),為物理AI模型的大規(guī)模訓(xùn)練奠定基礎(chǔ)。
Cosmos:AI與經(jīng)典仿真的融合
Cosmos則代表了NVIDIA對(duì)AI驅(qū)動(dòng)仿真的最新探索。Omniverse基于經(jīng)典物理學(xué)(牛頓力學(xué)、流體動(dòng)力學(xué)等)提供基礎(chǔ)仿真,而Cosmos通過(guò)AI從現(xiàn)實(shí)觀察中提取物理規(guī)律,填補(bǔ)仿真的“最后一英里”。Cosmos與Omniverse的協(xié)同作用,能夠助力開發(fā)者快速完成大規(guī)模仿真工作。例如,給定起始和結(jié)束幀,Cosmos Predict可以生成中間的視頻序列,而Cosmos Reason則能深入理解物理交互,用于數(shù)據(jù)標(biāo)注或任務(wù)規(guī)劃。
在本次GTC上,NVIDIA推出了一系列Cosmos世界基礎(chǔ)模型,包括Cosmos Print、Predict、Reason和Transfer。這些模型在開放許可下提供,開發(fā)者可根據(jù)需求定制。例如,Cosmos Transfer結(jié)合經(jīng)典仿真和AI生成逼真的合成數(shù)據(jù),避免了傳統(tǒng)仿真中昂貴的藝術(shù)創(chuàng)作成本。這種“混合方法”不僅保持了物理真實(shí)性,還創(chuàng)造了一個(gè)“無(wú)限的合成數(shù)據(jù)生成引擎”。
此外,NVIDIA宣布開源一個(gè)統(tǒng)一的物理AI訓(xùn)練數(shù)據(jù)集,包括2000小時(shí)的自動(dòng)駕駛數(shù)據(jù)、32萬(wàn)條人形機(jī)器人運(yùn)動(dòng)軌跡和1250個(gè)仿真就緒資產(chǎn)。這一舉措無(wú)疑將加速社區(qū)開發(fā),進(jìn)一步鞏固N(yùn)VIDIA在物理AI領(lǐng)域的領(lǐng)導(dǎo)地位。
行業(yè)應(yīng)用:從醫(yī)療到汽車的全面滲透
而是通過(guò)一系列專用平臺(tái)和開放生態(tài),推動(dòng)其在多個(gè)行業(yè)的深度落地與廣泛應(yīng)用。物理AI作為一種跨界技術(shù),其獨(dú)特之處在于能夠?qū)I的計(jì)算能力與現(xiàn)實(shí)世界的物理交互相結(jié)合,解決傳統(tǒng)技術(shù)難以觸及的復(fù)雜問(wèn)題。從醫(yī)療領(lǐng)域的智能診斷,到工業(yè)生產(chǎn)中的自動(dòng)化優(yōu)化,再到交通運(yùn)輸?shù)淖詣?dòng)駕駛革命,NVIDIA正通過(guò)其在GTC 2025上展示的技術(shù)矩陣,逐步滲透到各行業(yè)的核心環(huán)節(jié)。
Isaac for Healthcare:醫(yī)療領(lǐng)域的突破
在醫(yī)療領(lǐng)域,NVIDIA推出了Isaac for Healthcare平臺(tái),針對(duì)價(jià)值10萬(wàn)億美元的醫(yī)療行業(yè)面臨的人才短缺和患者護(hù)理可及性問(wèn)題。該平臺(tái)包括Mona(預(yù)訓(xùn)練模型)、Omniverse(物理仿真)和Holoscan(實(shí)時(shí)AI部署),專注于醫(yī)學(xué)成像和手術(shù)等關(guān)鍵服務(wù)。GE醫(yī)療已采用該平臺(tái)為其50萬(wàn)臺(tái)設(shè)備引入自主診斷成像功能,延續(xù)雙方近20年的合作。
Isaac GR00T N1:人形機(jī)器人的未來(lái)
人形機(jī)器人被視為下一個(gè)價(jià)值10萬(wàn)億美元的產(chǎn)業(yè),NVIDIA的Isaac GR00T平臺(tái)應(yīng)運(yùn)而生。GR00T N1是全球首個(gè)開放、可定制的人形機(jī)器人基礎(chǔ)模型,支持快慢雙系統(tǒng)架構(gòu),能處理復(fù)雜任務(wù)并適應(yīng)不同環(huán)境。在GTC上,GR00T N1已在Fourier GR1和Neo Gamma機(jī)器人中展示其實(shí)力。此外,NVIDIA與Google DeepMind合作開發(fā)的Newton物理引擎,以及Isaac GR00T的合成運(yùn)動(dòng)生成藍(lán)圖,進(jìn)一步降低了人形機(jī)器人開發(fā)的數(shù)據(jù)成本。例如,僅用150個(gè)L40 GPU,11小時(shí)內(nèi)生成78萬(wàn)條合成軌跡,相當(dāng)于6500小時(shí)的人類演示。
DRIVE與HALOS:自動(dòng)駕駛的安全革命
在汽車領(lǐng)域,Ollie介紹了DRIVE平臺(tái)和全新HALOS安全系統(tǒng)的進(jìn)展。DRIVE已覆蓋全球自動(dòng)駕駛生態(tài)系統(tǒng),8家頂級(jí)L4公司和20家領(lǐng)先導(dǎo)航公司采用其技術(shù)。此次GTC宣布的通用汽車(GM)合作尤為引人注目:GM不僅在云端DGX上訓(xùn)練模型,還利用Omniverse和Cosmos優(yōu)化工廠規(guī)劃,并采用AGX和安全認(rèn)證的DRIVE OS開發(fā)高級(jí)駕駛輔助系統(tǒng)(ADAS)。這與CES上宣布的豐田和現(xiàn)代合作類似,但GM的全面覆蓋(從制造到車載)更具代表性。
HALOS則是一個(gè)端到端的自動(dòng)駕駛安全系統(tǒng),整合硬件、軟件和AI模型,覆蓋設(shè)計(jì)、部署和驗(yàn)證全生命周期。其核心在于安全護(hù)欄,利用DGX、Omniverse和AGX確保AI的可解釋性和可靠性。發(fā)言人強(qiáng)調(diào),安全是汽車行業(yè)的首要標(biāo)準(zhǔn),HALOS的投資(涉及1.5萬(wàn)名工程師和1000多項(xiàng)專利)將幫助合作伙伴更快推出安全的自動(dòng)駕駛產(chǎn)品。
從突破挑戰(zhàn)到變革開啟的征途
盡管NVIDIA的物理AI戰(zhàn)略令人振奮,但其面臨的挑戰(zhàn)不容忽視。Ralph指出,創(chuàng)建泛化機(jī)器人“大腦”是歷史性難題,而如今的突破依賴于Transformer和LLM技術(shù)。然而,這種技術(shù)需要海量數(shù)據(jù)支撐,而現(xiàn)實(shí)數(shù)據(jù)的采集成本高昂且有限。雖然NVIDIA推出的一系列工具和平臺(tái)讓大規(guī)模數(shù)據(jù)仿真訓(xùn)練實(shí)現(xiàn)了加速,但如何確保仿真的物理準(zhǔn)確性和多樣性仍是整個(gè)業(yè)界還在繼續(xù)突破的一個(gè)技術(shù)瓶頸。仿真必須提供“物理上準(zhǔn)確的合成數(shù)據(jù)”和“具有物理反饋的虛擬世界”,否則模型可能出現(xiàn)偏差或“幻覺”,影響現(xiàn)實(shí)部署效果。
在自動(dòng)駕駛領(lǐng)域,Ollie提供了更具體的展望和挑戰(zhàn)分析。他預(yù)測(cè),類似Waymo的機(jī)器人出租車將在未來(lái)幾年內(nèi)擴(kuò)展到更多城市,因其成本結(jié)構(gòu)允許配備昂貴的冗余系統(tǒng)(如激光雷達(dá)、12個(gè)攝像頭、冗余剎車等),每輛車計(jì)算機(jī)和傳感器成本可達(dá)10萬(wàn)美元,仍有投資回報(bào)。然而,全球范圍的乘用車完全自動(dòng)駕駛則面臨更大障礙,因消費(fèi)者不會(huì)為每輛車額外支付高昂費(fèi)用,需依賴更先進(jìn)的AI模型和仿真數(shù)據(jù)。預(yù)計(jì)這一目標(biāo)可能要到2030年以后實(shí)現(xiàn),這不僅取決于技術(shù)進(jìn)步,還需與政府協(xié)作制定法規(guī)并提升公眾接受度。而在此方面,Cosmos作為基礎(chǔ)模型能夠通過(guò)例如生成“道路上重型靜止小物體”的場(chǎng)景,幫助訓(xùn)練感知系統(tǒng)應(yīng)對(duì)雷達(dá)難以識(shí)別的挑戰(zhàn)。
從行業(yè)影響來(lái)看,NVIDIA的開放策略(如開源數(shù)據(jù)集、模型和框架)將加速物理AI的普及,這將降低開發(fā)者進(jìn)入物理AI領(lǐng)域的門檻。誠(chéng)然,這種開放性也可能對(duì)某些依賴閉源生態(tài)的潛在競(jìng)爭(zhēng)對(duì)手造成沖擊。
未來(lái),NVIDIA的生態(tài)系統(tǒng)布局顯示其目標(biāo)不僅限于技術(shù)提供者角色,更試圖成為物理AI的“基礎(chǔ)設(shè)施提供者”。Omniverse和Cosmos的結(jié)合正吸引更多軟件生態(tài)采用其庫(kù),統(tǒng)一物理世界和工業(yè)數(shù)據(jù),這為大規(guī)模訓(xùn)練物理AI模型奠定了基礎(chǔ)。HALOS安全系統(tǒng)將幫助合作伙伴更快推出安全可靠的自動(dòng)駕駛產(chǎn)品。
結(jié)語(yǔ)
NVIDIA在GTC 2025上關(guān)于物理AI展示無(wú)疑是一場(chǎng)技術(shù)盛宴。從Omniverse和Cosmos的仿真創(chuàng)新,到Isaac和DRIVE的行業(yè)應(yīng)用,再到HALOS的安全承諾,NVIDIA正在構(gòu)建一個(gè)從數(shù)字到物理的完整AI生態(tài)。不難看出,加速計(jì)算正在推動(dòng)AI創(chuàng)新的下一波浪潮,而物理AI可能是其中最具變革性的部分。
NVIDIA的戰(zhàn)略不僅關(guān)乎技術(shù)本身,更關(guān)乎其如何重塑人類與機(jī)器的互動(dòng)方式。未來(lái)十年,無(wú)論是工廠中的機(jī)器人、道路上的自動(dòng)駕駛汽車,還是醫(yī)院中的智能設(shè)備,物理AI都可能成為現(xiàn)實(shí)世界的無(wú)形推手。而NVIDIA,正站在這一變革的前沿。