www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 廠(chǎng)商動(dòng)態(tài) > 亞馬遜云科技
[導(dǎo)讀]設(shè)想這樣一個(gè)系統(tǒng),它可以探索解決復(fù)雜問(wèn)題的多種方法,依托對(duì)海量數(shù)據(jù)的理解——從科學(xué)數(shù)據(jù)集到源代碼,再到商業(yè)文檔——并能夠?qū)崟r(shí)推理各種可能性。這種閃電般極速的推理不是未來(lái)的設(shè)想,而是如今亞馬遜云科技客戶(hù)AI生產(chǎn)環(huán)境中正在發(fā)生的事情。當(dāng)前我們的客戶(hù)在藥物研發(fā)、企業(yè)搜索、軟件開(kāi)發(fā)等多個(gè)領(lǐng)域構(gòu)建的AI系統(tǒng)規(guī)模令人驚嘆,而這僅是開(kāi)始。

設(shè)想這樣一個(gè)系統(tǒng),它可以探索解決復(fù)雜問(wèn)題的多種方法,依托對(duì)海量數(shù)據(jù)的理解——從科學(xué)數(shù)據(jù)集到源代碼,再到商業(yè)文檔——并能夠?qū)崟r(shí)推理各種可能性。這種閃電般極速的推理不是未來(lái)的設(shè)想,而是如今亞馬遜云科技客戶(hù)AI生產(chǎn)環(huán)境中正在發(fā)生的事情。當(dāng)前我們的客戶(hù)在藥物研發(fā)、企業(yè)搜索、軟件開(kāi)發(fā)等多個(gè)領(lǐng)域構(gòu)建的AI系統(tǒng)規(guī)模令人驚嘆,而這僅是開(kāi)始。

為了加速推理模型、Agentic AI系統(tǒng)等新興生成式AI技術(shù)的發(fā)展,亞馬遜云科技宣布由NVIDIA Grace Blackwell Superchips加速的Amazon EC2 P6e-GB200 UltraServer現(xiàn)已正式可用。P6e-GB200 UltraServer專(zhuān)為訓(xùn)練和部署最大規(guī)模、最復(fù)雜的AI模型而設(shè)計(jì)。今年早些時(shí)候,亞馬遜云科技已推出了基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200實(shí)例,支持多樣化的AI和高性能計(jì)算工作負(fù)載。

基于亞馬遜云科技在大規(guī)模、安全可靠GPU基礎(chǔ)設(shè)施的豐富經(jīng)驗(yàn),Amazon EC2 P6e-GB200 UltraServer和Amazon P6-B200實(shí)例能夠幫助客戶(hù)持續(xù)推動(dòng)AI技術(shù)的邊界。

滿(mǎn)足AI工作負(fù)載不斷增長(zhǎng)的計(jì)算需求

Amazon EC2 P6e-GB200 UltraServer是亞馬遜云科技迄今為止最強(qiáng)大的GPU產(chǎn)品,配備最多72個(gè)NVIDIA Blackwell GPU,這些GPU通過(guò)第五代NVIDIA NVLink互連,并作為單一計(jì)算單元運(yùn)行。每臺(tái)UltraServer可提供高達(dá)360 petaflops的高密度FP8算力,以及13.4TB的高帶寬顯存(HBM3e)——相比P5en實(shí)例,在單個(gè)NVLink域內(nèi)的計(jì)算能力提升超過(guò)20倍,內(nèi)存容量提升超過(guò)11倍。Amazon EC2 P6e-GB200 UltraServer支持高達(dá)28.8 Tbps的第四代Elastic Fabric Adapter(EFAv4)網(wǎng)絡(luò)帶寬。

Amazon EC2 P6-B200實(shí)例為廣泛AI場(chǎng)景提供靈活選擇。每個(gè)實(shí)例配備8個(gè)通過(guò)NVLink互連的NVIDIA Blackwell GPU,擁有1.4TB高帶寬顯存和最高3.2 Tbps的EFAv4網(wǎng)絡(luò)帶寬,以及第五代Intel Xeon Scalable處理器。與Amazon EC2 P5en實(shí)例相比,Amazon EC2 P6-B200實(shí)例的GPU計(jì)算能力是其2.25倍,顯存容量為其1.27倍,顯存帶寬為其1.6倍。

如何在Amazon EC2 P6e-GB200與Amazon EC2 P6-B200之間進(jìn)行選擇?關(guān)鍵取決于客戶(hù)的具體工作負(fù)載需求和架構(gòu)偏好:

· Amazon EC2 P6e-GB200 UltraServer非常適合對(duì)計(jì)算與內(nèi)存要求最為嚴(yán)苛的AI工作負(fù)載,例如訓(xùn)練和部署萬(wàn)億參數(shù)級(jí)的前沿模型。NVIDIA GB200 NVL72架構(gòu)在這種規(guī)模下表現(xiàn)尤為出色。可以想象,72個(gè)GPU協(xié)同運(yùn)作、共享統(tǒng)一內(nèi)存空間并實(shí)現(xiàn)協(xié)調(diào)的負(fù)載分配。這種架構(gòu)通過(guò)降低GPU節(jié)點(diǎn)之間的通信開(kāi)銷(xiāo),提高分布式訓(xùn)練效率。對(duì)于推理任務(wù),能夠在單一NVLink域內(nèi)容納萬(wàn)億參數(shù)模型,這意味著可在大規(guī)模場(chǎng)景下實(shí)現(xiàn)更快、更穩(wěn)定的響應(yīng)時(shí)間。當(dāng)與如NVIDIA Dynamo支持的解耦式推理等優(yōu)化技術(shù)結(jié)合使用時(shí),GB200 NVL72架構(gòu)具備的大規(guī)模域優(yōu)勢(shì),可為專(zhuān)家混合模型等多種模型架構(gòu)帶來(lái)顯著的推理效率提升。特別是在處理超長(zhǎng)上下文窗口或?qū)崟r(shí)運(yùn)行高并發(fā)應(yīng)用時(shí),GB200 NVL72展現(xiàn)出強(qiáng)大的性能表現(xiàn)。

· Amazon EC2 P6-B200實(shí)例支持廣泛的AI工作負(fù)載,是面向中到大型訓(xùn)練與推理任務(wù)的理想選擇。對(duì)于希望遷移現(xiàn)有GPU工作負(fù)載的客戶(hù),Amazon EC2 P6-B200提供了熟悉的8-GPU配置,可最大程度減少代碼修改,簡(jiǎn)化從當(dāng)前代實(shí)例的遷移過(guò)程。此外,盡管英偉達(dá)的AI軟件棧已針對(duì)Arm和x86架構(gòu)進(jìn)行了優(yōu)化,但對(duì)于構(gòu)建于x86環(huán)境的工作負(fù)載,配備Intel Xeon處理器的Amazon EC2 P6-B200實(shí)例將更為契合。

基于亞馬遜云科技核心優(yōu)勢(shì)的持續(xù)創(chuàng)新

將NVIDIA Blackwell引入亞馬遜云科技不僅僅是一項(xiàng)技術(shù)突破,更是對(duì)基礎(chǔ)設(shè)施的全面創(chuàng)新?;谠谟?jì)算、網(wǎng)絡(luò)、運(yùn)維和托管服務(wù)等領(lǐng)域的多年深耕與實(shí)踐,亞馬遜云科技將NVIDIA Blackwell的全部功能融入其中,同時(shí)滿(mǎn)足客戶(hù)期望在亞馬遜云科技獲得的高可靠性和性能。

實(shí)例強(qiáng)大的安全性與穩(wěn)定性

客戶(hù)在選擇將GPU工作負(fù)載部署在亞馬遜云科技上的原因中,有一點(diǎn)反復(fù)被提及:他們高度認(rèn)可亞馬遜云科技在云端對(duì)實(shí)例安全性與穩(wěn)定性上的重視。Amazon Nitro系統(tǒng)的專(zhuān)用硬件、軟件和固件具備強(qiáng)制隔離機(jī)制,確保包括亞馬遜云科技員工在內(nèi)的任何人都無(wú)法訪(fǎng)問(wèn)客戶(hù)的敏感AI負(fù)載與數(shù)據(jù)。

除了安全性,Amazon Nitro系統(tǒng)還從根本上革新了基礎(chǔ)設(shè)施的維護(hù)與優(yōu)化方式。該系統(tǒng)負(fù)責(zé)處理網(wǎng)絡(luò)、存儲(chǔ)及其他I/O功能,并支持在系統(tǒng)持續(xù)運(yùn)行的情況下完成固件升級(jí)、漏洞修復(fù)和性能優(yōu)化。這種無(wú)需停機(jī)即可更新的能力,被稱(chēng)為“實(shí)時(shí)更新”,在當(dāng)前對(duì)連續(xù)性要求極高的AI生產(chǎn)環(huán)境中尤為關(guān)鍵,任何中斷都可能對(duì)業(yè)務(wù)進(jìn)度造成嚴(yán)重影響。

Amazon EC2 P6e-GB200和Amazon EC2 P6-B200均搭載第六代Nitro系統(tǒng)。但這些安全與穩(wěn)定性的優(yōu)勢(shì)并非首次出現(xiàn),自2017年起,創(chuàng)新型Nitro架構(gòu)就已在持續(xù)保護(hù)和優(yōu)化Amazon EC2上的工作負(fù)載。

大規(guī)模環(huán)境下的可靠性能保障

對(duì)于AI基礎(chǔ)設(shè)施的挑戰(zhàn)不僅在于實(shí)現(xiàn)超大規(guī)模,更在于如何在這一規(guī)模下持續(xù)保障性能和可靠性。Amazon EC2 P6e-GB200 UltraServer已部署至第三代Amazon EC2 UltraCluster中,創(chuàng)建了單一架構(gòu),可覆蓋亞馬遜云科技規(guī)模最大的數(shù)據(jù)中心。第三代UltraCluster最多可將功耗降低40%、布線(xiàn)需求減少超過(guò)80%,不僅顯著提升了能效,也有效減少了潛在故障點(diǎn)。

為了在超大規(guī)模部署中提供一致性能,亞馬遜云科技采用了Elastic Fabric Adapter(EFA)及其可擴(kuò)展可靠數(shù)據(jù)報(bào)協(xié)議(Scalable Reliable Datagram),該協(xié)議可在多條網(wǎng)絡(luò)路徑之間智能路由流量,即使在出現(xiàn)擁堵或故障的情況下,也能保持系統(tǒng)穩(wěn)定運(yùn)行。亞馬遜云科技持續(xù)對(duì)四代EFA進(jìn)行性能優(yōu)化。配備EFAv4的Amazon EC2 P6e-GB200和Amazon EC2 P6-B200實(shí)例,在分布式訓(xùn)練中的集體通信速度相比使用EFAv3的Amazon EC2 P5en實(shí)例提升最高可達(dá)18%。

基礎(chǔ)設(shè)施效率

Amazon EC2 P6-B200 實(shí)例采用經(jīng)過(guò)驗(yàn)證的空氣冷卻架構(gòu),而Amazon EC2 P6e-GB200 UltraServer 則采用液冷方案,使大型 NVLink 域架構(gòu)能夠?qū)崿F(xiàn)更高的計(jì)算密度,從而提升系統(tǒng)整體性能。P6e-GB200 配備創(chuàng)新的機(jī)械冷卻設(shè)計(jì),可在新建和既有數(shù)據(jù)中心中實(shí)現(xiàn)靈活的芯片級(jí)液冷,從而在同一設(shè)施內(nèi)同時(shí)支持液冷加速器與空氣冷卻的網(wǎng)絡(luò)和存儲(chǔ)設(shè)備。憑借這一靈活的冷卻架構(gòu),亞馬遜云科技能夠以更低成本實(shí)現(xiàn)更高性能與效率。

在亞馬遜云科技上啟用NVIDIA Blackwell

亞馬遜云科技通過(guò)多種部署路徑簡(jiǎn)化Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實(shí)例的啟用過(guò)程,客戶(hù)可快速開(kāi)始使用Blackwell GPU,同時(shí)保持其現(xiàn)有的運(yùn)維模式。

Amazon SageMaker HyperPod

如果客戶(hù)希望加速AI開(kāi)發(fā),并減少對(duì)基礎(chǔ)設(shè)施和集群運(yùn)維的投入,Amazon SageMaker HyperPod正是理想之選。該服務(wù)提供托管式、可靠的基礎(chǔ)設(shè)施,能夠自動(dòng)完成大型GPU集群的配置與管理。亞馬遜云科技也在持續(xù)增強(qiáng)Amazon SageMaker HyperPod,新增靈活訓(xùn)練計(jì)劃等創(chuàng)新功能,幫助客戶(hù)獲得可預(yù)測(cè)的訓(xùn)練周期,并將訓(xùn)練任務(wù)控制在預(yù)算范圍內(nèi)。

Amazon SageMaker HyperPod將支持Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實(shí)例,并通過(guò)優(yōu)化使工作負(fù)載保持在同一NVLink域內(nèi),以實(shí)現(xiàn)性能最大化。亞馬遜云科技還在構(gòu)建一套完整的多層級(jí)恢復(fù)機(jī)制:Amazon SageMaker HyperPod可在同一NVLink域內(nèi)自動(dòng)用預(yù)配置的備用實(shí)例替換故障節(jié)點(diǎn)。內(nèi)置儀表板將提供從GPU利用率、內(nèi)存使用情況到工作負(fù)載指標(biāo)和UltraServer運(yùn)行狀態(tài)的全面可視化信息。

Amazon EKS

對(duì)于大規(guī)模AI工作負(fù)載,如果客戶(hù)更傾向于使用Kubernetes管理基礎(chǔ)設(shè)施,Amazon Elastic Kubernetes Service(Amazon EKS)通常是首選控制平面。Amazon EKS持續(xù)推動(dòng)Amazon EKS的創(chuàng)新,例如Amazon EKS Hybrid Nodes功能,可支持在同一個(gè)集群中同時(shí)管理本地和Amazon EC2 GPU,從而為AI工作負(fù)載帶來(lái)更大靈活性。

Amazon EKS將通過(guò)托管節(jié)點(diǎn)組支持對(duì)Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實(shí)例的自動(dòng)配置與生命周期管理。針對(duì)Amazon EC2 P6e-GB200 UltraServer,亞馬遜云科技正在為其構(gòu)建拓?fù)涓兄芰?,以識(shí)別GB200 NVL72架構(gòu),并自動(dòng)為節(jié)點(diǎn)添加UltraServer ID和網(wǎng)絡(luò)拓?fù)湫畔?,從而?shí)現(xiàn)最優(yōu)的工作負(fù)載調(diào)度??蛻?hù)可選擇將節(jié)點(diǎn)組部署在多個(gè)UltraServer之間,或?qū)S糜趩蝹€(gè)UltraServer,從而在訓(xùn)練基礎(chǔ)設(shè)施架構(gòu)上獲得更高的靈活性。Amazon EKS還會(huì)監(jiān)控GPU和加速器錯(cuò)誤,并將相關(guān)信息傳遞至Kubernetes控制平面,以支持后續(xù)處理。

亞馬遜云科技上的NVIDIA DGX Cloud

Amazon EC2 P6e-GB200 UltraServer也將通過(guò)NVIDIA DGX Cloud提供。DGX Cloud是一個(gè)統(tǒng)一的AI平臺(tái),在各層架構(gòu)均經(jīng)過(guò)優(yōu)化,具備多節(jié)點(diǎn)AI訓(xùn)練與推理能力,并集成英偉達(dá)完整的AI軟件棧。客戶(hù)可充分利用英偉達(dá)最新的性能優(yōu)化方案、基準(zhǔn)測(cè)試方法和技術(shù)專(zhuān)長(zhǎng),以提升效率與性能。該平臺(tái)還提供靈活的服務(wù)期限選擇,以及由英偉達(dá)專(zhuān)家提供的全面支持與服務(wù),助力客戶(hù)加速推進(jìn)AI項(xiàng)目。

此次發(fā)布是一個(gè)重要的里程碑,但這僅僅是一個(gè)開(kāi)始。隨著AI能力持續(xù)的快速演進(jìn),客戶(hù)需要的基礎(chǔ)設(shè)施不僅要滿(mǎn)足當(dāng)下需求,更要為未來(lái)的多種可能性提供支撐。通過(guò)在計(jì)算、網(wǎng)絡(luò)、運(yùn)維和托管服務(wù)等多個(gè)層面的持續(xù)創(chuàng)新,Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實(shí)例已做好充分準(zhǔn)備來(lái)實(shí)現(xiàn)這些可能。我們期待看到客戶(hù)的未來(lái)構(gòu)建。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀(guān)點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉