www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 廠商動態(tài) > 亞馬遜云科技
[導(dǎo)讀]由英偉達H100 Tensor Core GPU提供支持

北京——2023年7月31日 亞馬遜云科技近日在紐約峰會上宣布Amazon Elastic Compute Cloud(EC2)P5實例正式可用。這是一款下一代GPU實例,由最新的英偉達H100 Tensor Core GPU提供支持,可以滿足客戶在運行人工智能、機器學(xué)習(xí)和高性能計算工作負載時對高性能和高擴展性的需求。與上一代基于GPU的實例相比,Amazon EC2 P5實例可以將訓(xùn)練時間縮減6倍(從幾天縮短到幾小時),從而幫助客戶節(jié)省高達40%的訓(xùn)練成本。

Amazon EC2 P5實例提供8個英偉達H100 Tensor Core GPU,具有640 GB高帶寬GPU內(nèi)存,同時提供第三代AMD EPYC處理器、2TB系統(tǒng)內(nèi)存和30 TB本地NVMe存儲。Amazon EC2 P5實例還提供3200 Gbps的聚合網(wǎng)絡(luò)帶寬并支持GPUDirect RDMA,從而能夠繞過CPU進行節(jié)點間通信,實現(xiàn)更低的延遲和高效的橫向擴展性能。

亞馬遜云科技與英偉達攜手開發(fā)下一代基礎(chǔ)設(shè)施

亞馬遜云科技和英偉達(NVIDIA)在今年3月宣布了一項多方合作,構(gòu)建全球最具可擴展性且按需付費的人工智能基礎(chǔ)設(shè)施,以便訓(xùn)練日益復(fù)雜的大語言模型和開發(fā)生成式AI應(yīng)用程序。

當(dāng)時,亞馬遜云科技預(yù)發(fā)布了由英偉達H100 Tensor Core GPU支持的Amazon EC2 P5實例,可為構(gòu)建和訓(xùn)練更大規(guī)模的機器學(xué)習(xí)模型提供高達20 exaFLOPS的算力。亞馬遜云科技和英偉達合作十多年來成果頗豐,推出了包括支持視覺計算、人工智能和高性能計算集群的各種GPU實例,如CG1實例(2010年)、G2(2013年)、P2(2016年)、P3(2017年)、G3(2017年)、P3dn(2018年)、G4(2019年)、P4(2020年)、G5(2021年)和P4de(2022年)實例。

現(xiàn)在,機器學(xué)習(xí)模型的規(guī)模已經(jīng)達到數(shù)萬億參數(shù),這種復(fù)雜性大大增加了客戶訓(xùn)練模型所需的時間,例如,最新的大語言模型訓(xùn)練時間長達數(shù)月之久。類似的趨勢也出現(xiàn)在高性能計算領(lǐng)域。隨著高性能計算客戶數(shù)據(jù)收集準(zhǔn)確度的提高以及數(shù)據(jù)集達到EB級規(guī)模,客戶已經(jīng)在尋找解決日益復(fù)雜應(yīng)用程序的更快方法。

關(guān)于Amazon EC2 P5實例

Amazon EC2 P5實例非常適合訓(xùn)練和運行越來越復(fù)雜的大語言模型和計算機視覺模型,以滿足最苛刻的計算密集型生成式AI應(yīng)用的需求,包括問答、代碼生成、視頻和圖像生成、語音識別等。與上一代基于GPU的實例相比,Amazon EC2 P5實例在這些應(yīng)用中的訓(xùn)練時間縮短了6倍。那些可以在工作負載中使用較低精度FP8數(shù)據(jù)類型的客戶,例如使用Transformer框架的語言模型,將通過英偉達Transformer Engine的支持獲得高達6倍的性能提升。

高性能計算客戶通過使用Amazon EC2 P5實例可以在藥物發(fā)現(xiàn)、地震分析、天氣預(yù)報和金融建模等領(lǐng)域更大規(guī)模地部署高要求的應(yīng)用程序。此外,對于使用基于動態(tài)規(guī)劃(Dynamic Programming)算法進行基因組測序或加速數(shù)據(jù)分析等應(yīng)用的客戶,Amazon EC2 P5將通過新的DPX指令集提供支持。

Amazon EC2 P5實例使客戶能夠探索以前看似無法解決的問題,更快地迭代解決方案,并加速進入市場。

第二代Amazon EC2 UltraClusters和Elastic Fabric Adapter

Amazon EC2 P5實例為多節(jié)點分布式訓(xùn)練和緊密耦合的高性能計算工作負載提供先進的橫向擴展功能,其使用的第二代Elastic Fabric Adapter(EFA)網(wǎng)絡(luò)設(shè)備提供高達3200 Gbps的網(wǎng)絡(luò)速度,是Amazon EC2 P4d實例的8倍。

為了滿足客戶對大規(guī)模和低延遲的需求,Amazon EC2 P5實例部署在第二代Amazon EC2 UltraClusters中,該集群目前可在超過2萬個英偉達H100 Tensor Core GPU上為客戶提供更低的延遲。作為云中最大規(guī)模的機器學(xué)習(xí)基礎(chǔ)設(shè)施之一,Amazon EC2 UltraClusters中的Amazon EC2 P5實例可提供高達20 exaFLOPS的聚合計算能力。

Amazon EC2 UltraClusters使用了Amazon FSx for Lustre,這是一種完全托管的共享存儲,構(gòu)建在常用的高性能并行文件系統(tǒng)上。客戶通過Amazon FSx for Lustre,可以按需大規(guī)模快速處理海量數(shù)據(jù)集,并實現(xiàn)亞毫秒級延遲。Amazon FSx for Lustre的低延遲和高吞吐量特性經(jīng)過優(yōu)化,可在Amazon EC2 UltraCluster上為深度學(xué)習(xí)、生成式AI和高性能計算工作負載提供支持。

Amazon FSx for Lustre可以為Amazon EC2 UltraCluster中的GPU和機器學(xué)習(xí)加速器持續(xù)提供數(shù)據(jù),從而加速最苛刻的工作負載,包括大語言模型訓(xùn)練、生成式AI推理,以及基因組學(xué)和金融風(fēng)險建模等高性能計算負載。

Amazon EC2 P5實例現(xiàn)已正式可用

Amazon EC2 P5實例現(xiàn)已在以下區(qū)域正式可用:美國東部(北弗吉尼亞)和美國西部(俄勒岡)。更多信息可訪問:Amazon EC2定價和Amazon EC2 P5實例。

客戶也可以選擇亞馬遜云科技提供的各種內(nèi)置生成式AI的云服務(wù),它們都運行在具有成本效益的生成式AI云基礎(chǔ)設(shè)施上,助力客戶加快創(chuàng)新和重塑應(yīng)用。更多信息請訪問亞馬遜云科技生成式AI頁面。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉