原創(chuàng)

邁入全面“云原生”時(shí)代，云服務(wù)發(fā)明者提供應(yīng)用構(gòu)建到數(shù)據(jù)挖掘的全面服務(wù)

時(shí)間：2022-10-20 15:43:15

關(guān)鍵字：云原生 AWS 云計(jì)算人工智能機(jī)器學(xué)習(xí)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]“云原生”一詞最初來(lái)自Matt Stine在2013年寫的一本書——《Migrating to Cloud-Native Application Architectures》，書名中的Cloud-Native即是“云原生”的由來(lái)。

“云原生”一詞最初來(lái)自Matt Stine在2013年寫的一本書——《Migrating to Cloud-Native Application Architectures》，書名中的Cloud-Native即是“云原生”的由來(lái)。

但云原生并不是一種從零出發(fā)的創(chuàng)新技術(shù)，而是由云服務(wù)的發(fā)展而來(lái)。從2006年亞馬遜云科技推出Amazon S3和Amazon EC2服務(wù)以來(lái)，云服務(wù)隨著客戶業(yè)務(wù)的需求不斷發(fā)展。到2013年云原生的概念提出，到現(xiàn)在2022年，我們認(rèn)為云原生的時(shí)代已經(jīng)到來(lái)。

云服務(wù)從一開始的定義就是一種服務(wù)，既然是服務(wù)就是圍繞著客戶的業(yè)務(wù)需求為中心的。同樣的云原生也不是為了云原生而去云原生，要邁入云原生的背后原因還是客戶業(yè)務(wù)的發(fā)展需求使然。例如，亞馬遜云科技上構(gòu)建的90%的服務(wù)都是基于客戶的需求，其他10%的創(chuàng)新則是為客戶進(jìn)行發(fā)明創(chuàng)造的服務(wù)，這即是云服務(wù)商貫穿始終的服務(wù)創(chuàng)新理念。

云原生是2022年亞馬遜云科技中國(guó)峰會(huì)上最多被提到的詞之一，這也是云服務(wù)發(fā)明之后的又一次重要的發(fā)展進(jìn)程。從數(shù)據(jù)中心原生、到云好奇、云友好，一直到現(xiàn)在的云原生，客戶的既存業(yè)務(wù)經(jīng)過(guò)了遷移和改造階段。而現(xiàn)在要構(gòu)建一個(gè)新的行業(yè)應(yīng)用或者應(yīng)用轉(zhuǎn)型，云原生是最佳的選擇，也是具有長(zhǎng)遠(yuǎn)的發(fā)展價(jià)值的必然選擇。

本文根據(jù)剛剛結(jié)束的2022年亞馬遜云科技中國(guó)峰會(huì)上的精彩分享，從云原生應(yīng)用構(gòu)建、云原生數(shù)據(jù)挖掘、云原生背后關(guān)鍵技術(shù)三個(gè)角度來(lái)展示亞馬遜云科技的云原生服務(wù)全貌。

云原生應(yīng)用構(gòu)建：不止是會(huì)用云服務(wù)工具，要實(shí)現(xiàn)DevOps流程改造

“云原生應(yīng)用架構(gòu)的關(guān)鍵在于需要充分運(yùn)用更高級(jí)別的云服務(wù)，來(lái)實(shí)現(xiàn)開發(fā)人員工作效率、業(yè)務(wù)敏捷性、資源利用率等提升?！眮嗰R遜云科技大中華區(qū)戰(zhàn)略業(yè)務(wù)發(fā)展部總經(jīng)理顧凡分享到。而這些高級(jí)別的云服務(wù)，正是亞馬遜云科技在過(guò)去的16年間，持續(xù)不斷地創(chuàng)新的結(jié)果，讓云服務(wù)全面邁向Serverless。

據(jù)亞馬遜云科技全球副總裁、大中華區(qū)執(zhí)行董事張文翊分享，Amazon DynamoDB、Amazon Lambda、Amazon Fargate等一些列的云服務(wù)都堪稱“改變游戲規(guī)則的創(chuàng)新”。現(xiàn)在亞馬遜云科技的Serverless計(jì)算及容器服務(wù)多達(dá)9個(gè)；數(shù)據(jù)庫(kù)服務(wù)多達(dá)6個(gè)；數(shù)據(jù)分析多達(dá)7個(gè)。

從客戶的角度而言，要構(gòu)建云原生的應(yīng)用，僅僅有這些顛覆性的云服務(wù)工具用起來(lái)是不夠的，還需要改造其開發(fā)流程和運(yùn)營(yíng)模式。亞馬遜云科技總結(jié)了一套從應(yīng)用邁向云原生之旅的經(jīng)驗(yàn)，包括構(gòu)建、治理和迭代三個(gè)階段、九個(gè)步驟，在每個(gè)步驟亞馬遜云科技都有相應(yīng)的云服務(wù)、最佳實(shí)踐去賦能亞馬遜云科技的用戶。

構(gòu)建包括三個(gè)步驟：

第一步，構(gòu)建彈性應(yīng)用架構(gòu)，用Amazon EKS將應(yīng)用做容器化改造，對(duì)單體應(yīng)用做微服務(wù)拆解，去用好Amazon EKS 用好Amazon Lambda，去搭建一個(gè)彈性應(yīng)用的架構(gòu)。第二步，一切皆代碼。通過(guò)CDK去實(shí)現(xiàn)基礎(chǔ)設(shè)施即代碼，把云中的資源管理自動(dòng)化，去提升運(yùn)維效率。第三步，持續(xù)交付。利用Amazon Code Pipeline去搭建一個(gè)自動(dòng)化發(fā)布的流水線，用App Mesh去控制應(yīng)用自動(dòng)交付的網(wǎng)絡(luò)流量，保證新功能安全穩(wěn)妥的發(fā)布。

治理同樣包含三個(gè)步驟：第一步，可觀測(cè)性是治理微服務(wù)的關(guān)鍵。采用亞馬遜云科技托管的Amazon Prometheus服務(wù)，配合ADOT可以全面監(jiān)控系統(tǒng)的運(yùn)行狀況。第二步，選擇云原生數(shù)據(jù)庫(kù)，當(dāng)把一個(gè)單體應(yīng)用拆分為多個(gè)微服務(wù)的時(shí)候，為微服務(wù)選擇最適合的云原生數(shù)據(jù)庫(kù)，讓整個(gè)應(yīng)用的整體架構(gòu)做到彈性和敏捷。第三步，Amazon DevSecOps，安全團(tuán)隊(duì)和開發(fā)和運(yùn)營(yíng)團(tuán)隊(duì)一定要集成，避免安全成為流水線中的一個(gè)瓶頸，可以用Amazon Inspector持續(xù)掃描軟件的漏洞。

在迭代階段也包含三個(gè)步驟：第一步，持續(xù)部署，在代碼自動(dòng)進(jìn)入到生產(chǎn)環(huán)境之前，去用亞馬遜云科技 FIS去運(yùn)行一個(gè)故障注入實(shí)驗(yàn)，能夠更好地改進(jìn)應(yīng)用程序的性能。第二步，一切皆服務(wù)，將平臺(tái)級(jí)的一些服務(wù)（像數(shù)據(jù)庫(kù) 消息傳遞總線、API網(wǎng)關(guān)等）公開為一個(gè)共享服務(wù)，供其他人使用，用Amazon EKS Blueprints去構(gòu)建一個(gè)基于Amazon EKS的共享服務(wù)平臺(tái)。第三步，持續(xù)迭代、運(yùn)維，利用亞馬遜云科技Well-Architected Tool不斷地去改進(jìn)系統(tǒng)結(jié)構(gòu)。

云原生數(shù)據(jù)戰(zhàn)略：解決“數(shù)” “智”結(jié)合挑戰(zhàn)

IDC預(yù)測(cè)僅在2022年，人類就將創(chuàng)建超過(guò)97ZB的數(shù)據(jù)；歷史上到2012年為止人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量?jī)H為200PB；僅僅是2022這一年人類所創(chuàng)建的數(shù)據(jù)量的50萬(wàn)分之一。

如果將數(shù)據(jù)保存在1TB的硬盤上面，100PB的硬盤連著擺放起來(lái)，約等于2000米，也就是一畝農(nóng)田的一個(gè)周長(zhǎng)。而存放97ZB數(shù)據(jù)量的硬盤連著擺放起來(lái)，是地球與月球距離的2.5倍。所以說(shuō)從200PB到97ZB是從“一畝農(nóng)田”到“星辰大海”的距離。

然而數(shù)據(jù)量的增加并不等于數(shù)據(jù)價(jià)值的增加，埃森哲最近的一個(gè)調(diào)研發(fā)現(xiàn) ，有68%的組織認(rèn)為他們?nèi)詿o(wú)法獲取數(shù)據(jù)帶來(lái)的價(jià)值。

成為數(shù)據(jù)驅(qū)動(dòng)型企業(yè)并不容易，構(gòu)建數(shù)據(jù)驅(qū)動(dòng)型組織面臨著諸多挑戰(zhàn)。譬如：企業(yè)沒有一個(gè)明確的數(shù)據(jù)戰(zhàn)略；高速增長(zhǎng)的數(shù)據(jù)帶來(lái)了高昂的數(shù)據(jù)存儲(chǔ)和分析成本；企業(yè)難以找到發(fā)揮數(shù)據(jù)價(jià)值的場(chǎng)景；在數(shù)據(jù)治理、監(jiān)管過(guò)程中保證數(shù)據(jù)安全等等。

在亞馬遜云科技中國(guó)峰會(huì)首日的主題演講中，張文翊分享的六大云技術(shù)趨勢(shì)中，其中一條即“打破傳統(tǒng)的數(shù)據(jù)管理局限，數(shù)據(jù)庫(kù)走入云原生時(shí)代”。而顧凡也分享了亞馬遜云科技的云原生數(shù)據(jù)戰(zhàn)略——“三個(gè)支柱和一個(gè)基石”，如何幫助客戶通過(guò)數(shù)據(jù)驅(qū)動(dòng)智能創(chuàng)新。

云原生數(shù)據(jù)戰(zhàn)略第一個(gè)支柱就是要采用原生數(shù)據(jù)基礎(chǔ)設(shè)施來(lái)存儲(chǔ)和處理數(shù)據(jù)。

在2004年12月，由于關(guān)系數(shù)據(jù)庫(kù)Oracle無(wú)法支持亞馬遜云科技快速增長(zhǎng)的業(yè)務(wù)規(guī)模，因此亞馬遜電商網(wǎng)站在高峰期出現(xiàn)了幾個(gè)小時(shí)的中斷，這讓亞馬遜的工程師重新去思考，應(yīng)該如何去設(shè)計(jì)底層的數(shù)據(jù)存儲(chǔ)，從而研發(fā)出了非關(guān)系型的數(shù)據(jù)庫(kù)Dynamo。隨后在2012年，也就是10年前，Amazon DynamoDB服務(wù)進(jìn)而正式發(fā)布。

現(xiàn)在Amazon DynamoDB已經(jīng)廣為應(yīng)用，亞馬遜云科技一直在不斷完善不同類型的數(shù)據(jù)庫(kù)和分析服務(wù)。為了讓客戶快速實(shí)現(xiàn)傳統(tǒng)數(shù)據(jù)庫(kù)向Amazon DynamoDB的遷移，亞馬遜云科技推出了Amazon Babelfish工具，讓傳統(tǒng)數(shù)據(jù)庫(kù)的應(yīng)用代碼盡量不改就可以直接運(yùn)行在Amazon Aurora上，將遷移的時(shí)間從數(shù)月、數(shù)年減少到幾周。

Amazon Aurora專為云平臺(tái)打造，是用戶數(shù)量增速最快的云服務(wù)之一，與MySQL及PostgreSQL全面兼容，吞吐量是標(biāo)準(zhǔn)MySQL的5倍、標(biāo)準(zhǔn)PostgreSQL的3倍，成本卻只有傳統(tǒng)數(shù)據(jù)庫(kù)的十分之一。從Amazon Aurora Severless V1、 V2再到去年re:Invent發(fā)布的Amazon Redshift/Amazon EMR/Amazon MSK的Serverless版本，客戶采用Serverless的數(shù)據(jù)庫(kù)和分析服務(wù)更容易自動(dòng)擴(kuò)容，成本更加地靈活。

云原生數(shù)據(jù)戰(zhàn)略的第二個(gè)支柱是智能湖倉(cāng)2.0架構(gòu)，在打破數(shù)據(jù)孤島，實(shí)現(xiàn)數(shù)據(jù)一體化融合分析的智能湖倉(cāng)1.0的基礎(chǔ)上，進(jìn)一步增強(qiáng)了數(shù)據(jù)分析和人工智能之間的聯(lián)動(dòng)能力。

當(dāng)前大數(shù)據(jù)和機(jī)器學(xué)習(xí)融合管理面臨著不小的挑戰(zhàn)，因?yàn)槠髽I(yè)的算法模型和數(shù)據(jù)通常是兩個(gè)團(tuán)隊(duì)，所以當(dāng)模型走向?qū)嶋H應(yīng)用時(shí)，需要大量數(shù)據(jù)訓(xùn)練時(shí)，算法團(tuán)隊(duì)沒有很好的大規(guī)模數(shù)據(jù)處理的能力，有時(shí)候要花大量的精力才能搞明白如何去獲取和處理數(shù)據(jù)。

智能湖倉(cāng)2.0就是解決客戶的數(shù)據(jù)和AI融合的挑戰(zhàn)。

首先，所有用來(lái)做數(shù)據(jù)預(yù)加工的數(shù)據(jù)分析服務(wù)現(xiàn)在都有了無(wú)服務(wù)器版本，可以讓工程師只專注于數(shù)據(jù)處理的代碼效率和質(zhì)量。

其次，為大數(shù)據(jù)和算法團(tuán)隊(duì)提供統(tǒng)一的數(shù)據(jù)治理底座，來(lái)解決兩邊在數(shù)據(jù)的發(fā)現(xiàn)和理解各自為戰(zhàn)的問(wèn)題，比如通過(guò)Amazon Lake Formation再加上Amazon Glue Catalog，將各種分析引擎和Amazon SageMaker的數(shù)據(jù)目錄打通，同時(shí)提供唯一的數(shù)據(jù)檢索入口和統(tǒng)一的數(shù)據(jù)訪問(wèn)授權(quán)。

第三，用好Amazon SageMaker Studio的新功能，讓算法團(tuán)隊(duì)在一個(gè)統(tǒng)一的界面下可以訪問(wèn)數(shù)據(jù)加工和模型開發(fā)調(diào)試的工具，讓算法團(tuán)隊(duì)能夠充分利用大數(shù)據(jù)團(tuán)隊(duì)，在數(shù)據(jù)處理方面已經(jīng)取得的成果直接去用，避免重復(fù)造輪子。比如大數(shù)據(jù)團(tuán)隊(duì)已經(jīng)在Amazon EMR上開發(fā)好的Spark代碼，比如在某個(gè)數(shù)據(jù)集里面已經(jīng)存在Amazon Redshift數(shù)倉(cāng)里面，只需要在大數(shù)據(jù)團(tuán)隊(duì)的代碼上加一句SQL做很小的轉(zhuǎn)換便可以供機(jī)器學(xué)習(xí)模型使用。

云原生數(shù)據(jù)戰(zhàn)略的第三大支柱是通過(guò)機(jī)器學(xué)習(xí)，重塑創(chuàng)新引擎。

第一步是幫助客戶找到合適的業(yè)務(wù)場(chǎng)景，例如通過(guò)個(gè)性化推薦提高轉(zhuǎn)化率、運(yùn)用機(jī)器視覺進(jìn)行身份驗(yàn)證等。在第一步的基礎(chǔ)上，第二步就是要通過(guò)開箱即用的AI SaaS服務(wù)快速地去驗(yàn)證機(jī)器學(xué)習(xí)是否能解決問(wèn)題。亞馬遜云科技 AI SaaS模型覆蓋了文檔處理、機(jī)器視覺、聊天機(jī)器人、搜索、推薦、語(yǔ)音、呼叫中心等7個(gè)橫向領(lǐng)域，以及工業(yè)、醫(yī)療健康、代碼開發(fā)等3個(gè)垂直領(lǐng)域。

在第一步和第二步都完成之后，第三步就是要解決機(jī)器學(xué)習(xí)的產(chǎn)業(yè)化挑戰(zhàn)。亞馬遜云科技提供支持所有主流機(jī)器學(xué)習(xí)框架的基礎(chǔ)設(shè)施和豐富的加速器實(shí)例；通過(guò)Amazon SageMaker等工具降低機(jī)器學(xué)習(xí)開發(fā)難度，并且將機(jī)器學(xué)習(xí)開發(fā)的流程融入到Ops中，實(shí)現(xiàn)端到端的機(jī)器學(xué)習(xí)自動(dòng)化。

第四步就是在產(chǎn)業(yè)外，更高的層次上，賦能更多的人去構(gòu)建機(jī)器學(xué)習(xí)的應(yīng)用，通過(guò)高校合作、競(jìng)賽、可視化工具等角度來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)的普及。

在以上云原生數(shù)據(jù)戰(zhàn)略的三個(gè)支柱下，離不開的是“安全”這個(gè)基石。要實(shí)現(xiàn)數(shù)據(jù)安全就要有有效的數(shù)據(jù)治理的手段。數(shù)據(jù)治理并不簡(jiǎn)單是一個(gè)技術(shù)問(wèn)題，更是一個(gè)人員流程和技術(shù)的組合。亞馬遜云科技提供全生命周期的數(shù)據(jù)治理結(jié)構(gòu)，幫助客戶解決數(shù)據(jù)安全挑戰(zhàn)。例如通過(guò)Data Mesh數(shù)據(jù)網(wǎng)格，解決企業(yè)全球數(shù)據(jù)安全合規(guī)和支持本地創(chuàng)新兩者兼得的需求。

云原生背后的底層芯片技術(shù)：真正改變?cè)品?wù)游戲規(guī)則的能力

一系列云服務(wù)的背后，離不開關(guān)鍵的底層技術(shù)的支持。張文翊表示，亞馬遜云科技帶來(lái)的發(fā)生在底層的、實(shí)打?qū)嵉膭?chuàng)新是真正的顛覆性的創(chuàng)新，擁有改變游戲規(guī)則的能力。顧凡表示，亞馬遜云科技擁有計(jì)算的兩大創(chuàng)新引擎：Amazon Nitro系統(tǒng)和自研芯片，這是探索新一代云技術(shù)架構(gòu)的關(guān)鍵技術(shù)。

Amazon Nitro作為亞馬遜云自研的底層核心系統(tǒng)，已經(jīng)在過(guò)去的近十年時(shí)間里發(fā)展到了第五代。Nitro系統(tǒng)將云計(jì)算資源底層的網(wǎng)絡(luò)、存儲(chǔ)、安全控制等功能，從服務(wù)器卸載到Amazon Nitro專用芯片上運(yùn)行，服務(wù)器的計(jì)算資源能完全服務(wù)于客戶的工作負(fù)載。配合一個(gè)輕量級(jí)的Hypervisor，Nitro的虛擬化引擎所占用物理服務(wù)器的系統(tǒng)資源不到1%，幾乎可以忽略不計(jì)，而傳統(tǒng)虛擬化占用物理服務(wù)器的系統(tǒng)資源通常會(huì)高達(dá)30%。

從2017年開始，Amazon EC2新實(shí)例的研發(fā)速度大幅地提高，這都得益于Amazon Nitro系統(tǒng)的迭代升級(jí)。

自研芯片是亞馬遜云科技的另一個(gè)重要底層技術(shù)。得益于Annapurna實(shí)驗(yàn)室的加持，亞馬遜云科技從2013年開始自研芯片，擁有完整的芯片產(chǎn)品布局：第一條線是剛剛提到的Amazon Nitro，第二條線是用于機(jī)器學(xué)習(xí)推理和訓(xùn)練的芯片Amazon Inferentia和Amazon Trainium，第三條線是基于ARM架構(gòu)的CPU Amazon Graviton。

2018年，亞馬遜云科技發(fā)布了第一款基于ARM的自研芯片Amazon Graviton，2019年發(fā)布Amazon Graviton2，去年發(fā)布最新一代的Amazon Graviton 3。Graviton2的性能比第一代Graviton提高了7倍；Graviton3比Graviton2的性能進(jìn)一步提高多達(dá)25%，能耗卻降低了60%。Graviton持續(xù)的迭代，證明亞馬遜云科技已經(jīng)步過(guò)了自研芯片的早期陡峭學(xué)習(xí)曲線。

對(duì)于云服務(wù)廠商而言，自研Arm芯片不是目的，目的是要有一系列能夠跑在之上的云服務(wù)。亞馬遜云科技已經(jīng)有超過(guò)20多種基于Amazon Graviton 2的托管服務(wù)，用戶無(wú)需重編譯便可直接享受Amazon Graviton 2的高性價(jià)比和低功耗。

除了Graviton系列外，亞馬遜云科技自研了面向機(jī)器學(xué)習(xí)推理和訓(xùn)練的加速芯片Amazon Inferentia和Amazon Trainium，將云端訓(xùn)練和推理推向最極致的性價(jià)比：

Trn1實(shí)例：Amazon EC2實(shí)例支持多達(dá)16顆Amazon Trainium加速芯片，是在云端最快的深度學(xué)習(xí)實(shí)例，Trn1上運(yùn)行的Hugging Face BERT大模型性能對(duì)比GPU的實(shí)例有42%提升，成本降低了54%；

Inf1實(shí)例：Alexa已經(jīng)大規(guī)模的在使用Inf1，國(guó)內(nèi)某社交媒體客戶將自己的計(jì)算機(jī)視覺（CV）和自然語(yǔ)言處理（NLP）等五個(gè)模型也部署到了Inf1上面，相比GPU的實(shí)例，吞吐量擴(kuò)大3倍。而成本降低了60%。

基于Amazon Inferentia的Amazon EC2 Inf1 計(jì)算實(shí)例已在西云數(shù)據(jù)和光環(huán)新網(wǎng)運(yùn)營(yíng)的中國(guó)區(qū)域落地。

除了上述的自研芯片，賽靈思的FPGA、英偉達(dá)的GPU、英特爾Habana Gaudi和亞馬遜云科技自研的Amazon Trainium和Amazon Inferentia、四大廠商的各種加速卡，亞馬遜云科技加速計(jì)算的產(chǎn)品家族已經(jīng)全面覆蓋。無(wú)論是CPU+GPU，CPU+FPGA，還是與量子計(jì)算機(jī)的異構(gòu)，亞馬遜云科技都能夠提供相應(yīng)的加速計(jì)算服務(wù)。

亞馬遜云科技構(gòu)建了完整的量子計(jì)算生態(tài)環(huán)境，包括了亞馬遜云科技上的量子服務(wù)Amazon Braket，量子實(shí)驗(yàn)室以及量子計(jì)算中心。Amazon Braket以API的形式讓客戶輕松訪問(wèn)量子計(jì)算機(jī)和模擬器，方便用戶去構(gòu)建模型的時(shí)候同時(shí)使用到經(jīng)典計(jì)算和量子計(jì)算資源。

總結(jié)

云服務(wù)的真正目的是賦能行業(yè)客戶，實(shí)現(xiàn)應(yīng)用創(chuàng)新。亞馬遜云科技是云服務(wù)的“探路者”，也是其它行業(yè)中“探路者”型企業(yè)的賦能者，為行業(yè)客戶提供行業(yè)特定的解決方案和跨行業(yè)通用的解決方案。不論是EV、自動(dòng)駕駛、雙碳還是元宇宙，新的行業(yè)應(yīng)用構(gòu)建都從云原生開始，在云上發(fā)展。而傳統(tǒng)行業(yè)應(yīng)用在轉(zhuǎn)型階段，邁入云原生也是必經(jīng)之路。

亞馬遜云科技作為云服務(wù)的發(fā)明者，透過(guò)十多年的云服務(wù)技術(shù)積累，以及與客戶多年的密切合作，已經(jīng)構(gòu)建了完整的云原生的服務(wù)體系。在當(dāng)下這個(gè)時(shí)間節(jié)點(diǎn)，借助亞馬遜云科技的完整云原生服務(wù)，云原生正在發(fā)生，并且將會(huì)以更高的成長(zhǎng)速度發(fā)展。