原創(chuàng)

云數(shù)據(jù)庫(kù)未來(lái)發(fā)展方向：云原生、一體化和多模輸入

時(shí)間：2023-03-28 17:26:43

關(guān)鍵字：阿里云云原生數(shù)據(jù)庫(kù) AIGC

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]“瑤池在古代是孕育八方寶藏的一個(gè)地方，各種各樣的寶貝都會(huì)匯聚到瑤池這個(gè)地方。在今天我們所處的社會(huì)里面，數(shù)據(jù)我們認(rèn)為是最大的寶藏。所以數(shù)據(jù)匯集的地方就是一個(gè)寶藏匯集的地方，所以我們把它叫做瑤池。數(shù)據(jù)到了瑤池里面，就能夠發(fā)揮出更大的價(jià)值。我們也希望所有的用戶所有的客戶，能夠像珍愛自己的寶貝一樣，把自己最珍貴的數(shù)據(jù)，都放到阿里云數(shù)據(jù)庫(kù)里面。”

在去年11月3日，阿里云原生數(shù)據(jù)庫(kù)正式命名為“瑤池”數(shù)據(jù)庫(kù)。彼時(shí)阿里巴巴集團(tuán)副總裁、阿里云智能數(shù)據(jù)庫(kù)產(chǎn)品事業(yè)部負(fù)責(zé)人李飛飛，向大家解析了“瑤池”這一命名的由來(lái)：“瑤池在古代是孕育八方寶藏的一個(gè)地方，各種各樣的寶貝都會(huì)匯聚到瑤池這個(gè)地方。在今天我們所處的社會(huì)里面，數(shù)據(jù)我們認(rèn)為是最大的寶藏。所以數(shù)據(jù)匯集的地方就是一個(gè)寶藏匯集的地方，所以我們把它叫做瑤池。數(shù)據(jù)到了瑤池里面，就能夠發(fā)揮出更大的價(jià)值。我們也希望所有的用戶所有的客戶，能夠像珍愛自己的寶貝一樣，把自己最珍貴的數(shù)據(jù)，都放到阿里云數(shù)據(jù)庫(kù)里面?！?

而在今年5月24日，阿里云瑤池?cái)?shù)據(jù)庫(kù)峰會(huì)在北京成功召開，阿里云向生態(tài)伙伴分享了云原生數(shù)據(jù)庫(kù)的最新技術(shù)積累和實(shí)踐，如何幫助用戶，將寶藏（數(shù)據(jù)）匯聚到瑤池中來(lái)，發(fā)揮出更大的價(jià)值。

云服務(wù)商的新機(jī)遇：新一代云上數(shù)據(jù)生態(tài)

云計(jì)算經(jīng)過了多年的發(fā)展，已經(jīng)成為了一個(gè)龐大的分布式計(jì)算體系。在這一體系中，云操作系統(tǒng)負(fù)責(zé)統(tǒng)籌管理和調(diào)度計(jì)算資源和數(shù)據(jù)，提供軟硬件協(xié)同的計(jì)算服務(wù)。而數(shù)據(jù)庫(kù)在整個(gè)云計(jì)算中至關(guān)重要，如何使用好數(shù)據(jù)、做好數(shù)據(jù)挖掘、賦能業(yè)務(wù)發(fā)展，是所有用戶關(guān)心的話題。

Gartenr認(rèn)為未來(lái)3～5年內(nèi)，云服務(wù)數(shù)據(jù)庫(kù)方面會(huì)有兩個(gè)趨勢(shì)。第一是數(shù)據(jù)重力（Data Gravity）效應(yīng)將會(huì)凸顯。從數(shù)據(jù)庫(kù)服務(wù)商的角度來(lái)講，就是強(qiáng)者愈強(qiáng)。有越多的數(shù)據(jù)庫(kù)實(shí)力的部署，有越多的客戶在使用，就能收獲到越多越領(lǐng)先的客戶的優(yōu)質(zhì)反饋，更多的客戶反饋和營(yíng)收也將會(huì)為數(shù)據(jù)分析、人工智能相關(guān)的技術(shù)研發(fā)帶來(lái)更多投入。

第二個(gè)趨勢(shì)是云上的數(shù)據(jù)庫(kù)生態(tài)的形成。目前云上數(shù)據(jù)庫(kù)的選擇變多（Diversity of Choice），每個(gè)垂直領(lǐng)域都優(yōu)質(zhì)的數(shù)據(jù)庫(kù)廠商在深耕。而數(shù)據(jù)庫(kù)企業(yè)用戶就面臨著如何將更多的工具有機(jī)整合在一起，實(shí)現(xiàn)業(yè)務(wù)打通，實(shí)現(xiàn)每個(gè)工具高效運(yùn)維的難題。而隨著數(shù)據(jù)庫(kù)廠商和云服務(wù)商合作的深入，Garten認(rèn)為這種企業(yè)復(fù)雜的運(yùn)維的工作將會(huì)逐漸被頭部的高科技云服務(wù)商的服務(wù)所替代，通過“云上的數(shù)據(jù)生態(tài)”來(lái)幫助企業(yè)客戶實(shí)現(xiàn)不同業(yè)務(wù)的數(shù)據(jù)庫(kù)的打通和有機(jī)整合。

而所謂的云上的數(shù)據(jù)生態(tài)，具體例如實(shí)現(xiàn)數(shù)據(jù)庫(kù)和硬件更好的兼容性；硬件的資源利用優(yōu)化，達(dá)到極致的性能，數(shù)據(jù)分析和數(shù)據(jù)分析的產(chǎn)品之間實(shí)現(xiàn)更好的數(shù)據(jù)共享等等。阿里云智能首席技術(shù)官周靖人表示，當(dāng)前云服務(wù)正處在一個(gè)變革期，如何把數(shù)據(jù)和云進(jìn)一步整合，形成新一代云上的數(shù)據(jù)生態(tài)，對(duì)于云服務(wù)商而言是一個(gè)新的機(jī)遇。

云數(shù)據(jù)庫(kù)未來(lái)發(fā)展方向：云原生、一體化和多模輸入

在這一數(shù)據(jù)處理生態(tài)變革中，有幾個(gè)明確的趨勢(shì)。第一是要實(shí)現(xiàn)Serverless架構(gòu)，通過云上操作系統(tǒng)來(lái)進(jìn)行物理映射匹配。云原生數(shù)據(jù)庫(kù)提供了傳統(tǒng)數(shù)據(jù)庫(kù)所不具備的高可用、高可靠彈性的能力，而Serverless會(huì)將這種能力進(jìn)一步演進(jìn)到一個(gè)新的時(shí)代。第二是要將廣大的計(jì)算資源有機(jī)地融合到數(shù)據(jù)庫(kù)系統(tǒng)中來(lái)，實(shí)現(xiàn)云上的彈性功能。第三是要數(shù)據(jù)庫(kù)智能化，數(shù)據(jù)庫(kù)本身能夠利用AI的技術(shù)，優(yōu)化數(shù)據(jù)相關(guān)AI分析能力。阿里云原生數(shù)據(jù)庫(kù)也一直在這幾個(gè)技術(shù)趨勢(shì)方向上進(jìn)行發(fā)展，李飛飛表示瑤池?cái)?shù)據(jù)庫(kù)將會(huì)匯聚各方的數(shù)據(jù)、多種類型的數(shù)據(jù)，讓數(shù)據(jù)業(yè)務(wù)持續(xù)在線，讓數(shù)據(jù)價(jià)值不斷放大，讓阿里云原生數(shù)據(jù)庫(kù)變得更快、更穩(wěn)、更安全、更好用。

定義云原生數(shù)據(jù)庫(kù)的未來(lái)發(fā)展方向：一體化和多模輸入

要實(shí)現(xiàn)數(shù)據(jù)庫(kù)更快、更穩(wěn)、更安全、更好用，阿里云認(rèn)為云原生數(shù)據(jù)庫(kù)要更快速地向“四化”去演進(jìn)，即“原生化、平臺(tái)化、一體化和智能化”。云原生是未來(lái)數(shù)據(jù)庫(kù)的趨勢(shì)，這已成為確定事實(shí)。單一的數(shù)據(jù)庫(kù)產(chǎn)品將不會(huì)再有機(jī)會(huì)去創(chuàng)造未來(lái)的，一定要基于云去構(gòu)建平臺(tái)化的能力，打造軟硬協(xié)同的自上到下全體系的創(chuàng)新，打造標(biāo)準(zhǔn)的API來(lái)支撐數(shù)據(jù)的無(wú)縫流動(dòng)，避免數(shù)據(jù)孤島。此外隨著ChatGPT的出現(xiàn)，讓業(yè)界看到了AIGC的可能性，智能和數(shù)據(jù)庫(kù)的結(jié)合將迸發(fā)住無(wú)限的潛力。

阿里云在云原生數(shù)據(jù)庫(kù)方面有三個(gè)核心產(chǎn)品，分別是AnalyticDB、PolarDB，以及云原生多模數(shù)據(jù)庫(kù)Lindorm，這三個(gè)產(chǎn)品分別面向個(gè)不同的應(yīng)用場(chǎng)景。PolarDB是阿里云從2017年開始自研核心云原生數(shù)據(jù)庫(kù)，從其命名上可以看出其追求極致的產(chǎn)品定位，這也是阿里云的旗艦數(shù)據(jù)庫(kù)產(chǎn)品。李飛飛表示，PolarDB已經(jīng)開始定義云原生數(shù)據(jù)庫(kù)的發(fā)展方向。

首先，PolarDB基于平臺(tái)化做深基礎(chǔ)的理念，結(jié)合阿里云的基礎(chǔ)設(shè)施去做軟硬協(xié)同。PolarDB提供基于SmartSSD智能硬盤的高壓縮比，能夠提供3倍常規(guī)壓縮比和100%加密的能力，且對(duì)主機(jī)CPU不會(huì)產(chǎn)生任何影響，能夠幫助客戶大幅減少成本。

第二，PolarDB是業(yè)界第一個(gè)、全球范圍內(nèi)第一個(gè)首先實(shí)現(xiàn)三層解耦的云原生數(shù)據(jù)庫(kù)，在存儲(chǔ)計(jì)算分離的基礎(chǔ)上，進(jìn)一步將計(jì)算層的內(nèi)存和CPU進(jìn)行解耦，將內(nèi)存進(jìn)行池化。三層解耦的架構(gòu)帶來(lái)的好處是可以做到無(wú)感的秒級(jí)彈性，李飛飛表示可以“彈得更廣，彈得更快，彈得更細(xì)”。大規(guī)模內(nèi)存的池化也將帶來(lái)成本下降，PolarDB可以將CPU利用率提高100%，內(nèi)存成本降低50%，大查詢的性能提高150%。

第三是在一體化的方向上，PolarDB講提供云原生分布式一體化的能力。在此次峰會(huì)上，阿里云也重磅宣布，首次將云原生數(shù)據(jù)庫(kù)PolarDB和云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB徹底打通融合，形成“云原生一體化”的HTAP解決方案。以后在PolarDB和ADB之間同步數(shù)據(jù)，再也不需要開發(fā)者搭配數(shù)據(jù)同步鏈路，阿里云通過邏輯復(fù)制、增量同步以及物理復(fù)制等技術(shù)，直接將數(shù)據(jù)庫(kù)從存儲(chǔ)層打通，實(shí)現(xiàn)統(tǒng)一入口的一站式體驗(yàn)。

除了云原生一體化外，另一個(gè)值得關(guān)注的是Lindorm數(shù)據(jù)庫(kù)對(duì)于AIGC場(chǎng)景的智能化支持。Lindorm支持多模數(shù)據(jù)的輸入和處理，例如用戶導(dǎo)入多模數(shù)據(jù)模型之后，一鍵就可以自動(dòng)基于文字描述形成不同的設(shè)計(jì)圖片。Lindorm數(shù)據(jù)庫(kù)將會(huì)成為AIGC時(shí)代的數(shù)據(jù)基礎(chǔ)設(shè)施，成為AIGC應(yīng)用中的利器。此外在數(shù)據(jù)庫(kù)的人機(jī)交互方面，阿里云也帶來(lái)了新的變革，通過自然語(yǔ)言進(jìn)行問題描述，數(shù)據(jù)庫(kù)就可以自動(dòng)輸出結(jié)果。這一技術(shù)叫做NL2SQL，將會(huì)進(jìn)一步簡(jiǎn)化開發(fā)者和數(shù)據(jù)庫(kù)的交互方式。

李飛飛表示，下半年P(guān)olarDB將會(huì)把NL2SQL技術(shù)正式產(chǎn)品化，結(jié)合Lindorm的AIGC的能力，相信阿里云數(shù)據(jù)庫(kù)做好了擁抱智能時(shí)代的一切準(zhǔn)備。

“擁抱云原生，擁抱開源”

開源和商業(yè)相結(jié)合的模式，能夠?qū)崿F(xiàn)更快速的生態(tài)發(fā)展和技術(shù)邁進(jìn)。云原生數(shù)據(jù)庫(kù)開源，可以使用戶降低遷移成本；開源社區(qū)的貢獻(xiàn)也能夠讓用戶在底層適配做的更好。李飛飛表示，開源加速了人類文明科技演進(jìn)的速度，這個(gè)非常非常重要，實(shí)際上最終所有人都會(huì)受益。但是這里面確實(shí)也要有一個(gè)挑戰(zhàn)的問題，就是怎么平衡開源和商業(yè)之間的關(guān)系。開源能夠加速科技創(chuàng)新，科技創(chuàng)新又帶來(lái)更多價(jià)值創(chuàng)造，價(jià)值創(chuàng)造帶來(lái)更多的機(jī)會(huì)反哺更多良性的循環(huán)，這是所有人都應(yīng)該打造的一個(gè)閉環(huán)的生態(tài)。

20230328_6422b2c95f5c0__云數(shù)據(jù)庫(kù)未來(lái)發(fā)展方向：云原生、一體化和多模輸入