云數據庫未來發(fā)展方向:云原生、一體化和多模輸入
在去年11月3日,阿里云原生數據庫正式命名為“瑤池”數據庫。彼時阿里巴巴集團副總裁、阿里云智能數據庫產品事業(yè)部負責人李飛飛,向大家解析了“瑤池”這一命名的由來:“瑤池在古代是孕育八方寶藏的一個地方,各種各樣的寶貝都會匯聚到瑤池這個地方。在今天我們所處的社會里面,數據我們認為是最大的寶藏。所以數據匯集的地方就是一個寶藏匯集的地方,所以我們把它叫做瑤池。數據到了瑤池里面,就能夠發(fā)揮出更大的價值。我們也希望所有的用戶所有的客戶,能夠像珍愛自己的寶貝一樣,把自己最珍貴的數據,都放到阿里云數據庫里面?!?
而在今年5月24日,阿里云瑤池數據庫峰會在北京成功召開,阿里云向生態(tài)伙伴分享了云原生數據庫的最新技術積累和實踐,如何幫助用戶,將寶藏(數據)匯聚到瑤池中來,發(fā)揮出更大的價值。
云服務商的新機遇:新一代云上數據生態(tài)
云計算經過了多年的發(fā)展,已經成為了一個龐大的分布式計算體系。在這一體系中,云操作系統(tǒng)負責統(tǒng)籌管理和調度計算資源和數據,提供軟硬件協同的計算服務。而數據庫在整個云計算中至關重要,如何使用好數據、做好數據挖掘、賦能業(yè)務發(fā)展,是所有用戶關心的話題。
Gartenr認為未來3~5年內,云服務數據庫方面會有兩個趨勢。第一是數據重力(Data Gravity)效應將會凸顯。從數據庫服務商的角度來講,就是強者愈強。有越多的數據庫實力的部署,有越多的客戶在使用,就能收獲到越多越領先的客戶的優(yōu)質反饋,更多的客戶反饋和營收也將會為數據分析、人工智能相關的技術研發(fā)帶來更多投入。
第二個趨勢是云上的數據庫生態(tài)的形成。目前云上數據庫的選擇變多(Diversity of Choice),每個垂直領域都優(yōu)質的數據庫廠商在深耕。而數據庫企業(yè)用戶就面臨著如何將更多的工具有機整合在一起,實現業(yè)務打通,實現每個工具高效運維的難題。而隨著數據庫廠商和云服務商合作的深入,Garten認為這種企業(yè)復雜的運維的工作將會逐漸被頭部的高科技云服務商的服務所替代,通過“云上的數據生態(tài)”來幫助企業(yè)客戶實現不同業(yè)務的數據庫的打通和有機整合。
而所謂的云上的數據生態(tài),具體例如實現數據庫和硬件更好的兼容性;硬件的資源利用優(yōu)化,達到極致的性能,數據分析和數據分析的產品之間實現更好的數據共享等等。阿里云智能首席技術官周靖人表示,當前云服務正處在一個變革期,如何把數據和云進一步整合,形成新一代云上的數據生態(tài),對于云服務商而言是一個新的機遇。
在這一數據處理生態(tài)變革中,有幾個明確的趨勢。第一是要實現Serverless架構,通過云上操作系統(tǒng)來進行物理映射匹配。云原生數據庫提供了傳統(tǒng)數據庫所不具備的高可用、高可靠彈性的能力,而Serverless會將這種能力進一步演進到一個新的時代。第二是要將廣大的計算資源有機地融合到數據庫系統(tǒng)中來,實現云上的彈性功能。第三是要數據庫智能化,數據庫本身能夠利用AI的技術,優(yōu)化數據相關AI分析能力。阿里云原生數據庫也一直在這幾個技術趨勢方向上進行發(fā)展,李飛飛表示瑤池數據庫將會匯聚各方的數據、多種類型的數據,讓數據業(yè)務持續(xù)在線,讓數據價值不斷放大,讓阿里云原生數據庫變得更快、更穩(wěn)、更安全、更好用。
定義云原生數據庫的未來發(fā)展方向:一體化和多模輸入
要實現數據庫更快、更穩(wěn)、更安全、更好用,阿里云認為云原生數據庫要更快速地向“四化”去演進,即“原生化、平臺化、一體化和智能化”。云原生是未來數據庫的趨勢,這已成為確定事實。單一的數據庫產品將不會再有機會去創(chuàng)造未來的,一定要基于云去構建平臺化的能力,打造軟硬協同的自上到下全體系的創(chuàng)新,打造標準的API來支撐數據的無縫流動,避免數據孤島。此外隨著ChatGPT的出現,讓業(yè)界看到了AIGC的可能性,智能和數據庫的結合將迸發(fā)住無限的潛力。
阿里云在云原生數據庫方面有三個核心產品,分別是AnalyticDB、PolarDB,以及云原生多模數據庫Lindorm,這三個產品分別面向個不同的應用場景。PolarDB是阿里云從2017年開始自研核心云原生數據庫,從其命名上可以看出其追求極致的產品定位,這也是阿里云的旗艦數據庫產品。李飛飛表示,PolarDB已經開始定義云原生數據庫的發(fā)展方向。
首先,PolarDB基于平臺化做深基礎的理念,結合阿里云的基礎設施去做軟硬協同。PolarDB提供基于SmartSSD智能硬盤的高壓縮比,能夠提供3倍常規(guī)壓縮比和100%加密的能力,且對主機CPU不會產生任何影響,能夠幫助客戶大幅減少成本。
第二,PolarDB是業(yè)界第一個、全球范圍內第一個首先實現三層解耦的云原生數據庫,在存儲計算分離的基礎上,進一步將計算層的內存和CPU進行解耦,將內存進行池化。三層解耦的架構帶來的好處是可以做到無感的秒級彈性,李飛飛表示可以“彈得更廣,彈得更快,彈得更細”。大規(guī)模內存的池化也將帶來成本下降,PolarDB可以將CPU利用率提高100%,內存成本降低50%,大查詢的性能提高150%。
第三是在一體化的方向上,PolarDB講提供云原生分布式一體化的能力。在此次峰會上,阿里云也重磅宣布,首次將云原生數據庫PolarDB和云原生數據倉庫AnalyticDB徹底打通融合,形成“云原生一體化”的HTAP解決方案。以后在PolarDB和ADB之間同步數據,再也不需要開發(fā)者搭配數據同步鏈路,阿里云通過邏輯復制、增量同步以及物理復制等技術,直接將數據庫從存儲層打通,實現統(tǒng)一入口的一站式體驗。
除了云原生一體化外,另一個值得關注的是Lindorm數據庫對于AIGC場景的智能化支持。Lindorm支持多模數據的輸入和處理,例如用戶導入多模數據模型之后,一鍵就可以自動基于文字描述形成不同的設計圖片。Lindorm數據庫將會成為AIGC時代的數據基礎設施,成為AIGC應用中的利器。此外在數據庫的人機交互方面,阿里云也帶來了新的變革,通過自然語言進行問題描述,數據庫就可以自動輸出結果。這一技術叫做NL2SQL,將會進一步簡化開發(fā)者和數據庫的交互方式。
李飛飛表示,下半年PolarDB將會把NL2SQL技術正式產品化,結合Lindorm的AIGC的能力,相信阿里云數據庫做好了擁抱智能時代的一切準備。
“擁抱云原生,擁抱開源”
開源和商業(yè)相結合的模式,能夠實現更快速的生態(tài)發(fā)展和技術邁進。云原生數據庫開源,可以使用戶降低遷移成本;開源社區(qū)的貢獻也能夠讓用戶在底層適配做的更好。李飛飛表示,開源加速了人類文明科技演進的速度,這個非常非常重要,實際上最終所有人都會受益。但是這里面確實也要有一個挑戰(zhàn)的問題,就是怎么平衡開源和商業(yè)之間的關系。開源能夠加速科技創(chuàng)新,科技創(chuàng)新又帶來更多價值創(chuàng)造,價值創(chuàng)造帶來更多的機會反哺更多良性的循環(huán),這是所有人都應該打造的一個閉環(huán)的生態(tài)。
20230328_6422b2c95f5c0__云數據庫未來發(fā)展方向:云原生、一體化和多模輸入