www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 技術(shù)學(xué)院 > 技術(shù)前線
[導(dǎo)讀] SLO和SLA是大家常見的兩個名詞:服務(wù)等級目標(biāo)和服務(wù)等級協(xié)議。 云計算時代,各大云服務(wù)提供商都發(fā)布有自己服務(wù)的SLA條款,比如Amazon的EC2和S3服務(wù)都有相應(yīng)的SLA條款。這些大公司的SLA看上去如此的高達(dá)上,一般是怎么定義出來的呢?本文就嘗試從技術(shù)角度解剖一下SLA的制定過程。 說SLA不能不提SLO,這個是眾所周知的,但是還有一個概念知道的人就不多了,那就是SLI(Service Level Indicator),定義一個可執(zhí)行的SLA,好的SLO和SLI是必不可少的。 再有就是SLI/SLO/SLA都是和服務(wù)聯(lián)系在一起的,脫離了服務(wù)這三個概念就沒有什么意義了。

Service

什么是服務(wù)?

簡單說就是一切提供給客戶的有用功能都可以稱為服務(wù)。

服務(wù)一般會由服務(wù)提供者提供,提供這個有用功能的組織被稱為服務(wù)提供者,通常是人加上軟件,軟件的運(yùn)行需要計算資源,為了能對外提供有用的功能軟件可能會有對其他軟件系統(tǒng)的依賴。

客戶是使用服務(wù)提供者提供的服務(wù)的人或公司。

SLI

SLI是經(jīng)過仔細(xì)定義的測量指標(biāo),它根據(jù)不同系統(tǒng)特點確定要測量什么,SLI的確定是一個非常復(fù)雜的過程。

SLI的確定需要回答以下幾個問題:

要測量的指標(biāo)是什么?

測量時的系統(tǒng)狀態(tài)?

如何匯總處理測量的指標(biāo)?

測量指標(biāo)能否準(zhǔn)確描述服務(wù)質(zhì)量?

測量指標(biāo)的可靠度(trustworthy)?

1. 常見的測量指標(biāo)有以下幾個方面:

性能

響應(yīng)時間(latency)

吞吐量(throughput)

請求量(qps)

實效性(freshness)

可用性

運(yùn)行時間(uptime)

故障時間/頻率

可靠性

質(zhì)量

準(zhǔn)確性(accuracy)

正確性(correctness)

完整性(completeness)

覆蓋率(coverage)

相關(guān)性(relevance)

內(nèi)部指標(biāo)

隊列長度(queue length)

內(nèi)存占用(RAM usage)

因素人

響應(yīng)時間(time to response)

修復(fù)時間(time to fix)

修復(fù)率(fraction fixed)

下面通過一個例子來說明一下:hotmail的downtime SLI

錯誤率(error rate)計算的是服務(wù)返回給用戶的error總數(shù)

如果錯誤率大于X%,就算是服務(wù)down了,開始計算downtime

如果錯誤率持續(xù)超過Y分鐘,這個downtime就會被計算在內(nèi)

間斷性的小于Y分鐘的downtime是不被計算在內(nèi)的。

2. 測量時的系統(tǒng)狀態(tài),在什么情況下測量會嚴(yán)重影響測量的結(jié)果

測量異常(badly-formed)請求,還是失敗(fail)請求還是超時請求(timeout)

測量時的系統(tǒng)負(fù)載(是否最大負(fù)載)

測量的發(fā)起位置,服務(wù)器端還是客戶端

測量的時間窗口(僅工作日、還是一周7天、是否包括計劃內(nèi)的維護(hù)時間段)

3. 如何匯總處理測量的指標(biāo)?

計算的時間區(qū)間是什么:是一個滾動時間窗口,還是簡單的按照月份計算

使用平均值還是百分位值,比如:某服務(wù)X的ticket處理響應(yīng)時間SLI的

測量指標(biāo):統(tǒng)計所有成功解決請求,從用戶創(chuàng)建ticket到問題被解決的時間

怎么測量:用ticket自帶的時間戳,統(tǒng)計所有用戶創(chuàng)建的ticket

什么情況下的測量:只包括工作時間,不包含法定假日

用于SLI的數(shù)據(jù)指標(biāo):以一周為滑動窗口,95%分位的解決時間

4. 測量指標(biāo)能否準(zhǔn)確描述服務(wù)質(zhì)量?

性能:時效性、是否有偏差

準(zhǔn)確性:精度、覆蓋率、數(shù)據(jù)穩(wěn)定性

完整性:數(shù)據(jù)丟失、無效數(shù)據(jù)、異常(outlier)數(shù)據(jù)

5. 測量指標(biāo)的可靠度

是否服務(wù)提供者和客戶都認(rèn)可

是否可被獨(dú)立驗證,比如三方機(jī)構(gòu)

客戶端還是服務(wù)器端測量,取樣間隔

錯誤請求是如何計算的

SLO

SLO(服務(wù)等級目標(biāo))指定了服務(wù)所提供功能的一種期望狀態(tài)。SLO里面應(yīng)該包含什么呢?所有能夠描述服務(wù)應(yīng)該提供什么樣功能的信息。

服務(wù)提供者用它來指定系統(tǒng)的預(yù)期狀態(tài);開發(fā)人員編寫代碼來實現(xiàn);客戶依賴于SLO進(jìn)行商業(yè)判斷。SLO里沒有提到,如果目標(biāo)達(dá)不到會怎么樣。

SLO是用SLI來描述的,一般描述為:

比如以下SLO:

每分鐘平均qps > 100k/s

99% 訪問延遲 < 500ms

99% 每分鐘帶寬 > 200MB/s

設(shè)置SLO時的幾個最佳實踐:

指定計算的時間窗口

使用一致的時間窗口(XX小時滾動窗口、季度滾動窗口)

要有一個免責(zé)條款,比如:95%的時間要能夠達(dá)到SLO

如果Service是第一次設(shè)置SLO,可以遵循以下原則

測量系統(tǒng)當(dāng)前狀態(tài)

設(shè)置預(yù)期(expectations),而不是保證(guarantees)

初期的SLO不適合作為服務(wù)質(zhì)量的強(qiáng)化工具

改進(jìn)SLO

設(shè)置更低的響應(yīng)時間、更改的吞吐量等

保持一定的安全緩沖

內(nèi)部用的SLO要高于對外宣稱的SLO

不要超額完成

定期的downtime來使SLO不超額完成

設(shè)置SLO時的目標(biāo)依賴于系統(tǒng)的不同狀態(tài)(conditions),根據(jù)不同狀態(tài)設(shè)置不同的SLO:總SLO = service1.SLO1 weight1 + service2.SLO2 weight2 + …

為什么要有SLO,設(shè)置SLO的好處是什么呢?

對于客戶而言,是可預(yù)期的服務(wù)質(zhì)量,可以簡化客戶端的系統(tǒng)設(shè)計

對于服務(wù)提供者而言

可預(yù)期的服務(wù)質(zhì)量

更好的取舍成本/收益

更好的風(fēng)險控制(當(dāng)資源受限的時候)

故障時更快的反應(yīng),采取正確措施

SLO設(shè)好了,怎么保證能夠達(dá)到目標(biāo)呢?

需要一個控制系統(tǒng)來:

監(jiān)控/測量SLIs

對比檢測到的SLIs值是否達(dá)到目標(biāo)

如果需要,修證目標(biāo)或者修正系統(tǒng)以滿足目標(biāo)需要

實施目標(biāo)的修改或者系統(tǒng)的修改

該控制系統(tǒng)需要重復(fù)的執(zhí)行以上動作,以形成一個標(biāo)準(zhǔn)的反饋環(huán)路,不斷的衡量和改進(jìn)SLO/服務(wù)本身。

我們討論了目標(biāo)以及目標(biāo)是怎么測量的,還討論了控制機(jī)制來達(dá)到設(shè)置的目標(biāo),但是如果因為某些原因,設(shè)置的目標(biāo)達(dá)不到該怎么辦呢?

也許是因為大量的新增負(fù)載;也許是因為底層依賴不能達(dá)到標(biāo)稱的SLO而影響上次服務(wù)的SLO。這就需要SLA出場了。

SLA

SLA是一個涉及2方的合約,雙方必須都要同意并遵守這個合約。當(dāng)需要對外提供服務(wù)時,SLA是非常重要的一個服務(wù)質(zhì)量信號,需要產(chǎn)品和法務(wù)部門的同時介入。

SLA用一個簡單的公式來描述就是: SLA = SLO + 后果

SLO不能滿足的一系列動作,可以是部分不能達(dá)到

比如:達(dá)到響應(yīng)時間SLO+未達(dá)到可用性SLO

對動作的具體實施

需要一個通用的貨幣來獎勵/懲罰,比如:錢

SLA是一個很好的工具,可以用來幫助合理配置資源。一個有明確SLA的服務(wù)最理想的運(yùn)行狀態(tài)是:增加額外資源來改進(jìn)系統(tǒng)所帶來的收益小于把該資源投給其他服務(wù)所帶來的收益。

一個簡單的例子就是某服務(wù)可用性從99.9%提高到99.99%所需要的資源和帶來的收益之比,是決定該服務(wù)是否應(yīng)該提供4個9的重要依據(jù)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機(jī)驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機(jī)驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉