www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]互聯(lián)網(wǎng)系統(tǒng)為大量的C端用戶提供服務(wù),如果隔三差五的出問(wèn)題宕機(jī),會(huì)嚴(yán)重影響用戶體驗(yàn),甚至導(dǎo)致用戶流失。

互聯(lián)網(wǎng)系統(tǒng)為大量的C端用戶提供服務(wù),如果隔三差五的出問(wèn)題宕機(jī),會(huì)嚴(yán)重影響用戶體驗(yàn),甚至導(dǎo)致用戶流失。所以穩(wěn)定性對(duì)互聯(lián)網(wǎng)系統(tǒng)非常重要!接下來(lái),我根據(jù)自己的實(shí)際經(jīng)驗(yàn)來(lái)聊聊基于微服務(wù)的互聯(lián)網(wǎng)系統(tǒng)的穩(wěn)定性。

下面我們從雪崩隔離、服務(wù)降級(jí)、突發(fā)流量緩存、數(shù)據(jù)冗余、熔斷、限流、CDN數(shù)據(jù)庫(kù)、CI、網(wǎng)絡(luò)等方面,聊聊如何保證基于微服務(wù)的系統(tǒng)穩(wěn)定性。

雪崩效應(yīng)產(chǎn)生原因,如何避免?

服務(wù)化后,服務(wù)變多,調(diào)用鏈路變長(zhǎng),如果一個(gè)調(diào)用鏈上某個(gè)服務(wù)節(jié)點(diǎn)出問(wèn)題,很可能引發(fā)整個(gè)調(diào)用鏈路崩潰,也就是所謂的雪崩效應(yīng)。

億級(jí)用戶基于微服務(wù)的互聯(lián)網(wǎng)系統(tǒng)穩(wěn)定性~

舉個(gè)例子,詳細(xì)理解一下雪崩。如上圖,現(xiàn)在有A,B,C三個(gè)服務(wù),A調(diào)B,B調(diào)C。假如C發(fā)生故障,B方法1調(diào)用C方法1的請(qǐng)求不能及時(shí)返回,B的線程會(huì)發(fā)生阻塞等待。B會(huì)在一定時(shí)間后因?yàn)榫€程阻塞耗盡線程池所有線程,這時(shí)B就會(huì)無(wú)法響應(yīng)A的請(qǐng)求。A調(diào)用B的請(qǐng)求不能及時(shí)返回,A的線程池線程資源也會(huì)逐漸被耗盡,最終A也無(wú)法對(duì)外提供服務(wù)。這樣就引發(fā)了連鎖故障,發(fā)生了雪崩??v向:C故障引發(fā)B故障,B故障引發(fā)A故障,最終發(fā)生連鎖故障。橫向:方法1出問(wèn)題,導(dǎo)致線程阻塞,進(jìn)而線程池線程資源耗盡,最終服務(wù)內(nèi)所有方法都無(wú)法訪問(wèn),這就是“線程池污染”

為了避免雪崩效應(yīng),我們可以從兩個(gè)方面考慮:

  • 在服務(wù)間加熔斷。解決服務(wù)間縱向連鎖故障問(wèn)題。比如在A服務(wù)加熔斷,當(dāng)B故障時(shí),開(kāi)啟熔斷,A調(diào)用B的請(qǐng)求不再發(fā)送到B,直接快速返回。這樣就避免了線程等待的問(wèn)題。當(dāng)然快速返回什么,fallback方案是什么,也需要根據(jù)具體場(chǎng)景,比如返回默認(rèn)值或者調(diào)用其他備用服務(wù)接口。如果你的場(chǎng)景適合異步通信,可以采用消息隊(duì)列,這樣也有效避免同步調(diào)用的線程等待問(wèn)題。

億級(jí)用戶基于微服務(wù)的互聯(lián)網(wǎng)系統(tǒng)穩(wěn)定性~

  • 服務(wù)內(nèi)(JVM內(nèi))線程隔離。解決橫向線程池污染的問(wèn)題。為了避免因?yàn)橐粋€(gè)方法出問(wèn)題導(dǎo)致線程等待最終引發(fā)線程資源耗盡的問(wèn)題,我們可以對(duì)tomcat,dubbo等的線程池分成多個(gè)小線程組,每個(gè)線程組服務(wù)于不同的類或方法。一個(gè)方法出問(wèn)題,只影響自己不影響其他方法和類。

常用開(kāi)源熔斷隔離組件:Hystrix,Resilience4j

如何應(yīng)對(duì)突發(fā)流量對(duì)服務(wù)的巨大壓力?

促銷活動(dòng)或秒殺時(shí),訪問(wèn)量往往會(huì)猛增數(shù)倍。技術(shù)團(tuán)隊(duì)在活動(dòng)開(kāi)始前一般都會(huì)根據(jù)預(yù)估訪問(wèn)量適當(dāng)增加節(jié)點(diǎn),但是假如流量預(yù)估少了(實(shí)際訪問(wèn)量遠(yuǎn)大于預(yù)估的訪問(wèn)量),系統(tǒng)就可能會(huì)被壓垮。所以我們可以在網(wǎng)關(guān)(Zuul,Gateway,Nginx等)做限流,如果訪問(wèn)量超出系統(tǒng)承載能力,就按照一定策略拋棄超出閾值的訪問(wèn)請(qǐng)求(也要注意用戶體驗(yàn),可以給用戶返回一個(gè)友好的頁(yè)面提示)。

可以從全局,IP,userID等多維度做限流。限流的兩個(gè)主要目的:1,應(yīng)對(duì)突發(fā)流量,避免系統(tǒng)被壓垮(全局限流和IP限流)2,防刷,防止機(jī)器人腳本等頻繁調(diào)用服務(wù)(userID限流和IP限流)

數(shù)據(jù)冗余

在核心鏈路上,服務(wù)可以冗余它依賴的服務(wù)的數(shù)據(jù),依賴的服務(wù)故障時(shí),服務(wù)盡量做到自保。比如訂單服務(wù)依賴庫(kù)存服務(wù)。我們可以在訂單服務(wù)冗余庫(kù)存數(shù)據(jù)(注意控制合理的安全庫(kù)存,防超賣)。下單減庫(kù)存時(shí),如果庫(kù)存服務(wù)掛了,我們可以直接從訂單服務(wù)取庫(kù)存??梢越Y(jié)合熔斷一起使用,作為熔斷的Fallback后備)方案。

服務(wù)降級(jí)

可能很多人都聽(tīng)過(guò)服務(wù)降級(jí),但是又不知道降級(jí)是怎么回事。實(shí)際上,上面說(shuō)的熔斷,限流,數(shù)據(jù)冗余,都屬于服務(wù)降級(jí)的范疇。還有手動(dòng)降級(jí)的例子,比如大促期間我們會(huì)關(guān)掉第三方物流接口,頁(yè)面上也關(guān)掉物流查詢功能,避免拖垮自己的服務(wù)。這種降級(jí)的例子很多。不管什么降級(jí)方式,目的都是讓系統(tǒng)可用性更高,容錯(cuò)能力更強(qiáng),更穩(wěn)定。

緩存要注意什么?

  1. 緩存穿透。對(duì)于數(shù)據(jù)庫(kù)中根本不存在的值,請(qǐng)求緩存時(shí)要在緩存記錄一個(gè)空值,避免每次請(qǐng)求都打到數(shù)據(jù)庫(kù)

  2. 緩存雪崩。在某一時(shí)間緩存數(shù)據(jù)集中失效,導(dǎo)致大量請(qǐng)求穿透到數(shù)據(jù)庫(kù),將數(shù)據(jù)庫(kù)壓垮。可以在初始化數(shù)據(jù)時(shí),差異化各個(gè)key的緩存失效時(shí)間,失效時(shí)間 = 一個(gè)較大的固定值 + 較小的隨機(jī)值

  3. 緩存熱點(diǎn)。有些熱點(diǎn)數(shù)據(jù)訪問(wèn)量會(huì)特別大,單個(gè)緩存節(jié)點(diǎn)(例如Redis)無(wú)法支撐這么大的訪問(wèn)量。如果是讀請(qǐng)求訪問(wèn)量大,可以考慮讀寫分離,一主多從的方案,用從節(jié)點(diǎn)分?jǐn)傋x流量;如果是寫請(qǐng)求訪問(wèn)量大,可以采用集群分片方案,用分片分?jǐn)倢懥髁?。以秒殺扣減庫(kù)存為例,假如秒殺庫(kù)存是100,可以分成5片,每片存20個(gè)庫(kù)存。

關(guān)于隔離的考慮

  1. 部署隔離:我們經(jīng)常會(huì)遇到秒殺業(yè)務(wù)和日常業(yè)務(wù)依賴同一個(gè)服務(wù),以及C端服務(wù)和內(nèi)部運(yùn)營(yíng)系統(tǒng)依賴同一個(gè)服務(wù)的情況,比如說(shuō)都依賴訂單服務(wù)。而秒殺系統(tǒng)的瞬間訪問(wèn)量很高,可能會(huì)對(duì)服務(wù)帶來(lái)巨大的壓力,甚至壓垮服務(wù)。內(nèi)部運(yùn)營(yíng)系統(tǒng)也經(jīng)常有批量數(shù)據(jù)導(dǎo)出的操作,同樣會(huì)給服務(wù)帶來(lái)一定的壓力。這些都是不穩(wěn)定因素。所以我們可以將這些共同依賴的服務(wù)分組部署,不同的分組服務(wù)于不同的業(yè)務(wù),避免相互干擾。

  2. 數(shù)據(jù)隔離:極端情況下還需要緩存隔離,數(shù)據(jù)庫(kù)隔離。以秒殺為例,庫(kù)存和訂單的緩存(Redis)和數(shù)據(jù)庫(kù)需要單獨(dú)部署!數(shù)據(jù)隔離后,秒殺訂單和日常訂單不在相同的數(shù)據(jù)庫(kù),之后的訂單查詢?cè)趺凑故??可以采用相?yīng)的數(shù)據(jù)同步策略。比如,在創(chuàng)建秒殺訂單后發(fā)消息到消息隊(duì)列,日常訂單服務(wù)收到消息后將訂單寫入日常訂單庫(kù)。注意,要考慮數(shù)據(jù)的一致性,可以使用事務(wù)型消息。

  3. 業(yè)務(wù)隔離:還是以秒殺為例。從業(yè)務(wù)上把秒殺和日常的售賣區(qū)分開(kāi)來(lái),把秒殺做為營(yíng)銷活動(dòng),要參與秒殺的商品需要提前報(bào)名參加活動(dòng),這樣我們就能提前知道哪些商家哪些商品要參與秒殺,可以根據(jù)提報(bào)的商品提前生成商品詳情靜態(tài)頁(yè)面并上傳到CDN預(yù)熱,提報(bào)的商品庫(kù)存也需要提前預(yù)熱,可以將商品庫(kù)存在活動(dòng)開(kāi)始前預(yù)熱到Redis,避免秒殺開(kāi)始后大量訪問(wèn)穿透到數(shù)據(jù)庫(kù)。

    億級(jí)用戶基于微服務(wù)的互聯(lián)網(wǎng)系統(tǒng)穩(wěn)定性~

慢查詢和大結(jié)果集問(wèn)題

數(shù)據(jù)庫(kù)層面主要考慮慢查詢和大結(jié)果集問(wèn)題:

  1. 慢查詢是系統(tǒng)故障的罪魁禍?zhǔn)?,如何避免慢查詢,也是我們必須思考的?wèn)題。我們的做法是所有新加和修改的sql語(yǔ)句都要經(jīng)過(guò)DBA審核,并且做好線上慢查詢監(jiān)控。

  2. 大結(jié)果集問(wèn)題。如果用mybatis,某些字段傳了空值或者忘傳了,if 判斷為假,就漏掉了相關(guān)條件,很有可能導(dǎo)致大結(jié)果集產(chǎn)生。為了避免大結(jié)果集,我們除了做好必傳參數(shù)校驗(yàn),還可以加一個(gè)攔截器,來(lái)限制所有結(jié)果集的條數(shù),比如一個(gè)SQL最多查100條。

系統(tǒng)問(wèn)題快速定位!

服務(wù)化后,一次請(qǐng)求會(huì)跨多個(gè)服務(wù),追蹤問(wèn)題也會(huì)變麻煩。這時(shí)就需要能夠追蹤整個(gè)調(diào)用鏈路的工具,協(xié)助我們排查問(wèn)題。常見(jiàn)的開(kāi)源全鏈路監(jiān)控工具有(pinpoint,skywaking,cat等),以Pinpoint為例簡(jiǎn)單介紹一下:

Pinpoint基于JAVA,利用字節(jié)碼增強(qiáng)技術(shù),對(duì)服務(wù)零侵入,以traceID串聯(lián)各個(gè)服務(wù),已Plugin的方式支持不同API和中間件的監(jiān)控,靈活方便。

億級(jí)用戶基于微服務(wù)的互聯(lián)網(wǎng)系統(tǒng)穩(wěn)定性~

上圖是一個(gè)請(qǐng)求的調(diào)用棧,我們可以清晰看到一次請(qǐng)求調(diào)用了哪些服務(wù)和方法以及各個(gè)環(huán)節(jié)的耗時(shí),以及發(fā)生在哪個(gè)節(jié)點(diǎn)。如果發(fā)生錯(cuò)誤,會(huì)顯示為紅色,錯(cuò)誤原因也會(huì)直接顯示出來(lái)。這樣通過(guò)APM系統(tǒng)我們就能輕松定位線上性能問(wèn)題和錯(cuò)誤了!

CI測(cè)試&性能測(cè)試

CI測(cè)試,持續(xù)集成測(cè)試,在我們每次提交代碼到發(fā)布分支前自動(dòng)構(gòu)建項(xiàng)目并執(zhí)行所有測(cè)試用例,如果有測(cè)試用例執(zhí)行失敗,拒絕將代碼合并到發(fā)布分支,本次集成失敗。CI測(cè)試可以保證上線質(zhì)量,適用于用例不會(huì)經(jīng)常變化的穩(wěn)定業(yè)務(wù)。

性能測(cè)試,為了保證上線性能,所有用戶側(cè)功能需要進(jìn)行性能測(cè)試。上線前要保證性能測(cè)試通過(guò)。而且要定期做全鏈路壓測(cè),有性能問(wèn)題可以及時(shí)發(fā)現(xiàn)。

監(jiān)控

我們需要一套完善的監(jiān)控系統(tǒng),系統(tǒng)出問(wèn)題時(shí)能夠快速告警,最好是系統(tǒng)出問(wèn)題前能提前預(yù)警。包括系統(tǒng)監(jiān)控(CPU,內(nèi)存,網(wǎng)絡(luò)IO,帶寬等監(jiān)控),數(shù)據(jù)庫(kù)監(jiān)控(QPS,TPS,慢查詢,大結(jié)果集等監(jiān)控),緩存中間件監(jiān)控(如Redis),JVM監(jiān)控(堆內(nèi)存,GC,線程等監(jiān)控),全鏈路監(jiān)控(pinpoint,skywaking,cat等),各種接口監(jiān)控(QPS,TPS等)

CDN

可以充分利用CDN。除了提高用戶訪問(wèn)速度之外,頁(yè)面靜態(tài)化之后存放到CDN,用CDN扛流量,可以大幅減少系統(tǒng)(源站)的訪問(wèn)壓力。同時(shí)也減少了網(wǎng)站帶寬壓力。對(duì)系統(tǒng)穩(wěn)定性非常有好處。

避免單點(diǎn)問(wèn)題

除了服務(wù)要多點(diǎn)部署外,網(wǎng)關(guān),數(shù)據(jù)庫(kù),緩存也要避免單點(diǎn)問(wèn)題,至少要有一個(gè)Backup,而且要可以自動(dòng)發(fā)現(xiàn)上線節(jié)點(diǎn)和自動(dòng)摘除下線和故障節(jié)點(diǎn)。

網(wǎng)絡(luò)帶寬

避免帶寬成為瓶頸,促銷和秒殺開(kāi)始前提前申請(qǐng)帶寬。不光要考慮外網(wǎng)帶寬,還要考慮內(nèi)網(wǎng)帶寬,有些舊服務(wù)器網(wǎng)口是千兆網(wǎng)口,訪問(wèn)量高時(shí)很可能會(huì)打滿。

安全

  1. 可以在網(wǎng)關(guān)層上面再加一層防火墻或者高防服務(wù),來(lái)防御DDos,CC等分布式網(wǎng)絡(luò)攻擊。

  2. 機(jī)器人腳本防刷,前面已經(jīng)提到過(guò),可以在網(wǎng)關(guān)層對(duì)下單等接口按userID限流。

此外,一套完善的灰度發(fā)布系統(tǒng),可以讓上線更加平滑,避免上線大面積故障。DevOps工具,CI,CD對(duì)系統(tǒng)穩(wěn)定性也有很大意義。

OK,就分享到這。


免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉