邢孟棒:性能工程師書單推薦與性能工程常見誤區(qū)
作者簡介:
邢孟棒,曾供職于阿里、網(wǎng)易,目前在騰訊云專職做性能優(yōu)化方向。Linux 業(yè)余愛好者,偏好鉆研各類工具源碼與底層技術(shù)原理。在日常的性能工程實踐中,比較注重方法論的探索、優(yōu)化案例的沉淀。熱衷于 eBPF 技術(shù),擅長傳統(tǒng)工具與 BPF 工具的結(jié)合應(yīng)用。
一、性能工程師書單推薦
推薦1:《Linux 命令行與 shell 腳本編程大全》
這是一本關(guān)于 Linux命令行與shell腳本編程的全方位教程,主要包括四大部分:Linux命令行,shell腳本編程基礎(chǔ),高級shell腳本編程,如何創(chuàng)建實用的shell腳本。尤其推薦閱讀第 5 章,幫助理解 shell 執(zhí)行原理與子 shell 用法。
推薦2:《Linux/Unix 系統(tǒng)編程手冊》
個人覺得這本書已超越經(jīng)典書籍 APUE,非常值得推薦。本書詳細(xì)描述了 Linux/Unix 系統(tǒng)編程所涉及的逾 500 個系統(tǒng)調(diào)用和庫函數(shù),并輔之以全面而清晰的逾 200 個程序示例。
推薦3:《Linux 內(nèi)核設(shè)計與實現(xiàn)》
簡稱LKD,內(nèi)核新人首選必讀的書籍,幫助快速了解 Linux 內(nèi)核設(shè)計與實現(xiàn)。相比大部頭 ULK,本書不糾結(jié)于太多細(xì)節(jié),整體讀起來壓力較小。
推薦4:《程序員的自我修養(yǎng):鏈接、裝載與庫》
推薦作為深入學(xué)習(xí)系統(tǒng)軟件運行機(jī)制和原理的參考書,涉及應(yīng)用程序在編譯、鏈接和運行時相關(guān)實現(xiàn)細(xì)節(jié),包括代碼指令如何保存,庫文件如何與應(yīng)用程序代碼靜態(tài)鏈接,應(yīng)用程序如何被裝載到內(nèi)存中并開始運行,動態(tài)鏈接如何實現(xiàn)等。
推薦5:《性能之巔》
系統(tǒng)學(xué)習(xí)性能優(yōu)化必備書籍,尤其是文中提及的性能方法,受益匪淺。本書介紹了操作系統(tǒng)和應(yīng)用程序的概念、策略、工具和調(diào)優(yōu),并用基于 Linux 的操作系統(tǒng)作為主要示例。本書的主要內(nèi)容包括:硬件、內(nèi)核和應(yīng)用程序的內(nèi)部結(jié)構(gòu),以及它們的工作機(jī)制,對復(fù)雜系統(tǒng)進(jìn)行性能分析的方法,針對 CPU、內(nèi)存、文件系統(tǒng)、磁盤和網(wǎng)絡(luò)的優(yōu)化手段,以及如何使用 perf、Ftrace和BPF (BCC和bpftrace)進(jìn)行復(fù)雜的剖析和跟蹤。
推薦6:《BPF 之巔》
系統(tǒng)學(xué)習(xí) BPF 技術(shù)必備書籍。作為一名性能工程師,我在平時的工作中大量使用 BPF 工具,通過觀測內(nèi)核行為協(xié)助分析定位性能問題。本書展示了超過150個可以立即使用的 BPF 性能分析工具,對這些工具的應(yīng)用場景進(jìn)行了分析,還提供了開發(fā)自定義工具的分步指南。在本書中,讀者可學(xué)習(xí)到如何利用 BPF 提供的強(qiáng)大觀測能力分析 CPU、內(nèi)存、存儲設(shè)備、文件系統(tǒng)、網(wǎng)絡(luò)、編程語言、應(yīng)用程序、容器、虛擬機(jī)管理器、安全及內(nèi)核。
二、性能工程常見誤區(qū)
誤區(qū) 1:不求甚解,誤用或濫用性能工具。
工具、指標(biāo)與方法是性能分析與優(yōu)化的三個要素。當(dāng)遇到性能瓶頸時,恰當(dāng)?shù)臅r機(jī)選擇恰當(dāng)?shù)男阅芄ぞ呖梢允掳牍Ρ?。然而,想要把性能工具用好,一方面離不開對其所揭示的關(guān)鍵性能指標(biāo)以及背后基礎(chǔ)原理的深入理解,另一方面需要輔以性能方法作理論指導(dǎo)。僅掌握性能工具自身的基礎(chǔ)用法,容易誤用或濫用,對目標(biāo)系統(tǒng)產(chǎn)生非必要的副作用(觀察者效應(yīng))。工具、指標(biāo)與方法相輔相成,如果能夠熟練掌握,那么你已經(jīng)是一位夠格的性能工程師。
誤區(qū) 2:手忙腳亂,遇到問題時眉毛胡子一把抓。
究其原因,主要是缺少有效的性能方法作理論指導(dǎo)。當(dāng)面對存在性能問題的復(fù)雜系統(tǒng)環(huán)境時,好的性能方法可以幫助你更好的了解系統(tǒng)現(xiàn)狀,并指導(dǎo)你從哪里開始做分析,什么情況下關(guān)注哪些指標(biāo)以及使用哪些推薦工具。掌握常見的性能方法,例如 USE 方法、CPU 剖析、off-CPU 分析、系統(tǒng)調(diào)用分析等,助你逐漸形成遇事不亂、有章可循的優(yōu)秀職業(yè)素養(yǎng)。
誤區(qū) 3:望而卻步,不了解組件實現(xiàn)邏輯難以對其分析。
『懷疑這個組件有問題,但我不太了解它的具體實現(xiàn)邏輯,還是直接找開發(fā)者或者熟悉它的人分析一下』這是逃避性能問題的一種常見推辭,實際上卻在錯失成為高手的機(jī)會。我們可以把某個組件當(dāng)做黑盒去分析,具體的分析手段有很多,比如通過系統(tǒng)資源分析識別出影響業(yè)務(wù)性能的具體資源、調(diào)整網(wǎng)絡(luò)參數(shù)解決業(yè)務(wù)數(shù)據(jù)包接收存在延遲抖動問題、CPU 剖析找出熱點函數(shù)發(fā)生的代碼路徑、off-CPU 分析線程阻塞的具體原因、系統(tǒng)調(diào)用分析識別出組件 IO 寫延遲存在異常值等等。面對未知問題時不退卻,積極迎接,可以讓你走在多數(shù)人前面。
誤區(qū) 4:一葉障目,陷入源碼細(xì)節(jié)難以自拔。
在實際工作中,遇到一些同事在處理性能問題時,容易抓住某個可疑點不松手,并陷入到應(yīng)用或內(nèi)核源碼細(xì)節(jié)里面跳出不來,偏離問題的實際方向而浪費了較多時間。建立性能全局觀作為破解之道,助你及時調(diào)整問題的關(guān)注重點,避免過早陷入源碼細(xì)節(jié)。
誤區(qū) 5:安于現(xiàn)狀,邁不出改進(jìn)或創(chuàng)造性能工具的步子。
使用性能工具的三重境界:掌握工具的基本用法、熟練使用且了解工具基本原理、改進(jìn)工具或創(chuàng)建新工具。當(dāng)現(xiàn)有工具不能滿足你的實際需求時,不妨試著對其進(jìn)行改進(jìn)或者創(chuàng)造屬于自己的工具。也許你會很快嘗到甜頭,并且一發(fā)不可收拾。