當前位置：首頁 > 公眾號精選 > 程序喵大人

Linux 進程管理之調度和進程切換知識點

時間：2021-07-11 18:18:36

關鍵字： Linux 進程管理 CPU

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]什么是調度？按照某種調度算法，從進程的ready隊列中選擇進程給CPU。

什么是調度？按照某種調度算法，從進程的ready隊列中選擇進程給CPU。
為什么要調度？為了最大限度的利用CPU。

調度相關結構體

task_struct

我們先把task_struct中和調度相關的結構拎出來：
struct task_struct {
......
/*
*調度類。用 sched_class 對調度器進行抽象
*Stop調度器:stop_sched_class
*Deadline調度器:dl_sched_class
*RT調度器:rt_sched_class
*CFS調度器:cfs_sched_class
*IDLE-Task調度器:idle_sched_class
*/
const struct sched_class *sched_class;
//CFS調度實體
struct sched_entity  se;
//RT調度實體
struct sched_rt_entity  rt;
......
#ifdef CONFIG_CGROUP_SCHED
//任務組（在每個CPU上都會維護一個CFS調度實體、CFS運行隊列; RT調度實體，RT運行隊列）
struct task_group  *sched_task_group;
#endif
//DL調度實體
struct sched_dl_entity  dl;
......
/*
*進程的調度策略,有6種。
*限期進程調度策略:SCHED_DEADLINE。DL調度器
*實時進程調度策略:SCHED_FIFO，SCHED_RR。RT調度器
*普通進程調度策略:SCHED_NORMAL，SCHED_BATCH，SCHED_IDLE。CFS調度器
*/
unsigned int   policy;
......
}

struct sched_class 對調度器進行抽象，一共分為5類：

Stop調度器：優(yōu)先級最高的調度類，可以搶占其他所有進程，不能被其他進程搶占；
Deadline調度器：使用紅黑樹，把進程按照絕對截止期限進行排序，選擇最小進程進行調度運行；
RT調度器：為每個優(yōu)先級維護一個隊列；
CFS調度器：采用完全公平調度算法，引入虛擬運行時間概念；
IDLE-Task調度器：每個CPU都會有一個idle線程，當沒有其他進程可以調度時，調度運行idle線程；

unsigned int policy 進程的調度策略有6種，用戶可以調用調度器里的不同調度策略：

SCHED_DEADLINE：使task選擇Deadline調度器來調度運行
SCHED_RR：時間片輪轉，進程用完時間片后加入優(yōu)先級對應運行隊列的尾部，把CPU讓給同優(yōu)先級的其他進程；
SCHED_FIFO：先進先出調度沒有時間片，沒有更高優(yōu)先級的情況下，只能等待主動讓出CPU；
SCHED_NORMAL：使task選擇CFS調度器來調度運行；
SCHED_BATCH：批量處理，使task選擇CFS調度器來調度運行；
SCHED_IDLE：使task以最低優(yōu)先級選擇CFS調度器來調度運行；

struct sched_entity se；采用CFS算法調度的普通非實時進程的調度實體
struct sched_rt_entity rt；采用Roound-Robin或者FIFO算法調度的實時調度實體
struct sched_dl_entity dl; 采用EDF算法調度的實時調度實體

分配給CPU的task，作為調度實體加入到運行隊列中
runqueue 運行隊列 struct rq {
......

//三個調度隊列：CFS調度，RT調度，DL調度
struct cfs_rq cfs;
struct rt_rq rt;
struct dl_rq dl;

......
//idle指向空閑內核線程, stop指向遷移內核線程
struct task_struct *curr, *idle, *stop;
......
}
三個調度隊列：

struct cfs_rq cfs; CFS調度隊列
struct rt_rq rt; RT調度隊列
struct dl_rq dl; DL調度隊列

每個CPU都有一個運行隊列，每個運行隊列中有三個調度隊列，task作為調度實體加入到各自的調度隊列中。

調度流程

調度的本質就是選擇下一個進程來運行，調度的過程分為兩步：

1. 設置調度標記

為CPU上正在運行的進程thread_info結構體里的flags成員設置TIF_NEED_RESCHED。
那么，什么時候設置TIF_NEED_RESCHED呢？

scheduler_tick 時鐘中斷
wake_up_process 喚醒進程的時候
do_fork 創(chuàng)建新進程的時候
smp_send_reschedule 負載均衡的時候
set_user_nice 修改進程nice值的時候

以上情況下都會通過 resched_curr 來設置進程thread_info結構體里的flags成員為TIF_NEED_RESCHED。以 scheduler_tick 和 wake_up_process 為例：
關于是否需要設置TIF_NEED_RESCHED的依據(jù)涉及到具體的調度算法，等我們講到具體調度器時再詳細講。

2. 執(zhí)行調度

kernel判斷當前進程標記是否為TIF_NEED_RESCHED，是的話調用 schedule 函數(shù)切換上下文，kernel空間是可以關搶占的，user空間是無法關搶占的。搶占可分為內核態(tài)搶占和用戶態(tài)搶占

用戶態(tài)搶占

ret_to_user是系統(tǒng)調用，異常觸發(fā)，中斷處理完成后都會調用的函數(shù)。

內核態(tài)搶占

進程切換上下文 context_switch

通過上面我們知道執(zhí)行調度的時候發(fā)生在 _schedule 函數(shù)里。
重點是其中的兩個函數(shù)，一個是選擇需要切換任務的 pick_next_task，另外一個是完成進程上下文切換 context_switch。
關于選擇task的策略涉及到不同的調度類，等我們講到具體調度器的時候再展開，這里重點講下上下文切換的函數(shù) context_switch，進程上下文切換主要涉及到兩部分主要過程：進程地址空間切換和處理器狀態(tài)切換：

進程的地址空間切換

將下一個進程的pgd虛擬地址轉化為物理地址存放在ttbr0_el1中(這是用戶空間的頁表基址寄存器)，當訪問用戶空間地址的時候mmu會通過這個寄存器來做遍歷頁表獲得物理地址。完成了這一步，也就完成了進程的地址空間切換，確切的說是進程的虛擬地址空間切換。

寄存器狀態(tài)切換

其中x19-x28是arm64 架構規(guī)定需要調用保存的寄存器，可以看到處理器狀態(tài)切換的時候將前一個進程（prev）的x19-x28，fp,sp,pc保存到了進程描述符的cpu_contex中，然后將即將執(zhí)行的進程(next)描述符的cpu_contex的x19-x28，fp,sp,pc恢復到相應寄存器中，而且將next進程的進程描述符task_struct地址存放在sp_el0中，用于通過current找到當前進程，這樣就完成了處理器的狀態(tài)切換。

本站聲明：本文章由作者或相關機構授權發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者，如若文章內容侵犯您的權益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或將催生出更大的獨角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字：汽車人工智能智能驅動 BSP

[美通社全球TMT]

從容應對未知風險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務中斷的風險，如企業(yè)系統(tǒng)復雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性，提升韌性，成...

關鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復蘇！騰訊、網易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行，華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字：華為 12nm EDA 半導體

[通信先鋒]

華為張平安：數(shù)字世界話語權最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產業(yè)博覽會上，華為常務董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務公布2024年中期業(yè)績

要點：有效應對環(huán)境變化，經營業(yè)績穩(wěn)中有升落實提質增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務引領增長以科技創(chuàng)新為引領，提升企業(yè)核心競爭力堅持高質量發(fā)展策略，塑強核心競爭優(yōu)勢...

關鍵字：通信 BSP 電信運營商數(shù)字經濟

[美通社全球TMT]

NVI技術創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]