KVM原理簡介
時間:2021-10-18 16:36:05
手機看文章
掃描二維碼
隨時隨地手機看文章
[導讀]一、?概述KVM的全稱是Kernel-basedVirtualMachine,其是一種基于linux內核的采用硬件輔助虛擬化技術的全虛擬化解決方案。它最初由以色列的初創(chuàng)公司Qumranet開發(fā),并在linux-2.6.20中開始被納入在linux內核,成為內核源碼的一部分。KVM...
上面提到KVM是作為一個內核模塊出現的,所以它還得借助用戶空間的程序來和用戶進行交互,這就不得不提到大名鼎鼎的QEMU了。QEMU是一套由法布里斯·貝拉(Fabrice Bellard)所編寫的以GPL許可證分發(fā)源碼的模擬處理器,在GNU/Linux平臺上使用廣泛。其本身是一個純軟件的支持CPU虛擬化、內存虛擬化及I/O虛擬化等功能的用戶空間程序。其借助KVM提供的虛擬化支持可以將CPU、內存等虛擬化工作交由KVM處理,自己則處理大多數I/O虛擬化的功能,可以實現極高的虛擬化效率。KVM及QEMU配合使用的整體接口如圖1所示。
有時Hypervisor需要模擬一些操作,例如VM里運行的軟件試圖配置處理器的一些屬性,如電源管理或是緩存一致性時。通常你不會允許VM直接配置這些屬性,因為這會打破隔離性,從而影響其他VMs。這就需要通過以陷入的方式產生異常,在異常處理程序中做相應的模擬。armv8包含一些陷入控制來幫助實現陷入(trapping) – 模擬(emulating)。如果對相應操作配置了陷入,則這種操作發(fā)生時會陷入到更高的異常級別。
例如,正常我們在執(zhí)行WFI指令時會使CPU進入一個低功耗的狀態(tài),但是對于HOST OS來說,如果讓CPU真正進入低功耗狀態(tài),顯然會影響其他VM的運行。如果我們配置了HCR_EL2.TWI==1時,那么Guest OS在執(zhí)行WFI時就會觸發(fā)EL2的異常,然后陷入Hypervisor,那么此時Hypervisor就可以將對應VCPU所處的線程調出出去,將CPU讓給其他的VCPU線程使用。
arm主要通過Stage 2轉換來提供對內存虛擬化的支持,其允許Hypervisor控制虛擬機的內存視圖,而在這之前則是使用及其復雜的影子頁表技術來實現。Stage 2轉換可以控制虛擬機是否可以訪問特定的某一塊物理內存,以及該內存塊出現在虛擬機內存空間的位置。這種能力對于虛擬機的隔離和沙箱功能來說至關重要。這使得虛擬機只能看到分配給它自己的物理內存。為了支持Stage 2 轉換, 需要增加一個頁表,我們稱之為Stage 2頁表。操作系統控制的頁表轉換稱之為stage 1轉換,負責將虛擬機視角的虛擬地址轉換為虛擬機視角的物理地址。而stage 2頁表由Hypervisor控制,負責將虛擬機視角的物理地址轉換為真實的物理地址。虛擬機視角的物理地址在Armv8中有特定的詞描述,叫中間物理地址(intermediate Physical Address, IPA)。
stage 2轉換表的格式和stage 1的類似,但也有些屬性的處理不太一樣,例如,判斷內存類型 是normal 還是 device的信息被直接編碼進了表里,而不是通過查詢MAIR_ELx寄存器。