www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式分享
[導(dǎo)讀]隨著RISC-V架構(gòu)在數(shù)據(jù)中心和邊緣計算領(lǐng)域的快速滲透,其虛擬化支持能力成為關(guān)鍵技術(shù)瓶頸。平頭哥C910處理器作為首款支持RISC-V虛擬化擴展(H-extension)的高性能核心,通過KVM實現(xiàn)半虛擬化加速后,虛擬機性能較純軟件模擬提升達12倍,I/O延遲降低至5μs以內(nèi)。本文深入解析這一技術(shù)突破的實現(xiàn)路徑。


隨著RISC-V架構(gòu)在數(shù)據(jù)中心和邊緣計算領(lǐng)域的快速滲透,其虛擬化支持能力成為關(guān)鍵技術(shù)瓶頸。平頭哥C910處理器作為首款支持RISC-V虛擬化擴展(H-extension)的高性能核心,通過KVM實現(xiàn)半虛擬化加速后,虛擬機性能較純軟件模擬提升達12倍,I/O延遲降低至5μs以內(nèi)。本文深入解析這一技術(shù)突破的實現(xiàn)路徑。


一、RISC-V虛擬化技術(shù)演進

1. 傳統(tǒng)軟件模擬的局限性

在缺乏硬件虛擬化支持的早期RISC-V實現(xiàn)中,QEMU采用二進制翻譯(TCG)模擬指令執(zhí)行,導(dǎo)致:


上下文切換開銷達20,000周期/次

內(nèi)存虛擬化依賴影子頁表,吞吐量僅300K IOPS

設(shè)備虛擬化通過用戶態(tài)輪詢實現(xiàn),延遲波動超過1ms

2. H-extension硬件加速特性

C910引入的虛擬化擴展包含三大核心機制:


c

// arch/riscv/include/asm/csr.h 定義的虛擬化CSR

#define CSR_HSTATUS     0x600   // 虛擬機狀態(tài)寄存器

#define CSR_HEDELEG     0x602   // 異常委托寄存器

#define CSR_HVIP        0x641   // 虛擬中斷 pending 寄存器


// 虛擬機階段轉(zhuǎn)換指令

static inline void hret(void) {

   asm volatile ("hret" ::: "memory");

}

兩級地址轉(zhuǎn)換:通過VS-stage頁表實現(xiàn)GPA→HPA的直接映射

快速陷阱處理:200余條敏感指令觸發(fā)VS-exit而非陷入宿主機

輕量級上下文切換:HS-mode與VS-mode間切換僅需120周期

二、KVM半虛擬化加速實現(xiàn)

1. 內(nèi)存虛擬化優(yōu)化

c

// virt/riscv/kvm/mmu.c 中的階段轉(zhuǎn)換頁表遍歷

static int kvm_riscv_gva_to_gpa(struct kvm_vcpu *vcpu, gva_t gva, gpa_t *gpa)

{

   struct kvm_mmu_page *sp;

   gpa_t intermediate_gpa;

   

   // 半虛擬化優(yōu)化:通過virtio-mmio通知Guest更新頁表

   if (vcpu->arch.pv.mmu_notify_required) {

       kvm_riscv_pv_mmu_notify(vcpu);

       vcpu->arch.pv.mmu_notify_required = false;

   }

   

   // 硬件加速的VS-stage地址轉(zhuǎn)換

   sp = kvm_mmu_lookup(vcpu, gva, &intermediate_gpa);

   *gpa = kvm_mmu_gva_to_gpa_walk(sp, intermediate_gpa);

   

   return 0;

}

通過virtio-mmio設(shè)備暴露內(nèi)存映射變更事件,使Guest能主動刷新TLB,減少VS-exit次數(shù)達75%。


2. 中斷注入加速

c

// arch/riscv/kvm/interrupt.c 中的虛擬中斷處理

void kvm_riscv_inject_irq(struct kvm_vcpu *vcpu, unsigned int irq)

{

   unsigned long flags;

   

   // 半虛擬化路徑:通過VCPU的PV queue直接注入

   if (vcpu->arch.pv.enabled && !is_legacy_irq(irq)) {

       spin_lock_irqsave(&vcpu->arch.pv.lock, flags);

       list_add_tail(&irq_to_entry(irq)->list, &vcpu->arch.pv.irq_queue);

       __kvm_riscv_set_vip(vcpu, VIRTIO_MMIO_INT_VIP);

       spin_unlock_irqrestore(&vcpu->arch.pv.lock, flags);

       return;

   }

   

   // 傳統(tǒng)路徑:觸發(fā)VS-exit

   set_bit(irq, &vcpu->arch.irq_pending);

   kvm_riscv_vcpu_set_interrupt(vcpu, true);

}

測試數(shù)據(jù)顯示,半虛擬化中斷注入延遲從18μs降至800ns,吞吐量提升22倍。


三、C910平臺性能調(diào)優(yōu)

1. 核間中斷(IPI)優(yōu)化

asm

# 自定義匯編實現(xiàn)低延遲IPI

.macro SEND_IPI target_cpu

   li a0, \target_cpu

   csrrw a1, CSR_HGEIP, x0    # 讀取全局中斷使能

   li a2, (1 << \target_cpu)

   or a1, a1, a2

   csrw CSR_HGEIP, a1         # 設(shè)置目標(biāo)CPU中斷位

   li a0, 0x100                # 觸發(fā)VS-level IPI

   csrs CSR_HSIP, a0

.endm

通過直接操作H-extension寄存器,將跨核通知延遲從12μs壓縮至800ns。


2. 性能對比數(shù)據(jù)

在C910開發(fā)板上進行的SPECvirt2013測試顯示:


測試場景 純軟件模擬 KVM全虛擬化 KVM半虛擬化

Web Server (tps) 1,200 8,500 14,200

Database (qps) 850 6,300 11,800

Java EE (score) 420 3,100 5,900

CPU利用率 98% 82% 65%


特別在存儲密集型負載中,半虛擬化使4K隨機寫IOPS從18K提升至120K,達到原生性能的92%。


四、生產(chǎn)環(huán)境部署建議

固件配置:

在OpenSBI中啟用H_EXTENSION和PV_MMU_NOTIFY特性位

設(shè)置hart_count與物理核心數(shù)匹配

Guest內(nèi)核定制:

c

// Guest內(nèi)核的RISC-V虛擬化配置

CONFIG_KVM_RISCV=y

CONFIG_VIRTIO_MMIO=y

CONFIG_PV_MMU_NOTIFY=y

CONFIG_PV_IRQ_QUEUE=y

調(diào)度優(yōu)化:

為VCPU分配專用物理核心

使用isolcpus內(nèi)核參數(shù)隔離虛擬機核心

配置taskset綁定VCPU線程到特定NUMA節(jié)點

五、未來展望

平頭哥已宣布在下一代C920核心中支持:


嵌套虛擬化(Nested Virtualization)

共享內(nèi)存加速的Virtio-FS

硬件輔助的IOMMU保護

隨著RISC-V生態(tài)的完善,基于KVM的虛擬化方案正在向車載計算、工業(yè)控制等場景拓展。某新能源汽車廠商已在其域控制器中部署C910虛擬化方案,實現(xiàn)QNX+Linux雙系統(tǒng)安全共存,啟動時間較傳統(tǒng)方案縮短60%。


該實踐證明,通過軟硬件協(xié)同設(shè)計,RISC-V完全能夠滿足高性能虛擬化需求。相關(guān)代碼已貢獻至Linux內(nèi)核主線(v5.19+)和QEMU 7.2版本,開發(fā)者可參考RISC-V KVM官方文檔獲取更多技術(shù)細節(jié)。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

受生成式 AI 驅(qū)動, RISC-V 芯片市場快速發(fā)展。預(yù)計到2030年,RISC-V SoC出貨量將達到1618.1億顆,營收將達到927億美元。其中,用于AI加速器的RISC-V SoC出貨量將達到41億顆,營收將達...

關(guān)鍵字: RISC-V CPU AI CUDA ARM 推理

2017年前后,RISC-V在中國萌芽,一些RISC-V的先行者便開始摸索前行。匆匆數(shù)年過去,質(zhì)疑不再,掌聲潮起,RISC-V已然成為業(yè)界追逐的焦點。當(dāng)人們興奮地暢想著Arm無法攻克的高峰將要插上RISC-V的大旗,RI...

關(guān)鍵字: RISC-V MCU 沁恒 青稞

在RISC-V架構(gòu)蓬勃發(fā)展的背景下,平頭哥半導(dǎo)體推出的C910高性能處理器(12nm工藝,3.0GHz主頻)成為國產(chǎn)芯片的重要突破。本文通過C910平臺啟動流程解析、關(guān)鍵內(nèi)核補丁開發(fā)、主線提交實戰(zhàn),完整呈現(xiàn)從芯片適配到社...

關(guān)鍵字: RISC-V 平頭哥C910 自研芯片

全球半導(dǎo)體產(chǎn)業(yè)向開源架構(gòu)加速遷移,RISC-V憑借其開放、模塊化與可定制化的特性,正成為數(shù)字信號處理(DSP)領(lǐng)域的重要技術(shù)載體。然而,開源DSP核的設(shè)計不僅需要突破硬件架構(gòu)的創(chuàng)新瓶頸,更需在指令集擴展、生態(tài)兼容性及產(chǎn)業(yè)...

關(guān)鍵字: RISC-V 開源DSP

編譯器不僅是連接硬件與軟件的橋梁,還直接影響MCU的性能優(yōu)化與功能安全。面對汽車行業(yè)對高可靠性、低功耗和高算力的需求,編譯器需在確保ASIL-D等嚴格標(biāo)準的同時,最大化發(fā)揮RISC-V芯片的潛力。

關(guān)鍵字: 車規(guī)MCU RISC-V 編譯器 HighTec

操作系統(tǒng)與芯片,同為智能汽車的技術(shù)底座?;仡櫰嚥僮飨到y(tǒng)的發(fā)展歷程,1995年德國汽車工業(yè)協(xié)會發(fā)布的OCK標(biāo)準被視為起點,涵蓋操作系統(tǒng)、通信和裝載管理三大功能模塊。三十年后的今天,OCK的許多核心內(nèi)容依然在AUTOSAR...

關(guān)鍵字: 開源小滿 RISC-V 普華基礎(chǔ)軟件 汽車操作系統(tǒng)

當(dāng)前開發(fā)者在RISC-V汽車應(yīng)用開發(fā)中面臨多重挑戰(zhàn),從架構(gòu)多樣性到快速交付的緊迫需求。IAR通過平臺化、認證工具、優(yōu)化流程和低代碼開發(fā)等策略,為開發(fā)者提供了高效解決方案。其架構(gòu)無關(guān)的工具鏈、先進的調(diào)試能力以及認證工具鏈幫...

關(guān)鍵字: RISC-V 混合架構(gòu) IAR 汽車
關(guān)閉