筆者接觸嵌入式領(lǐng)域軟件開(kāi)發(fā)已近五年,幾乎用的都是 ARM Cortex M 內(nèi)核系列的微控制器。在這五年期間,感謝C語(yǔ)言編譯器的存在,讓我不用接觸匯編即可進(jìn)行開(kāi)發(fā),但是彷佛也錯(cuò)過(guò)了一些風(fēng)景,沒(méi)有領(lǐng)域到編譯器之美和CPU之美,所以決定周末無(wú)聊的休息時(shí)間通過(guò)尋找資料、動(dòng)手實(shí)驗(yàn)、得出結(jié)論的方法來(lái)探索 ARM CPU 架構(gòu)的美妙,以及C語(yǔ)言編譯器的奧秘。(因?yàn)槲覀€(gè)人實(shí)在是不贊同學(xué)校中微機(jī)原理類(lèi)課程的教學(xué)方法)。
DSP for Cortex-M 為 ARM Cortex-M 處理器提供了高性能的「信號(hào)處理能力」,用于聲音、音頻、傳感器中樞、機(jī)器學(xué)習(xí)等場(chǎng)景, 不需要額外的 DSP 設(shè)備即可完成信號(hào)處理的工作。帶有 DSP 擴(kuò)展的處理器包括Cortex-M4、Cortex-M7、Cortex-M33、Cortex-M35P、Cortex-M55處理器。DSP擴(kuò)展指令在 Thumb 指令集和可選的浮點(diǎn)運(yùn)算單元的基礎(chǔ)上添加,使得在為Cortex-M處理器添加數(shù)字信號(hào)處理的同時(shí),保持了原有Cortex-M編程模型的易用性。
SIMD指令
這些帶有DSP擴(kuò)展的 Cortex-M 處理器,還提供了 「SIMD 指令」來(lái)操作8位或者16位的整數(shù)。SIMD表示單指令多數(shù)據(jù),在所有寄存器仍是32位的基礎(chǔ)上,「SIMD指令可以同時(shí)操作2個(gè)16 bit 的值或者4個(gè)8 bit 的值」。工作于8位或16位數(shù)據(jù)的指令對(duì)于處理諸如視頻數(shù)據(jù)或者音頻數(shù)據(jù)的時(shí)候非常有用,因?yàn)檫@些數(shù)據(jù)不需要32位的寬度,SIMD指令提供了并行處理這些數(shù)據(jù)的能力。
ARM Helium 技術(shù)是ARM Cortex-M處理器系列的 M配置向量擴(kuò)展,簡(jiǎn)稱(chēng)MVE,該技術(shù)是Armv8.1-M架構(gòu)的擴(kuò)展,為小型嵌入式設(shè)備的機(jī)器學(xué)習(xí)應(yīng)用提供給了顯著的性能提升。Cortex-M55是首款具有該擴(kuò)展的處理器。Helium技術(shù)添加了150多個(gè)新的標(biāo)量和向量指令,其中整數(shù)Helium技術(shù)使8位、16位、32位固定點(diǎn)數(shù)據(jù)的高效計(jì)算成為可能,16位和32位固定點(diǎn)格式在傳統(tǒng)的信號(hào)處理中廣泛應(yīng)用,比如音頻處理,而8位固定點(diǎn)格式在機(jī)器學(xué)習(xí)處理中很重要,比如神經(jīng)網(wǎng)絡(luò)計(jì)算,圖像處理等。同樣,Helium也支持浮點(diǎn)數(shù)據(jù)類(lèi)型,包括單精度浮點(diǎn)數(shù)(32位)和半精度浮點(diǎn)數(shù)(16位)。