隨著人工智能技術(shù)在各領(lǐng)域的廣泛應(yīng)用,將大型語言模型(LLM)部署到嵌入式端側(cè)設(shè)備成為重要趨勢。Llama 2 - 7B作為一款性能優(yōu)異的大語言模型,具有廣泛的應(yīng)用前景。然而,其龐大的參數(shù)量對嵌入式設(shè)備的計(jì)算資源和存儲能力提出了巨大挑戰(zhàn)。瑞薩RZ/V2L處理器集成了強(qiáng)大的NPU(神經(jīng)網(wǎng)絡(luò)處理單元),結(jié)合INT4量化技術(shù),為在嵌入式端側(cè)部署Llama 2 - 7B提供了可行方案。