物聯(lián)網(wǎng)設備與邊緣AI芯片對毫瓦級功耗的極致追求,低功耗存儲器設計已成為突破能量效率瓶頸的核心戰(zhàn)場。從動態(tài)電壓頻率調(diào)節(jié)(DVFS)到近閾值計算(NTC),存儲器技術正通過多維度創(chuàng)新,將每比特能耗壓縮至皮焦耳級。以三星eMRAM為例,其通過NTC技術將待機功耗降低至傳統(tǒng)SRAM的1/1000,同時保持10年數(shù)據(jù)保持能力,印證了低功耗存儲器在延長設備續(xù)航中的革命性價值。
動態(tài)電壓頻率調(diào)節(jié):從存儲單元到陣列級優(yōu)化
DVFS在存儲器設計中的應用需突破傳統(tǒng)CPU場景的局限。在傳統(tǒng)架構中,存儲器電壓調(diào)節(jié)易引發(fā)讀寫錯誤與時序違規(guī)。為解決這一問題,美光LPDDR5X引入陣列級DVFS,將存儲體(Bank)劃分為獨立電壓域,通過片上電壓調(diào)節(jié)器實現(xiàn)0.5V至1.1V的動態(tài)調(diào)節(jié)。當檢測到連續(xù)讀取操作時,電壓可在10μs內(nèi)從1.1V降至0.8V,使待機功耗降低40%;而在突發(fā)寫入時,電壓可瞬間提升至1.1V以確保數(shù)據(jù)完整性。該技術使智能手機在視頻播放場景下的存儲器功耗降低35%,續(xù)航時間延長1.2小時。
時序補償機制是DVFS落地的關鍵。SK海力士HBM3E采用動態(tài)時序校準電路,當電壓降低時,通過調(diào)整預充電時間與靈敏放大器(SA)的觸發(fā)閾值,補償信號延遲變化。實驗數(shù)據(jù)顯示,在0.8V工作電壓下,HBM3E的讀寫時序仍能滿足JEDEC標準,且誤碼率低于10^-15。此外,溫度感知電壓調(diào)節(jié)(TVFS)進一步優(yōu)化能效,當芯片溫度超過60℃時,電壓自動提升50mV以補償漏電流增加,使存儲器在-40℃至125℃環(huán)境下保持穩(wěn)定性能。
近閾值計算:從電路設計到架構創(chuàng)新
近閾值計算(NTC)通過將工作電壓降至晶體管閾值電壓附近,實現(xiàn)能效的指數(shù)級提升。在65nm CMOS工藝下,傳統(tǒng)存儲器工作電壓為1.2V時,每比特能耗為10pJ;而采用NTC技術的eFlash存儲器在0.4V電壓下,能耗可降至0.3pJ。然而,NTC面臨兩大挑戰(zhàn):一是工藝偏差導致的電壓-延遲不確定性,二是亞閾值漏電流引發(fā)的數(shù)據(jù)保持失效。
為應對工藝偏差,臺積電22ULL工藝引入自適應體偏置技術,通過動態(tài)調(diào)節(jié)NMOS與PMOS的背柵電壓,補償閾值電壓波動。在0.4V工作電壓下,該技術使存儲器良率從65%提升至92%,同時將讀寫延遲控制在50ns以內(nèi)。針對數(shù)據(jù)保持問題,IMEC研發(fā)的鐵電場效應晶體管(FeFET)存儲器采用HfO2基鐵電材料,在0.3V電壓下實現(xiàn)10年數(shù)據(jù)保持能力,較傳統(tǒng)浮柵型Flash提升3個數(shù)量級。
架構層面的創(chuàng)新同樣重要。ARM Corstone-300參考設計將NTC存儲器與低功耗處理器集成,通過電壓域隔離實現(xiàn)動態(tài)掉電。當處理器進入休眠狀態(tài)時,存儲器電壓降至0.3V以節(jié)省功耗;而當喚醒信號到達時,電壓可在100ns內(nèi)恢復至0.8V,確保指令執(zhí)行的連續(xù)性。該架構使可穿戴設備的待機功耗降低至5μW,續(xù)航時間延長至30天。
存儲器類型適配:從易失性到非易失性
不同類型存儲器在低功耗設計中的策略存在顯著差異。對于SRAM,NTC技術面臨讀寫裕度不足的挑戰(zhàn)。英特爾10nm FinFET SRAM通過雙閾值晶體管設計,將讀寫路徑的閾值電壓降低至0.2V,而保持路徑的閾值電壓維持在0.4V,從而在0.5V電壓下實現(xiàn)99.99%的讀寫成功率。對于DRAM,三星LPDDR6采用堆疊式電容與NTC技術,將工作電壓從1.1V降至0.7V,使每比特能耗降低至2pJ,同時通過片上ECC糾錯確保數(shù)據(jù)可靠性。
非易失性存儲器在低功耗領域更具優(yōu)勢。華邦電子SPI NOR Flash采用NTC與電荷泵技術,在0.9V電壓下實現(xiàn)100MHz讀取速度,較傳統(tǒng)方案功耗降低60%。而新興的阻變存儲器(RRAM)與相變存儲器(PCM)則通過材料創(chuàng)新突破電壓限制。例如,Crossbar的RRAM在0.3V電壓下實現(xiàn)10^12次擦寫循環(huán),且寫入能耗僅為0.1pJ/bit,為AIoT設備提供理想的低功耗存儲方案。
跨層級協(xié)同:從電路到系統(tǒng)的能效優(yōu)化
低功耗存儲器設計需實現(xiàn)電路、架構與系統(tǒng)的跨層級協(xié)同。在電路層面,IMEC提出的混合信號糾錯電路將模擬信號處理與數(shù)字邏輯結合,在0.4V電壓下實現(xiàn)10^-15的誤碼率,而面積開銷僅為傳統(tǒng)方案的30%。在架構層面,RISC-V低功耗擴展指令集(Zce)通過壓縮指令編碼與存儲器訪問優(yōu)化,使處理器在訪問NTC存儲器時的能耗降低25%。
系統(tǒng)層面的創(chuàng)新同樣關鍵。蘋果M2芯片采用統(tǒng)一內(nèi)存架構(UMA),將CPU、GPU與NPU的存儲器訪問整合至HBM3E堆棧,通過動態(tài)電壓調(diào)節(jié)與數(shù)據(jù)局部性優(yōu)化,使AI推理任務的存儲器能耗降低40%。而在數(shù)據(jù)中心場景,微軟Project Olympus服務器部署的NTC存儲器集群,通過電壓-頻率-溫度的協(xié)同控制,使萬億參數(shù)模型訓練的能效比提升至15GFLOPS/W。
未來技術演進:從量子存儲到神經(jīng)形態(tài)存儲
面向后摩爾時代,量子存儲與神經(jīng)形態(tài)存儲為低功耗設計開辟新路徑。IBM研發(fā)的量子位存儲器(Qubit Memory)通過超導電路實現(xiàn)皮秒級讀寫,且在10mK溫度下保持量子態(tài)100μs,較傳統(tǒng)方案提升100倍。而英特爾Loihi 3神經(jīng)擬態(tài)芯片則采用憶阻器(Memristor)陣列,在0.2V電壓下實現(xiàn)突觸權重的動態(tài)更新,使類腦計算的能效比達到100TOPS/W。
生物啟發(fā)的存儲器架構同樣值得關注。MIT團隊研發(fā)的DNA存儲芯片通過電化學調(diào)控實現(xiàn)數(shù)據(jù)寫入,在0.1V電壓下實現(xiàn)10^6次循環(huán)壽命,且密度達到1EB/cm2,為超低功耗大數(shù)據(jù)存儲提供解決方案。這些前沿技術預示著,未來存儲器將在能耗與性能的博弈中實現(xiàn)質的飛躍。
低功耗存儲器設計正從DVFS的精準調(diào)控邁向NTC的能效革命。從電路級時序補償?shù)郊軜嫾墑討B(tài)掉電,從易失性存儲器的NTC適配到非易失性存儲器的材料創(chuàng)新,這場技術演進不僅將延長設備的續(xù)航時間,更將重新定義智能計算的能量邊界。隨著3D封裝與Chiplet架構的普及,未來存儲器將實現(xiàn)電壓調(diào)節(jié)的皮秒級響應與能耗的亞皮焦耳級控制,在萬物互聯(lián)時代構建起真正的綠色計算基礎設施。這場由低功耗存儲器驅動的能效革命,正在為人類社會的可持續(xù)發(fā)展注入新的動力。