一文通解基于VLT技術(shù)的新型DRAM內(nèi)存單元

時(shí)間：2017-04-24 23:16:49

關(guān)鍵字： DRAM vlt技術(shù) 內(nèi)存單元存儲技術(shù)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]OFweek電子工程網(wǎng)訊垂直分層閘流體(Vertical Layered Thyristor;VLT)，是Kilopass研發(fā)出的新型內(nèi)存單元，能夠顯著降低動態(tài)隨機(jī)存取內(nèi)存(DRAM)的成本和復(fù)雜性。這是一種靜

OFweek電子工程網(wǎng)訊垂直分層閘流體(Vertical Layered Thyristor;VLT)，是Kilopass研發(fā)出的新型內(nèi)存單元，能夠顯著降低動態(tài)隨機(jī)存取內(nèi)存(DRAM)的成本和復(fù)雜性。這是一種靜態(tài)的內(nèi)存單元，無需刷新操作;兼容于現(xiàn)有晶圓廠的制造設(shè)備，也無需任何新的材料或工藝。

相較于一般的DRAM，VLT內(nèi)存數(shù)組能節(jié)約高達(dá)45%的成本;這是因?yàn)樗哂懈〉腣LT內(nèi)存單元，以及驅(qū)動更長行與列的能力，使其得以大幅提升內(nèi)存數(shù)組效率。然而，想要發(fā)揮VLT的優(yōu)勢，就必須在依據(jù)產(chǎn)業(yè)標(biāo)準(zhǔn)發(fā)展的成熟DRAM市場展開設(shè)計(jì)與制造，才能確保兼容于不同供應(yīng)商的內(nèi)存產(chǎn)品。

目前，基于VLT技術(shù)的內(nèi)存已經(jīng)具備與現(xiàn)有“第四代低功耗雙倍數(shù)據(jù)速率”(LPDDR4)規(guī)格完全兼容的能力。VLT內(nèi)存組(bank)可以模擬傳統(tǒng)DRAM的bank，并兼容于其頻率;在設(shè)計(jì)VLT電路時(shí)，設(shè)計(jì)者可以選擇連接標(biāo)準(zhǔn)DDR控制器，或是成本較低的簡化版控制器。如果使用標(biāo)準(zhǔn)控制器，由于不需要刷新，VLT內(nèi)存將會忽略刷新序列。系統(tǒng)的其他部份則會將VLT DRAM視為通用DRAM，因而無需任何改變。

傳統(tǒng)DRAM內(nèi)存單元

為了顯示如何使用VLT內(nèi)存單元構(gòu)造LPDDR4內(nèi)存，首先回顧一下傳統(tǒng)DRAM以及LPDDR4的工作方式。熟悉DRAM者或許對其有所了解，但實(shí)際運(yùn)用上還是有些微差異，在此先定義一些準(zhǔn)則與術(shù)語以便于理解。

DRAM作業(yè)的許多方面取決于其電容儲存單元。首先，電容的漏電特性導(dǎo)致了刷新的必要性;其次，儲存單元的基本作業(yè)方式之一是讀取，它會影響如何組織內(nèi)存的其他方面。

圖1顯示電容儲存單元的原理圖，左右圖分別代表了讀取1和讀取0時(shí)。電路透過“電荷分配”(charge sharing)偵測內(nèi)存位值。位線(bitline)首先被預(yù)充電到一個(gè)在0和1之間的電壓值，然后透過打開讀數(shù)晶體管來選擇一個(gè)內(nèi)存單元，使電荷可以在位線與內(nèi)存單元間流動。如果位線電壓高于內(nèi)存單元，那么負(fù)電荷就會從內(nèi)存單元流出到位在線;而如果位線的電壓低于內(nèi)存，那么負(fù)電荷就會從位線流進(jìn)內(nèi)存單元。

圖1：傳統(tǒng)電容式DRAM內(nèi)存單元的電荷分配原理 (圖中綠色箭頭所示為電流，與負(fù)電荷流動的方向相反)

這種電荷轉(zhuǎn)移改變了位在線的電壓，透過感測與鎖存得到最終讀取數(shù)值。然而，在儲存電容中失去或取得的電荷，改變了節(jié)點(diǎn)上原有的電荷，這意味著讀取的過程是破壞性的。因此，在每一次讀取之后，都必須透過回寫操作恢復(fù)內(nèi)存單元中的電荷。

LPDDR4

LPDDR4標(biāo)準(zhǔn)是第四代雙倍數(shù)據(jù)速率(DDR) DRAM的低功耗版本標(biāo)準(zhǔn)，透過整體架構(gòu)定義了個(gè)別內(nèi)存芯片的高層級結(jié)構(gòu)，以及如何安排雙列直插式內(nèi)存模塊(DIMM)。

分析DRAM的方式一般有兩種：理論上，剖析其實(shí)體細(xì)節(jié);實(shí)際上，則著眼于其芯片數(shù)組特性。本文首先探討第一種邏輯觀點(diǎn)，因?yàn)樗械膶?shí)體布局都必須分解為相同的邏輯結(jié)構(gòu)，因而能夠從中了解傳統(tǒng)DRAM和LVT途徑如何實(shí)現(xiàn)邏輯功能。

LPDDR4內(nèi)存芯片擁有8Gb的儲存容量，通常由兩個(gè)4Gb的獨(dú)立通道共同組成。每信道擁有8個(gè)內(nèi)存組，每一內(nèi)存組包括32K儲存頁(page)，每頁有16K位，而使內(nèi)存組的總?cè)萘窟_(dá)到512Mb。

圖2：典型的DRAM架構(gòu)和層級

一個(gè)完整的LPDDR4內(nèi)存芯片包括兩個(gè)高層級單元：內(nèi)存數(shù)組和DDR接口。有些部份的操作會影響到內(nèi)存數(shù)組;另一部份則會影響接口。DDR接口可以同時(shí)與內(nèi)存數(shù)組以及外部系統(tǒng)進(jìn)行通訊。

圖3：LPDDR4的邏輯組織架構(gòu)，圖中將儲存數(shù)組和DDR接口分開。(箭頭代表一次讀取操作以及回寫)

圖3說明了這種關(guān)系，即DDR緩存器作為外部系統(tǒng)和內(nèi)存數(shù)組之間的主接口。而在讀取數(shù)據(jù)時(shí)，數(shù)組數(shù)據(jù)會先被加載DDR緩存器中;進(jìn)行寫入作業(yè)時(shí)，所需的數(shù)據(jù)會先從外部寫入緩存器中。

由于讀取傳統(tǒng)DRAM數(shù)組內(nèi)容可能破壞原有數(shù)據(jù)，每一次讀取后都必須進(jìn)行回寫作業(yè)，以恢復(fù)原有值。在進(jìn)行讀取后，DDR緩存器的內(nèi)容被復(fù)制到“隱藏緩存器”(Shadow Register)中。當(dāng)外部系統(tǒng)讀取DDR緩存器中的數(shù)據(jù)時(shí)，隱藏緩存器負(fù)責(zé)將數(shù)據(jù)回寫到所選頁，以恢復(fù)原有數(shù)值。同樣地，當(dāng)寫入數(shù)據(jù)時(shí)，DDR緩存器的數(shù)據(jù)會被傳輸?shù)诫[藏緩存器中等待寫入;而在執(zhí)行寫入作業(yè)時(shí)，DDR緩存器就可以加載新的數(shù)據(jù)。

讀取內(nèi)存分頁數(shù)據(jù)涉及一連串的活動，類似于兩個(gè)巢式的軟件DO回路(Do loop)。每一分頁內(nèi)存被分成由許多256字節(jié)成、成批(burst)讀取的內(nèi)存群組，因此，一組16K位分頁就有64個(gè)burst內(nèi)存群組，依序讀取完整的內(nèi)存頁，這類似于外部DO回路。

圖4：內(nèi)存分頁由分批依序讀取的內(nèi)存群組構(gòu)成;每一批burst群組均依據(jù)16個(gè)連續(xù)的16位傳送到I/O。

每個(gè)突發(fā)傳輸組被加載256位的DDR緩存器中，該緩存器被分為16個(gè)16位字，并依序讀取其內(nèi)容，為每一個(gè)頻率邊緣提供每一個(gè)16位字。這種操作方式則如同內(nèi)部DO回路。

每一行的地址(RAS)負(fù)責(zé)選擇分頁。同時(shí)，每一列的地址(CAS)選擇突發(fā)傳輸組，并設(shè)置從DDR緩存器中開始讀取的字符，因而不必從DDR緩存器的左側(cè)開始讀取。

值得注意的是，在隱藏緩存器執(zhí)行回寫、讀取或?qū)懭隓DR緩存器中原先加載數(shù)據(jù)的同時(shí)，DDR緩存器已經(jīng)開始從儲存數(shù)組中讀取數(shù)據(jù)或從外部加載所寫數(shù)據(jù)了。[!--empirenews.page--]

LPDDR的運(yùn)作

LPDDR4功能本質(zhì)上包含四項(xiàng)基本操作：啟動、讀取、寫入和預(yù)充電。這些操作的其他變異形式，如突發(fā)讀取/寫入和自動預(yù)充電等，可能構(gòu)成一個(gè)更長的指令列表，但并不至于帶來新的技術(shù)挑戰(zhàn)。此外，它還添加了刷新、訓(xùn)練和模式緩存器作業(yè)等維護(hù)性指令，以因應(yīng)復(fù)雜的操作命令。

這些基本的操作簡要介紹如下：啟動：在內(nèi)存數(shù)組中選擇特定字符線(wordline)，即可“開啟”一個(gè)分頁。該分頁上的內(nèi)容將會被感測到并進(jìn)行鎖存，然后保持開啟以用于在讀取作業(yè)時(shí)進(jìn)行回寫，或在“讀取-修改-寫入”作業(yè)時(shí)被再次寫入。讀取：開啟讀取數(shù)據(jù)序列，每個(gè)burst內(nèi)存群組的數(shù)據(jù)會從感測放大鎖存中被加載到DDR緩存器中。緊接著DDR緩存器開始依序讀取，每次讀取一個(gè)16bit字。同時(shí)，芯片透過隱藏緩存器在仍保持開啟狀態(tài)的分頁上進(jìn)行回寫。寫入：數(shù)據(jù)被加載DDR緩存器，每次一個(gè)16位字。數(shù)據(jù)隨后被轉(zhuǎn)移到隱藏緩存器中，待分頁開啟時(shí)寫入數(shù)據(jù)。當(dāng)進(jìn)行寫入時(shí)，DDR緩存器可依需要同時(shí)加載新的256位數(shù)據(jù)，等待下一次寫入。預(yù)充電：在最后一個(gè)burst內(nèi)存群組被讀取或?qū)懭牒?，?nèi)存數(shù)組必須為下一次操作做好準(zhǔn)備。在寫入情況下，必須等待一個(gè)寫入恢復(fù)延遲，以確保最后的burst群組可在繼續(xù)其他操作前被成功寫入。這時(shí)，開啟的分頁已被關(guān)閉，使位線能夠自由浮動，并重新充電回到先前提到的VDD/2電位。

值得注意的是，只有啟動操作才涉及內(nèi)存數(shù)組感測;讀取操作只涉及在鎖存感測數(shù)據(jù)與DDR緩存器之間傳輸數(shù)據(jù)，以及讀取DDR緩存器的數(shù)值。

根據(jù)所需的操作序列不同，有些DDR的時(shí)序可能極其復(fù)雜。但如果相鄰讀取操作發(fā)生在不同內(nèi)存組的數(shù)據(jù)之間，則可大幅簡化時(shí)序。因?yàn)樵趶南乱粋€(gè)內(nèi)存組中讀取數(shù)據(jù)之前，不必在原有的內(nèi)存組中等待回寫和預(yù)充電。時(shí)序控制最困難的是來自同一內(nèi)存組的連續(xù)讀寫。

實(shí)現(xiàn)內(nèi)存數(shù)組：MAT

理論上，盡管一個(gè)內(nèi)存組的邏輯容量可能達(dá)到32K行與16K列，但以現(xiàn)有技術(shù)而言，現(xiàn)實(shí)上并不可能制造出這樣的內(nèi)存數(shù)組。這是因?yàn)椋?/p>

? 驅(qū)動器在選擇分頁時(shí)的驅(qū)動能力有限;在性能符合規(guī)格要求的前提下，只有一定數(shù)量的選定晶體管可以被驅(qū)動。

? 感測放大只能支持有限數(shù)量的儲存單元。如果儲存單元的數(shù)量太多，由于電荷分配造成電壓變化減小，而被噪聲淹沒。

因此，為了確保內(nèi)存芯片可靠且易于制造，每一種內(nèi)存應(yīng)用都存在不同程度的實(shí)體尺寸限制。達(dá)到這種上限的內(nèi)存數(shù)組被稱作“內(nèi)存數(shù)組片”(memory array tile;MAT)。每個(gè)MAT都是功能齊全的數(shù)組，本身包含字符線和位線的譯碼以及感測放大器。

以一種采用2x-nm工藝節(jié)點(diǎn)的一般DRAM MAT為例，其位線和字符線的規(guī)模分別達(dá)到1，024條和620條。字符線的數(shù)量并不是2的整數(shù)次方，這帶來了一些解碼方面的挑戰(zhàn)。該芯片或許只用了最后的幾個(gè)MAT，但這是一個(gè)可以忽略的芯片建置細(xì)節(jié)。

透過打造一個(gè)16×53大小的MAT數(shù)組，可為具有這一尺寸的內(nèi)存組實(shí)現(xiàn)總共848個(gè)MAT。一個(gè)完整分頁整合一行MAT的內(nèi)存單元：當(dāng)開啟一個(gè)分頁時(shí)，同時(shí)啟動同一行有MAT內(nèi)存單元上相應(yīng)的字符線。

圖5：傳統(tǒng)DRAM的實(shí)體布局

在了解了這些背景知識后，接下來將討論全新的Kilopass內(nèi)存單元，以及它如何打造與此相同的儲存組。

VLT內(nèi)存單元

Kilopasss的全新內(nèi)存單元基于一種垂直分布的閘流體(也被稱為半導(dǎo)體控制整流器，或SCR)。這種采取pnpn結(jié)構(gòu)的堆棧建構(gòu)于一個(gè)p-阱上，可帶走來自底部n型層的任何空洞。

圖6：VLT內(nèi)存單元：帶有寫入輔助的PMOS晶體管的閘流體

在淺溝槽隔離(STI)結(jié)構(gòu)中植入一個(gè)埋入式字符線，使底部的n層連接到一個(gè)字符。埋入式字符線與外部銅金屬M(fèi)1層字符線透過具有較大電阻的金屬鎢實(shí)現(xiàn)連接，因而可以制造比傳統(tǒng)DRAM更長的字符線。

由于感測機(jī)制并非采用電荷分配，使感測放大器可承受更長的位線。因此，這種技術(shù)可以支持高達(dá)2Kbit寬、4Kbit深或總共8M位的MAT——遠(yuǎn)大于傳統(tǒng)的DRAM MAT。采用更少片較大型MAT拼接成的內(nèi)存芯片較采用多片小尺寸MAT的花費(fèi)更低，因而可使VLT內(nèi)存的數(shù)組效率達(dá)到77%，相形之下，同樣采用2x-nm節(jié)點(diǎn)的傳統(tǒng)DRAM效率只有64%。

以VLT內(nèi)存單元打造LPDDR4內(nèi)存

MAT容量增大后，LPDDR4內(nèi)存組就可以用更少的MAT組成。單純按照位數(shù)計(jì)算，基于VLT技術(shù)的內(nèi)存組將包含64個(gè)MAT，相形之下，傳統(tǒng)DRAM的內(nèi)存組需要配置848個(gè)更小的MAT。不過，接下來的問題就是如何最有效配置這些MAT。

一種配置方式是每個(gè)MAT都帶有512個(gè)支持4K位線的感測放大器，這意味著每個(gè)感測放大器都有多任務(wù)器用于在8條位線中進(jìn)行選擇。其中，多任務(wù)器的選擇基于CAS地址;進(jìn)一步針對圖3的內(nèi)存數(shù)組進(jìn)行修改后，新的原理圖如下：

圖7：為VLT內(nèi)存添加位線多任務(wù)器

因此，對于每個(gè)被選定的分頁，每個(gè)MAT中只有八分之一的位線會被選擇，這與普通DRAM實(shí)現(xiàn)方式中所有位線都被選中的情況不同。但在傳統(tǒng)DRAM中并不可能實(shí)現(xiàn)這種更高效率的感測放大器使用方式，因?yàn)樗械奈痪€都必須被讀取，以實(shí)現(xiàn)回寫的目的。由于VLT讀取并不是破壞性的，因而無需回寫操作，且多個(gè)內(nèi)存單元可共享感測放大器。

另一個(gè)問題是如何在一個(gè)MAT實(shí)體數(shù)組中配置這些MAT?；赩LT MAT的靈活性，實(shí)體上配置這些MAT可以不必與邏輯上的配置完全吻合。只要妥善安排各總線的路徑，任何形式的配置都是可能的。舉例來說，一個(gè)內(nèi)存組可被配置為4×16個(gè)MAT數(shù)組，同時(shí)傳輸理論上與傳統(tǒng)LPDDR4相同的數(shù)據(jù)。[!--empirenews.page--]

圖8說明傳統(tǒng)DRAM和VLT技術(shù)在內(nèi)存分頁選擇上有什么不同：傳統(tǒng)DRAM選擇一行中的所有MAT，而VLT則從中選擇了一個(gè)4×8的MAT區(qū)塊。

圖8：內(nèi)存分頁選擇，其中被選定的MAT是紅色的。傳統(tǒng)DRAM透過行來選擇分頁，而VLT DRAM則以單元區(qū)塊選擇分頁。

由VLT制造的LPDDR4，在外部操作上與傳統(tǒng)LPDDR4完全相同。內(nèi)部操作可能有所差異，例如不必再回寫和預(yù)充電，但這并不會影響DDR控制器;如果滿足了VLT的時(shí)序要求，其內(nèi)存的邏輯組織方式與傳統(tǒng)DDR完全一致。

免除刷新

VLT內(nèi)存單元最明顯的優(yōu)點(diǎn)之一就是不需要刷新。不過，刷新已經(jīng)成為DRAM作業(yè)的一部份了;無論內(nèi)存處于閑置狀態(tài)或是被接通，都必須進(jìn)行刷新操作，以避免數(shù)據(jù)丟失。

完整的DDR控制器狀態(tài)機(jī)說明了刷新對于運(yùn)作的影響，如圖9所示，所有紅色的狀態(tài)都與刷新或者基于刷新的分支相關(guān);而使用了VLT技術(shù)，這些狀態(tài)都是冗余的，而且能夠被消除。

圖9：傳統(tǒng)DRAM建置的LPDDR4狀態(tài)原理圖，與刷新有關(guān)的狀態(tài)以及與基于刷新的有關(guān)分支狀態(tài)都被標(biāo)注為紅色，標(biāo)注為灰色的狀態(tài)則與接口相關(guān)。

圖10則是一種簡化的狀態(tài)機(jī)，其中與刷新有關(guān)的狀態(tài)都已經(jīng)移除了。在設(shè)計(jì)基于VLT的內(nèi)存時(shí)，設(shè)計(jì)者可以選擇現(xiàn)有的DDR控制器，因應(yīng)那些不需要的狀態(tài)加以調(diào)整;也可以設(shè)計(jì)優(yōu)化的DDR控制器，省去所有與刷新相關(guān)的電路——這種方法將占用更小的芯片面積，以及降低功耗。無論選擇哪一種控制器，都不會影響其他系統(tǒng)與內(nèi)存芯片的互動。

圖10：移除與刷新相關(guān)狀態(tài)后的LPDDR4狀態(tài)原理圖

結(jié)語

VLT內(nèi)存單元可以打造一種比普通DRAM內(nèi)存單元成本更少、功耗更低的內(nèi)存，目前VLT內(nèi)存芯片已能與現(xiàn)有的LPDDR4內(nèi)存完全兼容了。透過適當(dāng)設(shè)計(jì)架構(gòu)、命令以及時(shí)序，VLT內(nèi)存芯片就能與傳統(tǒng)內(nèi)存芯片無差別地應(yīng)用在實(shí)際系統(tǒng)上。

基于VLT的內(nèi)存數(shù)組采用一個(gè)可在內(nèi)部作業(yè)處理差異的接口，使其得以與標(biāo)準(zhǔn)的LPDDR4控制器配合使用。換句話說，設(shè)計(jì)一款免刷新的LPDDR4控制器，使其仍具備完整的控制器功能以支持外部接口，并確?，F(xiàn)有驅(qū)動器都能繼續(xù)正常作業(yè)，而只是在內(nèi)部忽略與刷新有關(guān)的操作，將有助于大幅節(jié)省成本，以及降低功耗。