數(shù)字信號(hào)處理器的設(shè)計(jì)有哪些非常復(fù)雜過(guò)程
存儲(chǔ)器是一種用于存儲(chǔ)數(shù)據(jù)的集成電路。存儲(chǔ)器的架構(gòu)可以分為靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)和動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)等類(lèi)型。SRAM速度快、功耗低、但容量小,適合于高速緩存等應(yīng)用。DRAM容量大,但速度相對(duì)較慢和功耗較高,適合于主存等應(yīng)用。存儲(chǔ)器的架構(gòu)還可以根據(jù)實(shí)現(xiàn)的功能進(jìn)行分類(lèi),例如閃存、EEPROM和SDRAM等。模擬電路是一種用于處理模擬信號(hào)的集成電路。模擬電路的架構(gòu)可以分為放大器、濾波器、混頻器、ADC、DAC等模塊。模擬電路的設(shè)計(jì)需要考慮到噪聲、溫度漂移、電源偏差等因素,以保證模擬信號(hào)的準(zhǔn)確性和穩(wěn)定性。器
數(shù)字信號(hào)處理器是一種用于處理數(shù)字信號(hào)的集成電路。數(shù)字信號(hào)處理器的架構(gòu)可以分為基帶模塊、信號(hào)處理模塊、控制模塊等部分。數(shù)字信號(hào)處理器的設(shè)計(jì)需要滿(mǎn)足高速運(yùn)算、高精度計(jì)算、低功耗等特點(diǎn),以適應(yīng)現(xiàn)代通信等領(lǐng)域的應(yīng)用。系統(tǒng)級(jí)芯片(SoC)是一種將整個(gè)電子系統(tǒng)集成到一個(gè)單一的芯片上的集成電路。SoC可以包括處理器、存儲(chǔ)器、輸入輸出接口和其他外圍設(shè)備。SoC的設(shè)計(jì)需要考慮到整個(gè)系統(tǒng)的功能和性能,以保證芯片的穩(wěn)定性和可靠性。SoC可以實(shí)現(xiàn)非常高的集成度和功能性,適用于移動(dòng)設(shè)備、物聯(lián)網(wǎng)、人工智能等領(lǐng)域。
芯片架構(gòu)的設(shè)計(jì)工具芯片的架構(gòu)設(shè)計(jì)是一個(gè)非常復(fù)雜的過(guò)程,需要使用一些專(zhuān)門(mén)的工具進(jìn)行支持和輔助。這些工具可以進(jìn)行芯片模擬、芯片驗(yàn)證、IP選型、電源分析等操作。芯片模擬工具可以對(duì)芯片進(jìn)行模擬,以驗(yàn)證芯片的功能和性能。芯片模擬工具可以進(jìn)行邏輯仿真、時(shí)序仿真、功耗仿真等操作,以提高模擬的精度和準(zhǔn)確性。芯片模擬工具常見(jiàn)的有ModelSim、Verilog-XL等。芯片驗(yàn)證工具可以對(duì)芯片的物理特性進(jìn)行測(cè)試,以確定芯片的穩(wěn)定性和可靠性。芯片驗(yàn)證工具可以包括閃存編程器、JTAG測(cè)試器、ATE自動(dòng)測(cè)試設(shè)備等。芯片驗(yàn)證工具可以保證芯片在使用過(guò)程中的質(zhì)量和穩(wěn)定性。
由于單核處理器已經(jīng)不能滿(mǎn)足越來(lái)越復(fù)雜的計(jì)算需求,多核處理器的應(yīng)用得到了廣泛推廣。多核處理器將多個(gè)處理器核心集成在一個(gè)芯片上,并實(shí)現(xiàn)高效的任務(wù)分配和時(shí)間片輪轉(zhuǎn),以提高計(jì)算能力和系統(tǒng)的響應(yīng)速度。隨著物聯(lián)網(wǎng)和5G技術(shù)的發(fā)展,芯片設(shè)計(jì)將不再是單純的計(jì)算需求,而是與通信密切相關(guān)的設(shè)計(jì)。芯片將融合計(jì)算和通信功能,實(shí)現(xiàn)更高效的數(shù)據(jù)傳輸和計(jì)算處理。人工智能加速器是一種針對(duì)深度學(xué)習(xí)等人工智能應(yīng)用的芯片設(shè)計(jì)。人工智能加速器以高效的并行計(jì)算和大規(guī)模數(shù)據(jù)處理為特點(diǎn),可以實(shí)現(xiàn)更高效的人工智能計(jì)算和推理。全息計(jì)算是一種基于量子計(jì)算和光計(jì)算的新型計(jì)算方式,可以實(shí)現(xiàn)更高效的計(jì)算和數(shù)據(jù)處理。全息計(jì)算將集成電路設(shè)計(jì)與光學(xué)計(jì)算相融合,實(shí)現(xiàn)更快和更能耗低的計(jì)算方式。芯片的架構(gòu)是確定芯片性能和性質(zhì)的重要因素。芯片的架構(gòu)應(yīng)該滿(mǎn)足應(yīng)用需求和用戶(hù)需求,考慮到可靠性、可擴(kuò)展性和可制造性等多方面因素。芯片的架構(gòu)發(fā)展呈現(xiàn)多核處理、融合計(jì)算與通信、人工智能加速器和全息計(jì)算等趨勢(shì)。隨著新技術(shù)的出現(xiàn)和應(yīng)用,芯片的架構(gòu)設(shè)計(jì)將為更加復(fù)雜的應(yīng)用提供更高效和可靠的技術(shù)支持。
西門(mén)子 EDA IC 部門(mén)市場(chǎng)總監(jiān) Neil Hand 說(shuō):“如今,每個(gè)人都在構(gòu)建自己的架構(gòu),尤其是數(shù)據(jù)中心企業(yè),而處理器架構(gòu)的很大一部分取決于工作負(fù)載的外觀。與此同時(shí),這些開(kāi)發(fā)人員也在探索加速的最佳路徑,因?yàn)榧铀俚姆绞接泻芏喾N。你可以選擇并行處理的方式,這對(duì)某些任務(wù)效果不好,但在其他任務(wù)下很有效。與此同時(shí),應(yīng)用對(duì)內(nèi)存帶寬的限制越來(lái)越大,因此你會(huì)發(fā)現(xiàn)一些高性能計(jì)算公司開(kāi)始把所有精力投入在內(nèi)存控制器上。還有一些公司會(huì)說(shuō):‘這實(shí)際上是一個(gè)分解問(wèn)題,我們要走加速器路線(xiàn),擁有獨(dú)立的內(nèi)核?!也徽J(rèn)為存在一刀切的做法?!?
Roddy指出,這些新型超級(jí)芯片內(nèi)的CPU內(nèi)核仍然遵循久經(jīng)考驗(yàn)的高性能CPU設(shè)計(jì)原則:快速、深度流水線(xiàn),追逐指針的效率極高,但這已不再是設(shè)計(jì)團(tuán)隊(duì)關(guān)注的唯一焦點(diǎn)。他說(shuō):”這些大型CPU現(xiàn)在與其他可編程引擎共享空間 — 如GPU和通用可編程N(yùn)PU,用于加速AI工作負(fù)載。與大眾消費(fèi)設(shè)備中高度專(zhuān)業(yè)化的 SoC 相比,一個(gè)顯著的區(qū)別是,AI 工作負(fù)載中的視頻轉(zhuǎn)碼或矩陣加速等任務(wù)避免了硬連邏輯塊(加速器)。為數(shù)據(jù)中心設(shè)計(jì)的設(shè)備需要保持可編程性,以應(yīng)對(duì)各種工作負(fù)載,而不僅僅是消費(fèi)類(lèi)設(shè)備中的單一已知功能?!?
然而,所有這些都需要更多的分析,而設(shè)計(jì)界正在繼續(xù)推動(dòng)流程中更多的步驟。Hand說(shuō):”無(wú)論是通過(guò)工具,還是通過(guò)仿真或虛擬原型,你都擁有了幫助了解數(shù)據(jù)的工具。此外,該行業(yè)已經(jīng)發(fā)展壯大,其專(zhuān)業(yè)化程度足以證明所花費(fèi)用的合理性。第一部分是為了降低制造新硬件的風(fēng)險(xiǎn),因?yàn)槟阌泄ぞ邅?lái)了解情況,就不必保守行事?,F(xiàn)在,市場(chǎng)已經(jīng)開(kāi)始分化,因此它的重要性值得資金投入。此外,現(xiàn)在也有了實(shí)現(xiàn)這一目標(biāo)的方法。過(guò)去,當(dāng)英特爾推出處理器時(shí),要想與英特爾競(jìng)爭(zhēng),幾乎是不可能的?,F(xiàn)在,通過(guò)生態(tài)系統(tǒng)、技術(shù)和其他因素的綜合作用,競(jìng)爭(zhēng)變得容易多了。對(duì)于高性能計(jì)算公司來(lái)說(shuō),最初的低懸果實(shí)是:'我們只需獲得一個(gè)良好的平臺(tái),讓我們可以按照自己的方式對(duì)其進(jìn)行維度化,然后再放入一些加速器。所以我們開(kāi)始看到人工智能加速器和視頻加速器,然后一些更深?yuàn)W的公司開(kāi)始追求機(jī)器學(xué)習(xí)。這意味著什么?這意味著他們需要非常高的 MAC 性能。他們會(huì)將處理器架構(gòu)聚焦于此,并通過(guò)這種方式讓自己脫穎而出。"
再加上 RISC-V、可重復(fù)使用的芯片組和硬 IP,架構(gòu)開(kāi)始變得與幾年前大不相同。Hand說(shuō):“如果你看看現(xiàn)在的數(shù)據(jù)中心和數(shù)據(jù)中心中的整個(gè)軟件堆棧,在堆棧中添加一些東西并不像以前那樣困難,你不必重建整個(gè)數(shù)據(jù)中心。如今變得重要的是進(jìn)行系統(tǒng)級(jí)分析的能力,應(yīng)用的系統(tǒng)級(jí)協(xié)同設(shè)計(jì)已變得非常重要,而且更加容易,這就是一個(gè)移動(dòng)的數(shù)據(jù)中心。”
隨著亞馬遜、谷歌、Meta等云數(shù)據(jù)中心巨頭推出針對(duì)云計(jì)算的異構(gòu)多核架構(gòu),高性能計(jì)算領(lǐng)域迎來(lái)了一場(chǎng)范式轉(zhuǎn)變。這種架構(gòu)為各種工作負(fù)載提供了高效的優(yōu)化方案,注重靈活性和效率。雖然這些定制化架構(gòu)設(shè)計(jì)昂貴,但通過(guò)提高性能、降低功耗來(lái)節(jié)省成本,成為行業(yè)的發(fā)展方向。新型芯片內(nèi)核不再僅關(guān)注CPU設(shè)計(jì)原則,而是與GPU、NPU等多種可編程引擎共享空間,以加速AI工作loads。
擴(kuò)寫(xiě):隨著云數(shù)據(jù)中心巨頭們的異構(gòu)多核架構(gòu)推出,高性能計(jì)算面臨了一次革命性的變革。這種變革不僅使得工作負(fù)載獲得了有效的優(yōu)化,同時(shí)也在靈活性和效率方面取得了新的突破。這些定制化的架構(gòu)設(shè)計(jì)雖然造價(jià)不菲,但通過(guò)提升性能、降低功耗來(lái)節(jié)省成本,正逐漸成為行業(yè)的主流趨勢(shì)。與傳統(tǒng)的CPU設(shè)計(jì)相比,新型芯片內(nèi)核已經(jīng)不再是單一關(guān)注點(diǎn),而是更加注重與GPU、NPU等可編程引擎共享空間,從而加速處理AI工作負(fù)載。
許多人認(rèn)為,應(yīng)該開(kāi)發(fā)新的架構(gòu)來(lái)克服幾代 CPU 所面臨的內(nèi)存挑戰(zhàn)。Fraunhofer IIS 自適應(yīng)系統(tǒng)工程部高效電子學(xué)部門(mén)主管 Andy Heinig 說(shuō):“對(duì) AI/ML 的需求將加速開(kāi)發(fā)新的特定應(yīng)用架構(gòu)的進(jìn)程。傳統(tǒng)的 CPU 如果能提供更好的內(nèi)存接口來(lái)解決內(nèi)存問(wèn)題,就能成為這場(chǎng)革命的一部分。如果 CPU 能夠提供這種新的內(nèi)存架構(gòu),那么 AI/ML 加速器就能與 CPU 一起成為數(shù)據(jù)中心的最佳解決方案。CPU 負(fù)責(zé)需要靈活性的經(jīng)典任務(wù),而加速器則為特定任務(wù)提供最佳性能。”
例如,Arm 直接與多家超大規(guī)模云供應(yīng)商合作開(kāi)發(fā)基于 Neoverse 的計(jì)算解決方案,以實(shí)現(xiàn)高性能、定制靈活性以及強(qiáng)大的軟件和硬件生態(tài)系統(tǒng)。這已經(jīng)產(chǎn)生了公開(kāi)發(fā)布的芯片,如 AWS 的 Graviton 和 Nitro 處理器、谷歌的 Mt.Evans DPU、微軟 Azure 的 Cobalt 100、英偉達(dá)的 Grace CPU 超級(jí)芯片以及阿里巴巴的Yitian 710。
Arm基礎(chǔ)架構(gòu)業(yè)務(wù)線(xiàn)產(chǎn)品管理高級(jí)總監(jiān)Brian Jeff說(shuō):“我們從這些和其他設(shè)計(jì)合作伙伴身上學(xué)到了很多東西。我們塑造高性能 CPU 和平臺(tái)開(kāi)發(fā)的主要方式之一是通過(guò)對(duì)基礎(chǔ)設(shè)施工作負(fù)載的深入了解,實(shí)現(xiàn)特定的架構(gòu)和微架構(gòu)增強(qiáng),尤其是對(duì) CPU 管線(xiàn)前端和 CMN 網(wǎng)狀結(jié)構(gòu)的增強(qiáng)。”
但捕捉到這種工作負(fù)載并為其開(kāi)發(fā)芯片架構(gòu)并不總是這么簡(jiǎn)單。對(duì)于AI訓(xùn)練和推理來(lái)說(shuō)尤其如此,因?yàn)樗惴ǖ母淖兛赡軙?huì)導(dǎo)致工作負(fù)載發(fā)生變化。
定制化架構(gòu)和多芯片封裝
隨著技術(shù)的不斷進(jìn)步,定制化架構(gòu)、微架構(gòu)緊密集成和精心設(shè)計(jì)的數(shù)據(jù)流成為實(shí)現(xiàn)更大計(jì)算能力和降低冷卻成本的最佳途徑。過(guò)去十年中,AMD率先采用異構(gòu)架構(gòu)和加速處理單元,推動(dòng)了行業(yè)朝著多芯片封裝方向邁進(jìn)。多芯片封裝形成的芯片片組提供了更多組合選擇,滿(mǎn)足不同的設(shè)計(jì)需求,同時(shí)也提供了更加靈活和可編程的特性,助力數(shù)據(jù)中心企業(yè)優(yōu)化其工作負(fù)載。
擴(kuò)寫(xiě):隨著技術(shù)的不斷演進(jìn),定制化架構(gòu)、微架構(gòu)緊密集成和精心設(shè)計(jì)的數(shù)據(jù)流被認(rèn)為是將更多計(jì)算能力納入較小面積同時(shí)降低冷卻成本的最佳途徑。AMD在異構(gòu)架構(gòu)和加速處理單元的領(lǐng)域率先實(shí)踐,推動(dòng)了整個(gè)行業(yè)邁入了多芯片封裝的新時(shí)代。多芯片封裝技術(shù)帶來(lái)的芯片片組選擇豐富多樣,滿(mǎn)足了不同設(shè)計(jì)需求的定制化要求,同時(shí)也為數(shù)據(jù)中心企業(yè)提供了更加靈活和可編程的處理選擇,有助于優(yōu)化其工作負(fù)載。
多芯片設(shè)計(jì)挑戰(zhàn)與解決方案
從三維布局設(shè)計(jì)到系統(tǒng)級(jí)分析,多芯片集成帶來(lái)了諸多挑戰(zhàn)。設(shè)計(jì)人員需要考慮多芯片之間的時(shí)序同步、內(nèi)存位置、以及不可避免的散熱問(wèn)題。新的設(shè)計(jì)方法需要更早地考慮散熱需求,同時(shí)在考慮多芯片不同工作載荷的同時(shí),進(jìn)行零電路圖原理階段的分析,以確保系統(tǒng)設(shè)計(jì)的完整性和性能。