“沒有電源就沒有AI”,英飛凌談AI服務(wù)器的供電架構(gòu)變革
生成式AI的爆發(fā)式增長正重塑數(shù)據(jù)中心生態(tài),供電系統(tǒng)成為支撐算力革命的基石。據(jù)國際能源署(IEA),2023至2030年間,數(shù)據(jù)中心能耗將激增165%,而AI服務(wù)器機(jī)架功耗已從10kW飆升至120kW以上,單GPU功耗甚至逼近2kW。這種高功率密度需求對電源效率、散熱設(shè)計和可靠性提出前所未有的挑戰(zhàn)。
作為全球功率半導(dǎo)體領(lǐng)導(dǎo)者,英飛凌科技(InfineonTechnologies)憑借碳化硅(SiC)、氮化鎵(GaN)和垂直供電(VPD)等關(guān)鍵技術(shù),引領(lǐng)AI服務(wù)器電源架構(gòu)變革。
“面對AI運(yùn)算耗電比例的不斷上升,提升電源效率與功率密度已成為當(dāng)務(wù)之急。也可以說‘沒有電源就沒有AI’,這充分體現(xiàn)了電源在AI系統(tǒng)中的重要性。”
近日21ic有幸采訪到了英飛凌消費(fèi)、計算與通訊業(yè)務(wù)大中華區(qū)服務(wù)器電源應(yīng)用市場經(jīng)理陳世偉,他深入剖析了AI數(shù)據(jù)中心供電技術(shù)的痛點與未來,揭示英飛凌如何通過創(chuàng)新器件和系統(tǒng)級解決方案賦能AI時代。
英飛凌消費(fèi)、計算與通訊業(yè)務(wù)大中華區(qū)服務(wù)器電源應(yīng)用市場經(jīng)理陳世偉
21ic:AI服務(wù)器相較傳統(tǒng)服務(wù)器的電源需求有何獨(dú)特要求?高功率密度如何影響電源設(shè)計?英飛凌的芯片如何助力高功率PSU實現(xiàn)高效能?
AI服務(wù)器通常需要更高的功率來支持其高性能計算和處理能力,這是由于它們需要運(yùn)行復(fù)雜的算法和處理大量數(shù)據(jù)。
與傳統(tǒng)服務(wù)器相比,AI服務(wù)器的電源要求有幾個關(guān)鍵差異。首先,AI服務(wù)器通常需要更高的功率來支持龐大的算力,如GPU和TPU。這些組件需要更多的電力來運(yùn)行,這使得電源的設(shè)計變得更加復(fù)雜。其次,AI服務(wù)器通常需要更高的效率和可靠性,因為它們需要24/7運(yùn)行并處理大量數(shù)據(jù)。最后,AI服務(wù)器的電源需要能夠適應(yīng)不斷變化的負(fù)載和功率需求,這使得電源的設(shè)計需要更加靈活和可擴(kuò)展。
(圖片來源于IEA)
高功率需求對電源的設(shè)計有著重大影響。首先,電源需要能夠提供更高的電壓和電流,這需要更高的功率密度和更高效的設(shè)計。其次,電源需要能夠處理高功率下產(chǎn)生的熱量,這需要更好的散熱設(shè)計。最后,電源需要能夠提供更高的可靠性和冗余性,以確保AI服務(wù)器的正常運(yùn)行。
英飛凌的芯片可以支持更高功率的PSU(電源)通過提供高效和可靠的功率管理解決方案。此外, 英飛凌除了可以提供傳統(tǒng)MOSFET外,也提供SiC、IGBT、GaN 等不同的功率器件。面對目前高功率密度的要求,英飛凌能夠采用合適的器件,有效提升功率密度,從而使電源的設(shè)計更加緊湊和高效。同時,英飛凌的控制器和驅(qū)動器可以提供高精度和高可靠性的功率管理功能,這使得電源的設(shè)計更加穩(wěn)定和可靠。
(圖片來源于英飛凌官網(wǎng))
21ic:BBU(備用電池單元)在AI服務(wù)器瞬時斷電保護(hù)中的作用日益重要,電源芯片需要在哪些方面加強(qiáng),才能提升BBU的快速響應(yīng)和可靠性?
除了在電源架構(gòu)方面的革新,考慮到AI服務(wù)器如果發(fā)生斷電可能付出的代價(每小時停機(jī)損失可達(dá)100萬至500萬美元),英飛凌也公布了一套完整的AI數(shù)據(jù)中心電池備用單元模塊(BBU)產(chǎn)品發(fā)展藍(lán)圖,涵蓋4kW到12kW方案,具備高效率與可靠、可擴(kuò)充的電源轉(zhuǎn)換能力,以及高出業(yè)界平均水平四倍的功率密度。在確保供電不間斷之外,BBU還能夠提供過濾和調(diào)節(jié)電源供應(yīng)的功能,保護(hù)敏感的AI運(yùn)算硬件免受電壓突波、浪涌等電源異常情況的沖擊。
(圖片來源于英飛凌官網(wǎng))
其中,5.5kW BBU采用英飛凌獨(dú)家拓?fù)浣Y(jié)構(gòu)結(jié)合Si與GaN技術(shù),而業(yè)界首創(chuàng)的12 kW系統(tǒng)則配備多張4 kW電源轉(zhuǎn)換卡,搭載英飛凌PSOC微控制器、40V與80V OptiMOS以及EiceDRIVER柵極驅(qū)動器。
21ic:液冷成為AI服務(wù)器趨勢,AI服務(wù)器中的電源需要和散熱系統(tǒng)進(jìn)行協(xié)同設(shè)計。請問英飛凌的芯片如何適配高功率電源系統(tǒng)的熱管理需求?
根據(jù)國際能源署(IEA)數(shù)據(jù),數(shù)據(jù)中心目前占全球能耗的2%。隨著AI發(fā)展加速,預(yù)計在2023至2030年間,數(shù)據(jù)中心的電力需求將增長165%。因此,提升從電網(wǎng)到主板核心的電源轉(zhuǎn)換效率與功率密度,是進(jìn)一步提高計算性能并降低總擁有成本(TCO)的關(guān)鍵。
(圖片來源于IEA)
*創(chuàng)新的OptiMOS? TDM2454xx四相功率模塊*
OptiMOS? TDM2454xx四相功率模塊實現(xiàn)了真正的垂直供電(VPD),并提供行業(yè)領(lǐng)先的2安培/平方毫米電流密度。該模塊延續(xù)了英飛凌去年推出的OptiMOS? TDM2254xD和TDM2354xD雙相功率模塊,為加速計算平臺提供卓越的功率密度。
(圖片來源于英飛凌官網(wǎng))
在傳統(tǒng)水平供電系統(tǒng)中,電流在電路板到ASIC之間流動時,會因為電流經(jīng)過PCB路徑而產(chǎn)生傳導(dǎo)損耗。隨著ASIC電源需求的增加,電流的提升會導(dǎo)致明顯的功率損耗。然而,垂直供電可以大幅縮短傳輸路徑,降低傳導(dǎo)損耗,從而提升系統(tǒng)性能。
這種改進(jìn)的關(guān)鍵在于減少電流通過的阻抗,垂直供電設(shè)計通常能夠?qū)崿F(xiàn)更短、更直接的電源連接,從而降低功率損耗。這種方式對于高性能應(yīng)用尤其重要,因為在這些應(yīng)用中,電源的穩(wěn)定性和效率直接影響到整體系統(tǒng)的表現(xiàn)。
*三維設(shè)計與先進(jìn)技術(shù)的結(jié)合*
英飛凌采用三維設(shè)計方式,結(jié)合業(yè)界領(lǐng)先的功率器件和封裝技術(shù),憑借深厚的系統(tǒng)底蘊(yùn),提供高性能的節(jié)能計算解決方案,這進(jìn)一步支持了推動數(shù)字化和低碳化的企業(yè)使命。
通過采用英飛凌強(qiáng)大的OptiMOS? 6溝槽式技術(shù)功率組件和嵌入式芯片封裝,OptiMOS? TDM2454xx模塊提供優(yōu)異的電氣和散熱性能。同時,創(chuàng)新的超薄電感設(shè)計技術(shù)不斷提升VPD系統(tǒng)性能和質(zhì)量的極限。此外,OptiMOS? TDM2454xx的結(jié)構(gòu)設(shè)計有利于模塊化拼接,改善電流傳導(dǎo),進(jìn)一步提升電氣、散熱和機(jī)械性能。
(圖片來源于英飛凌官網(wǎng))
該模塊在四相電源中最高支持280A電流,并在僅10x9 mm2的小型封裝內(nèi)整合了嵌入式電容層,結(jié)合英飛凌的XDP?控制器,可以實現(xiàn)穩(wěn)定耐用的高電流密度功率解決方案。通過這些創(chuàng)新,英飛凌為未來的計算需求提供了強(qiáng)有力的支持。
21ic:AI數(shù)據(jù)中心增長潛力很大,但而電源部分在其中的價值占比目前不足10%。英飛凌如何看待這一市場的未來發(fā)展趨勢?
隨著生成式AI應(yīng)用的持續(xù)升溫,全球?qū)Ω咝阅苡嬎悖℉PC)的需求快速增長。盡管業(yè)界的焦點多集中于處理器技術(shù)的進(jìn)展,但數(shù)據(jù)中心與AI服務(wù)器的電源系統(tǒng)正面臨前所未有的挑戰(zhàn)。電力需求的激增促使電源設(shè)計向高電壓、高功率密度發(fā)展,同時必須提升轉(zhuǎn)換效率、縮小外形尺寸,并符合日益嚴(yán)格的節(jié)能與可持續(xù)標(biāo)準(zhǔn),同時保持合理的運(yùn)營成本。
目前,電源在整體系統(tǒng)中所占的比例可能看似不高,但隨著AI服務(wù)器運(yùn)算能力的提高,單一GPU的功耗已經(jīng)達(dá)到700W,甚至上升至1.5kW、2kW。整體AI服務(wù)器機(jī)柜的功耗也從傳統(tǒng)服務(wù)器的10kW攀升至120kW以上。這一趨勢表明,面對AI運(yùn)算耗電比例的不斷上升,提升電源效率與功率密度已成為當(dāng)務(wù)之急。也可以說“沒有電源就沒有AI”,這充分體現(xiàn)了電源在AI系統(tǒng)中的重要性。
*英飛凌的全面電源管理解決方案*
英飛凌憑借其在功率半導(dǎo)體設(shè)計、制造與電源系統(tǒng)應(yīng)用的深厚技術(shù)實力,提供從電網(wǎng)到主板處理器的完整電源管理解決方案。這些解決方案涵蓋硅(Si)、碳化硅(SiC)和氮化鎵(GaN)三大主流材料,為AI運(yùn)算基礎(chǔ)設(shè)施提供高效、可靠、可擴(kuò)展且具有成本效益的電力傳輸。
通過這些創(chuàng)新,英飛凌致力于為快速發(fā)展的AI技術(shù)提供強(qiáng)有力的支持,確保電源系統(tǒng)能夠滿足未來計算需求的挑戰(zhàn)。
21ic:在800V HVDC這樣的前沿電源架構(gòu)的探索階段中,作為芯片廠商參與到其中,英飛凌的核心價值、貢獻(xiàn)及影響力體現(xiàn)在哪些方面?
AI算力的增長與技術(shù)演進(jìn)正在以前所未有的速度進(jìn)行,這對能源需求與AI服務(wù)器生態(tài)系統(tǒng)帶來了重大挑戰(zhàn)。半導(dǎo)體處于AI的核心,協(xié)助驅(qū)動、收集、處理和管理AI系統(tǒng)運(yùn)作所需的大量數(shù)據(jù)。
(圖片來源于英飛凌官網(wǎng))
英飛凌專注于考慮整個生態(tài)系統(tǒng)的能源效率,特別是從電網(wǎng)到主板核心的電源管理,以支撐AI的功能運(yùn)作。通過與生態(tài)系統(tǒng)合作伙伴的密切合作,提升AI服務(wù)器的可靠性,降低碳排放和總體擁有成本(TCO),從而實現(xiàn)AI可持續(xù)發(fā)展的未來。
隨著服務(wù)器架構(gòu)過渡至高壓直流(HVDC)供電設(shè)計,整個電源流程管理需要重新設(shè)計。憑借在電源系統(tǒng)領(lǐng)域的豐富經(jīng)驗,英飛凌提供了一系列AI服務(wù)器電源管理解決方案,包括硅(Si)、碳化硅(SiC)和氮化鎵(GaN)技術(shù)。這些解決方案確保每個階段的最佳電源轉(zhuǎn)換,并降低供電網(wǎng)絡(luò)(PDN)的損耗。
通過這些努力,英飛凌致力于推動創(chuàng)新,確保AI服務(wù)器能夠高效、可靠地支持未來的計算需求。
21ic:您認(rèn)為800V HVDC會在多長時間內(nèi)成為AI數(shù)據(jù)中心主流?48V架構(gòu)會否繼續(xù)主導(dǎo)?英飛凌如何為未來電源架構(gòu)做準(zhǔn)備?
當(dāng)前,AI數(shù)據(jù)中心的功耗與電源架構(gòu)正在快速演變,這主要是由于大型AI訓(xùn)練集群(特別是GPU/加速器服務(wù)器)對于功率密度、效率與配電距離的要求不斷提升。
·從短期來看,48V架構(gòu)依然成熟,因其技術(shù)成熟度高、供應(yīng)鏈完整且已有大量實際部署案例。
·從中期來看,800V高壓直流(HVDC)技術(shù)可能在部分新建或超大規(guī)模的AI數(shù)據(jù)中心中進(jìn)行試點應(yīng)用,特別是那些需要長距離配電和極高功率需求的場景。
·從長期來看,若標(biāo)準(zhǔn)化、安全規(guī)范與配套生態(tài)系統(tǒng)進(jìn)一步成熟,800V架構(gòu)有望在高端AI數(shù)據(jù)中心中占據(jù)顯著比例。然而,全面取代48V架構(gòu)可能仍需更長的時間。
隨著AI算力的持續(xù)增長,英飛凌將繼續(xù)發(fā)揮在AI服務(wù)器生態(tài)圈中的重要角色,持續(xù)與全球及各生態(tài)系統(tǒng)的合作伙伴攜手共進(jìn)。共同定義并開發(fā)更高能效的AI服務(wù)器電源解決方案,以助力客戶迎接AI時代的能源挑戰(zhàn),實現(xiàn)AI運(yùn)算的可持續(xù)未來。通過這些努力,英飛凌致力于推動電源系統(tǒng)的創(chuàng)新,確保其能夠滿足未來計算需求的變化與挑戰(zhàn)。