為高頻交易而生的加速卡,以超低時延發(fā)揮AI交易策略潛能|AMD推出Alveo UL3422金融科技加速卡
金融行業(yè)的競爭日益激烈,速度和效率已經(jīng)成為決定成敗的關(guān)鍵因素。無論是銀行業(yè)、支付、保險業(yè),還是證券交易、外匯、及大宗商品交易,快速準確的交易執(zhí)行都是獲取收益的核心。隨著技術(shù)的進步,尤其是電子交易的普及,高頻交易(High-Frequency Trading,HFT)逐漸成為市場中的重要力量。HFT以超高速的交易執(zhí)行為特色,旨在通過捕捉瞬息萬變的價格波動獲取利潤,因此對交易速度和延遲的要求極高。對于HFT公司而言,交易速度、準確性和一致性是成功的基石——最大限度地降低交易延遲不僅提升了交易的效率,還在市場中構(gòu)建了獨特的競爭優(yōu)勢和盈利能力。
高頻交易對基礎(chǔ)設(shè)施性能的極致要求使得硬件加速成為關(guān)鍵。為了實現(xiàn)從數(shù)據(jù)接收到交易執(zhí)行的超低延遲,HFT公司越來越多地依賴FPGA加速卡這種高效、靈活的硬件加速器。FPGA能夠在納秒級的時間內(nèi)處理復(fù)雜的交易算法,為HFT提供了強大的速度和一致性支持。
正是在這種需求驅(qū)動下,AMD推出了最新的Alveo UL3422金融科技加速卡。這款加速卡不僅能夠滿足HFT對超低時延的要求,還支持硬件自檢功能,確保在實時交易中始終保持最佳狀態(tài)。
滿足高頻交易三大核心需求,AMD Alveo UL3422來了
“高頻交易就是使用算法能夠?qū)崿F(xiàn)非常迅速地從tick-to-trade這樣一個交易的特征。它使用非常復(fù)雜的算法,以及要求非常高的硬件。通常是利用市場上非常小的價差以及市場的低效,在短時高頻發(fā)生的交易,通過這樣的方式來獲得利潤?!盇MD自適應(yīng)和嵌入式計算事業(yè)部Alveo加速卡高級產(chǎn)品線經(jīng)理Shyam Chander總結(jié)到了高頻交易有三大關(guān)鍵特點:首先是極低時延,幾微秒的延遲差異可能就意味著利潤與虧損的天壤之別;其次是關(guān)鍵基礎(chǔ)設(shè)施,許多HFT公司通過在交易所租用服務(wù)器或部署設(shè)備實現(xiàn)服務(wù)器共置,以此確保盡可能低的交易延遲,市場數(shù)據(jù)的傳輸速度和設(shè)備布置也直接影響交易效率;最后是強大的算法,自適應(yīng)計算能夠幫助交易商優(yōu)化算法和實現(xiàn)監(jiān)管合規(guī),進一步提升交易效率與精準性。這些特點使HFT能夠在瞬息萬變的市場中占得先機。
而AMD最新推出的Alveo UL3422金融科技加速卡專為高頻交易需求設(shè)計,通過FPGA加速實現(xiàn)了納秒級的超低延遲,為全球交易提供快速的tick-to-trade響應(yīng)能力。
據(jù)悉,Alveo UL3422是AMD Alveo超低時延加速卡系列的最新成員,基于前一代Alveo UL3524產(chǎn)品打造,保持了UL3524的許多核心優(yōu)勢,同時優(yōu)化了性價比。Alveo UL3422具備三大優(yōu)勢:首先,它采用專門設(shè)計的芯片和GTF收發(fā)器,確保在交易執(zhí)行中達到極低的延遲標準;其次,其全高半長的纖薄尺寸,使其具有高性價比和靈活的部署性,降低了高頻交易基礎(chǔ)設(shè)施的進入門檻;最后,Alveo UL3422支持輕松開發(fā),用戶可借助AMD開發(fā)工具優(yōu)化性能,實現(xiàn)RTL流和硬件靈活配置,便于構(gòu)建完整的交易生態(tài)系統(tǒng)。
此外,Alveo UL3422配備的自檢(self-test)功能可在運行過程中自動監(jiān)測硬件狀態(tài)和性能,及時發(fā)現(xiàn)并修復(fù)異常,保障系統(tǒng)穩(wěn)定性、準確性和低延遲,確保高頻交易策略的精準執(zhí)行。
如上圖所示,Alveo UL3422加速卡采用纖薄小巧的設(shè)計,基于Virtex? UltraScale+ VU2P FPGA單片架構(gòu),配備單一插槽并搭載專屬開發(fā)的GTF收發(fā)器,能夠?qū)崿F(xiàn)超低延遲的交易性能。其緊湊的尺寸結(jié)合高效設(shè)計,配備多個網(wǎng)絡(luò)節(jié)點、板載內(nèi)存及板對板連接,相較于前代Alveo UL3524產(chǎn)品具備更高的經(jīng)濟性。
此外,Alveo UL3422提供10G和25G雙網(wǎng)絡(luò)端口,支持多卡互聯(lián),并優(yōu)化了FPGA的操作能力,滿足復(fù)雜金融應(yīng)用需求??紤]到金融服務(wù)對時間精度和準確性的嚴格要求,該加速卡還具備與外部單元的交互功能,確保精準的時間戳標記。
低于3ns的收發(fā)器延遲,助力20ns以下的交易執(zhí)行“超低延遲”
在“Tick-to-Trade”流程中,超低延遲基礎(chǔ)設(shè)施是實現(xiàn)高頻交易(HFT)性能的核心。從市場數(shù)據(jù)的接收到交易指令的執(zhí)行,每個階段都需要極致的速度和效率,這正是AMD最新的Alveo UL3422加速卡所擅長的領(lǐng)域。
數(shù)據(jù)傳輸饋送系統(tǒng)是整個交易過程的起點。這一系統(tǒng)負責(zé)從市場接收實時數(shù)據(jù),包括價格變動、交易量等關(guān)鍵信息,并將這些數(shù)據(jù)快速傳遞到下一個階段。這一環(huán)節(jié)中的數(shù)據(jù)傳輸速度至關(guān)重要,直接影響后續(xù)分析和決策的效率。超低延遲的實現(xiàn)確保了交易系統(tǒng)能夠以最快的速度響應(yīng)市場變化,從而獲取交易先機。
接收到的數(shù)據(jù)被迅速傳輸?shù)剿惴ń灰灼脚_,該平臺通過高度復(fù)雜的算法對市場信息進行實時分析和處理,生成交易指令。算法交易平臺是實現(xiàn)高頻交易的核心,要求極低的計算延遲,以確保在最短時間內(nèi)得出交易決策。
在生成交易指令后,系統(tǒng)會進行風(fēng)險控制,通過交易前風(fēng)險檢查控制系統(tǒng)來驗證指令的合規(guī)性和風(fēng)險性。這個環(huán)節(jié)確保每筆交易符合監(jiān)管要求,降低系統(tǒng)性風(fēng)險,避免高風(fēng)險交易的產(chǎn)生。對于高頻交易來說,風(fēng)險控制過程需要極高的效率,以避免交易延遲,因此這一步驟也必須在極短時間內(nèi)完成,以確保交易的持續(xù)順暢。
通過風(fēng)險檢查的交易指令最終被提交至交易訂單服務(wù)器(匹配引擎)進行撮合執(zhí)行。匹配引擎根據(jù)訂單需求迅速完成交易撮合,從而實現(xiàn)訂單的即時執(zhí)行。交易訂單的撮合執(zhí)行需滿足SEC等監(jiān)管機構(gòu)的合規(guī)要求,確保交易的合法性和合規(guī)性。整個“Tick-to-Trade”流程至此完成,通過超低延遲的基礎(chǔ)設(shè)施優(yōu)化,就確保了高頻交易系統(tǒng)能夠以最快速度、最高效率在市場中捕捉利潤機會。
AMD Alveo UL3422在整個“Tick-to-Trade”基礎(chǔ)設(shè)施中發(fā)揮了關(guān)鍵作用,其超低時延性能(ULL)使得它在數(shù)據(jù)傳輸、算法交易和交易前風(fēng)險控制等環(huán)節(jié)中都具備卓越的加速效果。在數(shù)據(jù)傳輸階段,UL3422確保市場數(shù)據(jù)能夠迅速且無延遲地傳輸至算法交易平臺,使系統(tǒng)能夠快速響應(yīng)市場變化。在算法交易平臺環(huán)節(jié),UL3422通過其FPGA加速能力高效處理復(fù)雜算法,提供納秒級的決策速度,以快速生成交易指令。接著,在交易前風(fēng)險檢查階段,UL3422進一步保障了風(fēng)險控制的及時性和合規(guī)性,確保每筆交易都符合SEC等監(jiān)管要求。
據(jù)Shyam Chander介紹,AMD針對不同延遲需求和算法復(fù)雜度的交易解決方案,以支持不同的高頻交易場景。
· < 20 納秒的超低時延(FPGA加速):該級別適用于對執(zhí)行速度有極致要求的交易策略,例如套利。此方案使用超低延遲的FPGA硬件實現(xiàn),確保在極短時間內(nèi)完成交易執(zhí)行,幫助交易者在市場上獲得速度優(yōu)勢。而AMD Alveo UL3422的收發(fā)器延遲低于3ns,僅為2.34ns,與UL3524一致,因為兩者都采用了相同的GFY收發(fā)器IP。而此前UL3524創(chuàng)下的世界紀錄交易延遲僅為13.9ns。
· < 100 納秒的低時延(FPGA和自適應(yīng)SoC):此級別適合多贏家或計算密集型的交易策略。通過FPGA結(jié)合自適應(yīng)SoC的硬件架構(gòu)支持,這種方案可以更高效地執(zhí)行復(fù)雜算法,滿足多個算法密集型的需求。AMD的Alveo V80滿足的就是這方面的要求,無論是從計算還是內(nèi)存的資源方面都能夠適配相應(yīng)的交易。
· < 1000 納秒的低時延(CPU和低時延NIC):適用于需要復(fù)雜CPU計算的交易場景,通過CPU結(jié)合低時延網(wǎng)絡(luò)接口卡(NIC)實現(xiàn)。該方案在延遲上略高,但仍能支持復(fù)雜的計算需求,適合需要較高延遲容忍度的交易策略。像AMD Alveo X3522、CPU如EPYC和銳龍也都能夠滿足這一非常復(fù)雜的計算和交易需求。
以FPGA靈活計算為基礎(chǔ),發(fā)揮交易中的AI算法之力
隨著越來越多的交易商在交易管線中引入人工智能,AI交易策略逐漸成為金融科技領(lǐng)域的新趨勢。傳統(tǒng)上,機器學(xué)習(xí)并不是交易管線的一部分,但現(xiàn)在監(jiān)督學(xué)習(xí)和機器學(xué)習(xí)引擎正被廣泛應(yīng)用于交易流程中,盡管金融科技領(lǐng)域?qū)Υ藨?yīng)用的細節(jié)鮮有公開。然而,這一趨勢的出現(xiàn)確實展現(xiàn)了AI在提升交易效率和精度方面的潛力。在這種背景下,F(xiàn)PGA在結(jié)合AI交易策略方面具備明顯的優(yōu)勢。
據(jù)Shyam解答:首先,F(xiàn)PGA的可編程性使其能夠靈活適應(yīng)各種算法需求,實現(xiàn)利潤最大化等不同目標,且與ASIC等硬件不同,F(xiàn)PGA能通過編程實現(xiàn)無縫連接,從而具備高度的適應(yīng)性。此外,金融科技對超低時延有著嚴格要求,F(xiàn)PGA通過其GTF收發(fā)器可實現(xiàn)20納秒以內(nèi)的數(shù)據(jù)傳輸,滿足了這一超低時延的需求。這些優(yōu)勢使FPGA成為AI交易策略的理想加速計算平臺。
“對于高頻交易商來說,他們非常專注于基礎(chǔ)設(shè)施,因為基礎(chǔ)設(shè)施是他們是否能夠盈利的關(guān)鍵?!盨hyam分享到。
從世界交易所聯(lián)合會統(tǒng)計的全球25大證券交易所的主機共置需求分布來看,為了實現(xiàn)最低時延,交易所和高頻交易商需將服務(wù)器部署在靠近交易所的數(shù)據(jù)中心。這種主機共置策略需要大量資本支出和運營支持,包括機架空間、電力、網(wǎng)絡(luò)連接和數(shù)據(jù)傳輸,以確保交易速度和穩(wěn)定性。同時,各區(qū)域的市場份額分布以及基礎(chǔ)設(shè)施戰(zhàn)略對盈利能力的意義重大。
而此次最新推出的AMD Alveo UL3422具備精簡優(yōu)化的設(shè)計,與上一代相比提升了性價比,并且采用全高半長的緊湊尺寸,非常適合1U服務(wù)器的空間需求,同時支持2U和4U服務(wù)器的靈活配置。它已在Hypertec ORION HF X410R-G6和Dell PowerEdge R640等服務(wù)器上完成了兼容性測試,能夠?qū)崿F(xiàn)高效穩(wěn)定的性能。這款加速卡針對機架空間、功耗和主機共置進行了優(yōu)化,能夠在高密度環(huán)境中高效部署,滿足企業(yè)對低成本高性能計算加速的需求。
據(jù)悉,AMD Alveo UL3422加速卡的相關(guān)參考設(shè)計、工具與生態(tài)系統(tǒng)的IP都已經(jīng)推出,而且這款產(chǎn)品現(xiàn)在已經(jīng)在量產(chǎn)中。