就醫(yī)體驗飆升的背后,是CPU在“悄悄打工”?
導(dǎo)語:性能夠用,價格友好,至強(qiáng)是智能化轉(zhuǎn)型的實用首選。
正如新藥研發(fā)在臨床前鮮有人問津,卻能在上市后挽救無數(shù)生命。
醫(yī)院的智能化升級鮮為人知,卻悄然重塑著每一位患者的就醫(yī)體驗。
從面向大眾的智能問診、家庭健康助手,到賦能醫(yī)護(hù)的AI導(dǎo)診、臨床輔助診療,再到加速影像分析、提升疑難疾病早篩率的AI閱片技術(shù)——醫(yī)療行業(yè)正悄然發(fā)生變化。
這種變革的背后,依靠的不是技術(shù)本身有多“炫”,而是讓先進(jìn)技術(shù)普及落地。
作為最普及的計算芯片,CPU在將尖端創(chuàng)新轉(zhuǎn)化為日常應(yīng)用中,始終扮演著至關(guān)重要的角色。
無論是智慧醫(yī)療、數(shù)字化工廠,還是精準(zhǔn)農(nóng)業(yè)、未來教育,英特爾至強(qiáng)CPU以持續(xù)進(jìn)化的性能和高性價比,為千行百業(yè)提供了穩(wěn)定的算力底座。
那么,為什么越來越多行業(yè)轉(zhuǎn)型升級都不約而同地選擇了英特爾至強(qiáng)CPU?
醫(yī)療大模型落地,首選至強(qiáng)
提升醫(yī)生的診斷效率,以及出院記錄自動生成,能夠大幅提升患者和醫(yī)生的體驗,這離不開醫(yī)療大模型。
基于惠每科技醫(yī)療大模型構(gòu)建的鑒別診斷應(yīng)用工作流程
實際場景中,醫(yī)生接診病人的時,打開病程記錄并填寫患者主訴及病例特點后,后臺的三個醫(yī)療大模型就會迅速執(zhí)行推理,數(shù)秒后即可生成鑒別診斷結(jié)果,醫(yī)生再根據(jù)自身的專業(yè)意見選擇最優(yōu)結(jié)果,選擇“一鍵回填”或復(fù)制粘貼到病歷相應(yīng)的位置,大幅提升接診效率,患者等待時間明顯縮短。
出院記錄的自動生成也是患者和醫(yī)生都期待的體驗。傳統(tǒng)流程需要醫(yī)院多個部門匯總多類數(shù)據(jù)并形成摘要,過程耗時長且容易出現(xiàn)信息遺漏。
借助醫(yī)療大模型,醫(yī)生打開或保存出院記錄時,會立即觸發(fā)大模型后臺計算,幾秒鐘內(nèi)生成包含出院診斷、入院情況、診療經(jīng)過、出院情況及醫(yī)囑等內(nèi)容的報告。醫(yī)生可一鍵回填,極大提升工作效率,也顯著改善患者體驗。
集成大模型的惠每新一代 AI 大數(shù)據(jù)處理平臺架構(gòu)
這是領(lǐng)先的醫(yī)療人工智能解決方案提供商北京惠每云科技有限公司 (簡稱惠每科技)的臨床決策支持系統(tǒng)(CDSS)已經(jīng)實現(xiàn)的功能,并且可以部署到既有的英特爾架構(gòu)處理器平臺。
這意味著醫(yī)療機(jī)構(gòu)無需采購昂貴的專用加速芯片或服務(wù)器,僅用英特爾至強(qiáng)處理器即可部署醫(yī)療大模型,實現(xiàn)私有化部署,且成本可控,這也是醫(yī)療機(jī)構(gòu)首選至強(qiáng)CPU的主要原因。
成本可控,效果可以保證嗎?答案是肯定的。
大模型通常擁有數(shù)百億至千億參數(shù),對算力和內(nèi)存要求嚴(yán)苛。為了用更少算力實現(xiàn)理想效果,量化成為常用方法。通過將訓(xùn)練好的模型權(quán)重、激活值等從高精度數(shù)據(jù)格式(如FP32)轉(zhuǎn)換為低精度格式(如INT4/INT8),能同時降低算力和內(nèi)存需求。
作為英特爾開源AI框架IPEX的一部分,IPEX-LLM不僅支持多種低精度格式的優(yōu)化,還能基于處理器內(nèi)置指令集(如英特爾AVX-512_VNNI、英特爾AMX)及配套軟件加速推理,大幅提升英特爾架構(gòu)平臺上大模型的推理效率。
惠每科技就使用英特爾AVX-512_VNNI指令集,顯著加速了其醫(yī)療大模型在INT4低精度數(shù)據(jù)格式上的推理。
除了量化優(yōu)化方案,英特爾還借助面向AI推理及部署優(yōu)化的軟件工具套件OpenVINO,為惠每科技打造了非量化優(yōu)化方案。
非量化方案對算力和內(nèi)存要求更高,落地難度大。惠每科技率先利用了第四代英特爾至強(qiáng)可擴(kuò)展處理器首次內(nèi)置的英特爾AMX指令集,在保證精度的同時,提高運算效率、加速推理。
經(jīng)過英特爾與惠每科技的協(xié)同優(yōu)化,無論是醫(yī)療大模型的量化優(yōu)化,還是非量化優(yōu)化方
案,都能在保證精度的前提下有效提升醫(yī)療大模型的推理速度,同時基于英特爾架構(gòu)處理器的部署方案也能幫助醫(yī)療機(jī)構(gòu)有效地節(jié)約成本。
惠每科技CDSS在多家合作醫(yī)療機(jī)構(gòu)部署后,臨床應(yīng)用優(yōu)勢和價值迅速顯現(xiàn)。
惠每科技的統(tǒng)計數(shù)據(jù)顯示,在某合作醫(yī)院的某科室上線1個月后,鑒別診斷應(yīng)用的使用率已達(dá)23%以上,出院記錄自動生成應(yīng)用的使用率達(dá)到15%以上,基于第四代英特爾至強(qiáng)可擴(kuò)展處理器優(yōu)化的醫(yī)療大模型的AI應(yīng)用已獲得醫(yī)生的初步認(rèn)可。
疾病診療全流程,為什么不選GPU?
與惠每科技類似,東軟融入AI技術(shù),能夠為醫(yī)學(xué)影像提供智能診斷、質(zhì)量控制、結(jié)構(gòu)化報告等能力的支撐的PACS/RIS系統(tǒng),也首選了至強(qiáng)可擴(kuò)展處理器進(jìn)行部署,而非性能雖強(qiáng)但成本較高的GPU。
這是因為在醫(yī)療這類成本敏感的場景中,面向AI推理進(jìn)行優(yōu)化的英特爾至強(qiáng)處理器有助于降低成本。同時,部分PACS/RIS場景的AI推理具備批處理特性,對AI推理時延性能不敏感,適合采用CPU進(jìn)行推理。
與惠美科技不同,東軟選擇的是更先進(jìn)的第五代英特爾至強(qiáng)可擴(kuò)展處理器。
相較上一代,第五代英特爾至強(qiáng)可擴(kuò)展處理器可在相同功耗范圍內(nèi)提供更高的算力和更快的內(nèi)存,整體性能提升21%,推理性能提升42%,內(nèi)存速度提升16%,三級緩存提升2.7倍,每瓦性能提升10倍,在滿足性能需求的同時提升系統(tǒng)靈活性并降低總體擁有成本(TCO)。
第五代英特爾至強(qiáng)可擴(kuò)展處理器具備更強(qiáng)大性能
研發(fā)中,東軟智慧醫(yī)學(xué)影像信息系統(tǒng)PACS/RIS在執(zhí)行三維可視化任務(wù)時,發(fā)現(xiàn)其產(chǎn)品在部分應(yīng)用中的性能明顯不足。東軟通過Intel VTune Profiler定位瓶頸函數(shù)并優(yōu)化代碼,提升了三維可視化性能,充分發(fā)揮了第五代至強(qiáng)可擴(kuò)展處理器軟硬件協(xié)同優(yōu)化的能力。
測試數(shù)據(jù)顯示,在處理器開通4并發(fā)8線程時,英特爾至強(qiáng)鉑金8592+處理器(第五代)的性能相較于英特爾至強(qiáng)金牌6430處理器(第四代)和英特爾至強(qiáng)銀牌4210R處理器(第二代)均有明顯提升,其中相比第二代的提升幅度高達(dá)2.45倍。
PACS/RIS 系統(tǒng)的三維重建應(yīng)用運行效率比較
此外,東軟智慧醫(yī)學(xué)影像信息系統(tǒng)PACS/RIS借助內(nèi)置的英特爾AMX加速器以及OpenVINO工具套件,提升了融合的廣泛AI算法的推理效率。
測試結(jié)果顯示,以BF16精度異步推理參數(shù)量較小模型(342,978)及較大模型(31,185,568)時,第五代至強(qiáng)鉑金8592+處理器性能相較第二代銀牌4210R分別提升2.55倍和8.49倍。
BF16 精度下的異步推理性能比較
這充分說明,英特爾至強(qiáng)可擴(kuò)展處理器一直緊跟市場需求,持續(xù)迭代,保證其在滿足更高性能以及AI推理需求的同時,還具備更高部署靈活性和更優(yōu)成本控制能力,能夠承擔(dān)更廣泛負(fù)載。
相較之下,人工智能輔助藥物開發(fā) (AIDD)選擇英特爾至強(qiáng)CPU而非GPU,還有生態(tài)層面的考慮。
對傳統(tǒng)制藥領(lǐng)域“雙十定律”的突破,是AIDD為人津津樂道的優(yōu)勢之一,即它能以短至十?dāng)?shù)月的耗時,及低至以百萬美元計的費用,擊穿過去動輒十年用時加10億美元成本起步的新藥研發(fā)天花板。
AIDD是此前已經(jīng)廣為應(yīng)用的計算機(jī)輔助藥物發(fā)現(xiàn) (CADD)的演進(jìn)與補(bǔ)充,兩者對算力的渴求也都在與日俱增。再考慮到新藥研發(fā)各環(huán)節(jié)的計算特點,它們對算力的需求還有周期性強(qiáng)、峰值需求量高等特點。
雖然目前科學(xué)計算與AI都開始出現(xiàn)通用計算平臺與專用加速芯片并行演進(jìn)的局面,但應(yīng)用歷程更久的CPU平臺相比專用加速芯片,不僅有部署和應(yīng)用基礎(chǔ)更為廣泛的特點,還在總擁有成本 (TCO)、性價比、易用性和易獲取方面有更強(qiáng)的優(yōu)勢,能幫助更多用戶緩解算力緊張的局面。
英特爾與隸屬于美國麻省理工學(xué)院和哈佛大學(xué)的博德研究所,雙方合作聚焦于能從藥物研發(fā)源頭加速的“基因組分析工具包”,即GATK (Genomics Analytics Toolkit)。
此前,英特爾已經(jīng)基于第五代至強(qiáng)可擴(kuò)展處理器進(jìn)行了針對GATK的優(yōu)化,目標(biāo)是讓該工具包能充分利用該處理器微架構(gòu)上的提升,如相比前一代產(chǎn)品 1.5 倍的內(nèi)核數(shù)量、 更高的主頻 (2.3GHz對比2.0GHz)、更強(qiáng)的內(nèi)存子系統(tǒng) (5,600MT/s對比4,800MT/s) 以 及更大的末級緩存容量,并進(jìn)一步釋放其專攻科學(xué)計算加速的指令集— —英特爾AVX-512帶來的性能增益。
至強(qiáng)平臺的持續(xù)革新為GATK帶來持續(xù)的性能優(yōu)化
測試結(jié)果顯示,第五代英特爾至強(qiáng)可擴(kuò)展處理器實現(xiàn)了比上一代平臺高出61%的吞吐量。
在藥物分子發(fā)現(xiàn)與篩選環(huán)節(jié),英特爾至強(qiáng)處理器也發(fā)揮著重要作用。
第三代英特爾至強(qiáng)可擴(kuò)展處理器就對AlphaFold2提供了算力支持與優(yōu)化,第四代英特爾至強(qiáng)可擴(kuò)展處理器發(fā)布后得到進(jìn)一步提升,特別是充分利用了這一代產(chǎn)品內(nèi)置的AI加速技術(shù)——英特爾高級矩陣擴(kuò)展(AMX)。
并且已經(jīng)形成了一套基于第四代英特爾至強(qiáng)可擴(kuò)展處理器、至強(qiáng) CPU Max 系列處理器,以及一系列軟硬協(xié)作的優(yōu)化的完整、易獲取的AlphaFold2端到端解決方案。在一項基于某公有云服務(wù)的測試中,這一方案不但在性能上獲得了遠(yuǎn)優(yōu)于某高端 GPU 平臺的表現(xiàn),同時優(yōu)于由CPU與GPU混合構(gòu)建的方案。
英特爾至強(qiáng)不僅能加速藥物的前期設(shè)計與發(fā)現(xiàn)階段,還解決成藥階的挑戰(zhàn),比如晶型預(yù)測。
某藥物研發(fā)企業(yè)基于C++開發(fā)的晶體結(jié)構(gòu)預(yù)測類應(yīng)用,在至強(qiáng)平臺上實現(xiàn)了軟硬協(xié)同優(yōu)化。在低難度 (LC)、中難度 (MC)、高難度 (HC) 和極高難度 (EC) 四個用例的測試中,多種工具優(yōu)化效果在至強(qiáng)平臺上累加,最高可以換來2.32倍的性能提升,提高研發(fā)效率和投資回報率。
CPU為智能化變革提供強(qiáng)大支持
從加速藥物研發(fā)流程,到提升醫(yī)院的智能化體驗,英特爾至強(qiáng)處理器不僅為生命科學(xué)研發(fā)助力,也是患者就醫(yī)和醫(yī)生接診數(shù)字化體驗的基石。
但英特爾在數(shù)據(jù)中心領(lǐng)域的軟硬件強(qiáng)大能力遠(yuǎn)不止于此。
在傳媒行業(yè),北京中科大洋科技發(fā)展股份有限公司基于第五代英特爾至強(qiáng)可擴(kuò)展處理器出色的算力密度,滿足超高清視頻處理的苛刻要求的同時,無需專門的AI推理服務(wù)器即可實現(xiàn)AI超分、降噪等任務(wù),高效利用現(xiàn)有服務(wù)器資源,節(jié)省總體擁有成本(TCO),降低運維門檻。
在智能制造領(lǐng)域,TCL華星光電充分利用英特爾的端邊技術(shù)能力,構(gòu)建了從設(shè)備端圖像采集到結(jié)果反饋的完整閉環(huán)方案。在生產(chǎn)線檢測和智慧物流方面,TCL華星光電也利用英特爾的硬件產(chǎn)品和云邊端架構(gòu),有效降低了運營成本,并顯著提高了良品率。
在可持續(xù)農(nóng)業(yè)領(lǐng)域,Nature Fresh Farms部署的超過2000個傳感器和攝像頭,實現(xiàn)對每株植物從播種到出廠的全程監(jiān)控。英特爾至強(qiáng)處理器硬件強(qiáng)大的數(shù)據(jù)處理能力,結(jié)合OpenVINO工具套件,利用內(nèi)置加速器進(jìn)行高效AI推理,將原本需兩三小時完成的溫室數(shù)據(jù)收集、處理和分析縮短至30分鐘。
另外,在教育發(fā)展、生態(tài)保護(hù)等領(lǐng)域,英特爾至強(qiáng)也憑借其高效AI算力和軟硬件技術(shù)的解決方案,推動數(shù)字化與智能化普及。
就像是從大型計算機(jī)到個人電腦,靠的是便宜又好用的微處理器,從互聯(lián)網(wǎng)時代再到移動互聯(lián)網(wǎng)時代,變革靠的是技術(shù)成熟、用戶體驗優(yōu)異和硬件成本降低。
如今的生成式AI和數(shù)字化轉(zhuǎn)型時代,同樣需要易于獲得且高性價比的軟硬件解決方案,性能不斷強(qiáng)大的英特爾至強(qiáng)依舊能夠為智能化和數(shù)字化浪潮提供強(qiáng)大助力。