英特爾AI策略全解析(2):軟件的優(yōu)化提供強(qiáng)大效能
想要在AI占有一席之地,英特爾單靠處理器的硬件并不足以搶市,透過軟件的優(yōu)化提供強(qiáng)大效能,以及增進(jìn)開發(fā)應(yīng)用系統(tǒng)的便利性,將是布局能否成功的關(guān)鍵
上篇:英特爾AI策略全解析(1):延伸四大產(chǎn)品線
【英特爾強(qiáng)化AI軟件應(yīng)用的4大層面】英特爾對于AI應(yīng)用的支持,首先是處理器內(nèi)建低階軟件原始指令,例如MKL-DNN;針對深度學(xué)習(xí)軟件框架,提供優(yōu)化程序代碼;對于大數(shù)據(jù)分析應(yīng)用平臺,投入Hadoop、Spark的版本提供或貢獻(xiàn)程序代碼;而在集成軟件開發(fā)工具,他們也推出Deep Learning SDK。
圖片來源:iThome
看好人工智能帶來的運(yùn)算處理需求與未來的蓬勃發(fā)展,英特爾不只是推出多種服務(wù)器端處理器來因應(yīng),在2016年11月舉行的Intel AI Day活動期間,他們宣布將更積極發(fā)展深度學(xué)習(xí)應(yīng)用的運(yùn)算與溝通處理的鏈接庫,并以基本指令(primiTIves)的形式整合到處理器硬件上。而在AI應(yīng)用軟件開發(fā)的支持上,他們陸續(xù)開始提供的部分,包含:鏈接庫、程序語言的支持、平臺、軟件開發(fā)工具包、程序開發(fā)框架。
無獨(dú)有偶,IBM與Nvidia也在11月宣布,雙方將連手開發(fā)新的深度學(xué)習(xí)專用軟件開發(fā)工具包PowerAI,可搭配IBM 專為AI應(yīng)用所特別設(shè)計(jì)的服務(wù)器——OpenPOWER LC(采用Power運(yùn)算架構(gòu)與Nvidia NVLink互連技術(shù)),藉此提供企業(yè)級的深度學(xué)習(xí)解決方案。
英特爾在Intel AI Day提出人工智能的策略,正巧IBM與Nvidia也在之前宣布了PowerAI,在那一周期間,同時,又適逢全球高效能運(yùn)算界關(guān)注的SuperComputer 2016大會舉行。顯然兩大陣營爭相較勁的意味相當(dāng)濃厚,而且他們最終競逐的目標(biāo),其實(shí)都是下一波企業(yè)應(yīng)用。
英特爾AI解決方案總覽
在AI應(yīng)用的布局上,英特爾不只是單純提供處理器平臺,軟件的支持更是重點(diǎn)——他們發(fā)展多種鏈接庫、軟件開發(fā)平臺,積極支持多種深度學(xué)習(xí)應(yīng)用框架,同時也會推出整合式的解決方案。
積極支持多種深度學(xué)習(xí)框架,陸續(xù)提供IA架構(gòu)效能優(yōu)化的程序代碼以發(fā)展AI應(yīng)用系統(tǒng)所采用的各種程序開發(fā)框架為例,英特爾承諾,將針對在Intel Architecture運(yùn)算架構(gòu)(IA)的系統(tǒng)環(huán)境,提供經(jīng)過優(yōu)化的程序代碼,以提升執(zhí)行效能。
例如,在深度學(xué)習(xí)技術(shù)的應(yīng)用領(lǐng)域當(dāng)中,較為風(fēng)行的幾種開放原始碼軟件框架(Deep Learning Framework),像是Caffe、Theano、Torch、MXNet、Neon,英特爾已經(jīng)提供Intel Architecture優(yōu)化程序代碼。至于TensorFlow的部分,英特爾與Google Cloud Platform在11月的Intel AI Day活動上,正式宣布策略合作后,最快于2017年初,才會釋出相關(guān)的程序代碼。
Caffe
這是由美國柏克萊視覺與學(xué)習(xí)中心(BLVC)所開發(fā)的框架,英特爾提供了特制版本Intel OpTImized Caffe,可適用于Xeon與Xeon Phi處理器平臺,當(dāng)中整合了英特爾發(fā)展的數(shù)學(xué)核心鏈接庫MKL(Math Kernel Library),并且已針對AVX2和AVX-512指令集,進(jìn)行軟件效能優(yōu)化的工程。
而Caffe經(jīng)過改良的成效如何?英特爾提出的實(shí)例,是影音服務(wù)業(yè)者樂視云(LeTV Cloud)的非法影片偵測應(yīng)用。他們是在Xeon E5-2680 v3服務(wù)器平臺上,搭配Intel OpTImized Caffe來進(jìn)行影片分類的訓(xùn)練,結(jié)果得到了30倍的效能提升(相較于他們先前使用的BLVC Caffe,搭配OpenBlas鏈接庫作為卷積式類神經(jīng)網(wǎng)絡(luò))。
Theano
它是由加拿大蒙特婁大學(xué)LISA實(shí)驗(yàn)室發(fā)展的深度學(xué)習(xí)框架,英特爾也提供了改良的鏈接庫,是針對多核心運(yùn)算環(huán)境予以優(yōu)化而成的版本,而在京都大學(xué)大學(xué)院醫(yī)學(xué)研究科的應(yīng)用案例當(dāng)中,當(dāng)他們以此進(jìn)行新藥探索模擬運(yùn)算的測試上,精準(zhǔn)度最高可達(dá)到98.1%,而另一個深度學(xué)習(xí)網(wǎng)絡(luò)(Deep Belief Networks,DBN)的測試當(dāng)中,也獲得8倍的效能增長。
Torch
Torch也是許多人很關(guān)注的深度學(xué)習(xí)框架之一,目前主要維護(hù)的成員,是來自Facebook、Twitter、Google DeepMind公司的研究科學(xué)家和軟件工程師。英特爾對這套框架提供優(yōu)化支持之余,同時整合了MKL鏈接庫,進(jìn)而針對服務(wù)器硬件端執(zhí)行的深度神經(jīng)網(wǎng)絡(luò)指令集,提升效率。
而在這樣的環(huán)境搭配下,英特爾舉出的例子是他們與Pikazo軟件公司合作,針對他們開發(fā)的圖像風(fēng)格轉(zhuǎn)換App,協(xié)助后端處理效能強(qiáng)化——若以App剛推出的效能作為基準(zhǔn),現(xiàn)在Pizako App在圖形上色(render)的速度,可提升到28倍,而能夠處理的圖檔尺寸也擴(kuò)充到15倍之大。
Neon
Neon是英特爾并購的Nervana Systems公司所發(fā)展出來的鏈接庫,強(qiáng)調(diào)易用與高效能,在其現(xiàn)有的技術(shù)架構(gòu)當(dāng)中,可區(qū)分為深度學(xué)習(xí)功能(算法)、數(shù)據(jù)模型、解決方案等三層。
在這次的Intel AI Day大會上,英特爾也預(yù)告將推出Intel Nervana Graph Compiler,作為AI應(yīng)用軟件層的共通基礎(chǔ),以此對于深度學(xué)習(xí)應(yīng)用的架構(gòu)型態(tài),提供更進(jìn)階的描繪方式,以及調(diào)校作法。
針對類神經(jīng)網(wǎng)?絡(luò),提供高階的圖學(xué)運(yùn)算編譯程序
深度學(xué)習(xí)框架Neon對于硬件資源的存取,會透過不同平臺的轉(zhuǎn)換API來介接,因此上層應(yīng)用無須考慮硬件差異,接下來,英特爾會在Neon原本的架構(gòu)與硬件轉(zhuǎn)換層之間,新增一層Nervana Graph Compiler,主要是為了針對類神經(jīng)網(wǎng)絡(luò)應(yīng)用,提供高階的處理,以便同時橫跨多臺硬設(shè)備執(zhí)行。