人工智能發(fā)展的現(xiàn)狀調(diào)研
人工智能將在2-3年內(nèi)在國內(nèi)市場形成更大規(guī)模的落地效應(yīng),包括新興領(lǐng)域和傳統(tǒng)行業(yè)。在人工智能落地的動力與瓶頸方面,數(shù)據(jù)問題應(yīng)該受到足夠的重視。隨著人工智能從云到端的發(fā)展,端側(cè)芯片競爭會更為激烈,背后考驗的還有軟件支持、生態(tài)、服務(wù)等因素。
針對AI會在多久之內(nèi)改變企業(yè)和所處行業(yè)發(fā)現(xiàn),有35%的人認為會在2-3年之內(nèi)人工智能將會改變其企業(yè),同時有27%的人認為4-5年內(nèi)人工智能將改變其所處的行業(yè),盡管現(xiàn)在國內(nèi)AI還處于發(fā)展的早期,但是大家對于AI的發(fā)展有較為明確的共識。對于初創(chuàng)企業(yè)來講,競爭時間非常緊張,在未來2-3年,最晚4-5年之內(nèi),需要盡力提升差異化競爭的優(yōu)勢。
根據(jù)調(diào)研分析,企業(yè)用戶選擇AI的首選驅(qū)動因素就是可以提升效率,其次原因為節(jié)約成本,再次為提升用戶體驗、提升數(shù)據(jù)分析能力,還有其他諸如輔助接觸、客戶畫像、差異化服務(wù)等因素。其實AI作為一項通用的技術(shù),未來將滲透到我們生活的方方面面,對于企業(yè)來講,是否能夠真正的用AI理念、技術(shù)去構(gòu)筑核心競爭力,也是未來決勝的一個關(guān)鍵。
2018年AI大規(guī)模落地,碎片化應(yīng)用場景開始廣泛滲透。AI應(yīng)用最多的領(lǐng)域包含消費級產(chǎn)品與服務(wù)行業(yè)(對話式AI)、醫(yī)療行業(yè)(AI輔助影像診斷)、零售行業(yè)(智能貨柜)、制造業(yè)(產(chǎn)品分揀)、金融行業(yè)(反欺詐、對話式客服)、互聯(lián)網(wǎng)行業(yè)(內(nèi)容審核、產(chǎn)品推薦)等;典型的AI應(yīng)用于創(chuàng)新實踐的包含刷臉支付、無人零售、攝像頭、音箱、速記員、視頻換臉、實時翻譯耳機、手持翻譯機、語音助手、電話客服、醫(yī)學(xué)影像診斷、AI-IoT等,這些是一些碎片化的比較典型的應(yīng)用場景,以語音和圖像居多。
現(xiàn)階段,推動AI創(chuàng)新與應(yīng)用落地的因素:大數(shù)據(jù)是基礎(chǔ),算法是核心,芯片是高地,人才是關(guān)鍵,選定垂直的細分領(lǐng)域非常的重要。AI的人才問題相比過去幾十年的發(fā)展,已經(jīng)不是主要的瓶頸,我們國家有勤勉的人才,國家戰(zhàn)略層面也非常重視人才問題?,F(xiàn)在主要探討芯片、算法和數(shù)據(jù),這些已經(jīng)成為限制AI發(fā)展的關(guān)鍵因素。
用戶在開發(fā)使用AI芯片類型的以深度學(xué)習(xí)為代表的AI計算需求,主要是以FPGA、ASIC、GPU這種適合并行計算的通用芯片來實現(xiàn)加速的。隨著產(chǎn)業(yè)環(huán)境的日漸成熟,真正的面向算法,在性能、功耗、面積等方面去進一步優(yōu)化的全定制化芯片會具有越來越大的規(guī)模。隨著AI從云到端的發(fā)展,端側(cè)芯片的競爭會更加激烈,但是從表面看,這些芯片在暗較長短,每一種芯片都有各自的優(yōu)勢和短板所在。其實不存在某一種芯片能夠吃遍所有的應(yīng)用,因為除了芯片,背后考驗的還有軟件支持、生態(tài)、服務(wù)等因素。
ARM的占有率非常高,達到了35%,ARM其實是把握了其核心的價格優(yōu)勢,在此基礎(chǔ)上迅速構(gòu)建生態(tài)。由此來看,在一個新的應(yīng)用來臨之時,往往也是行業(yè)在加速洗牌的時候。有越來越多的初創(chuàng)企業(yè)開始芯片方面的布局,其中的算法公司居多,當(dāng)這些公司真正能夠?qū)崿F(xiàn)軟硬一體化時,對下一步落地應(yīng)用和公司未來的發(fā)展戰(zhàn)略、融資上市等都會有一些幫助。
排名前幾的分別有華為HiKey970為23%、瑞芯微RK3399Pro為21%、威盛Edge AI人工智能開發(fā)套件為13%等。華為HiKey970集成了華為Hi AI框架,以主流的神經(jīng)網(wǎng)絡(luò)架構(gòu)進行深度學(xué)習(xí)算法開發(fā)。瑞芯微RK3399Pro是面向嵌入式應(yīng)用的,是一款arm架構(gòu)的開發(fā)板,集設(shè)計、芯片調(diào)試和芯片驗證與一體。工程師對于開發(fā)套件方面有呼聲比較高的一些建議和期待,如進一步降低開發(fā)難度、開源、更豐富的產(chǎn)品、快速搭建社區(qū)資源等幾方面。
算法是AI的基礎(chǔ)和核心。從調(diào)研結(jié)果分析來看,背后有g(shù)oogle強大支撐的TensorFlow處于領(lǐng)先狀態(tài),市占率達到23%。第二名是背后有Facebook支持的PyTorch,市占率達到13%,它雖然還很年輕,但可以支持TensorFlow不支持的一些定制,所以發(fā)展非常的迅速。第三名是占比達到9%的caffe2,也是Facebook的另一款開源產(chǎn)品。
算法框架同樣凸顯了生態(tài)資源的拉動效應(yīng),我們也期待未來在核心前沿的領(lǐng)域能夠有更多的中國算法框架上榜。現(xiàn)在即將進入人和AI協(xié)作的時代,人機交互走向自然人機交互,最終目標是實現(xiàn)人機協(xié)同。自然人機交互中界面并不是最重要的因素,貫穿于人機交互發(fā)展始終的是用戶體驗,像語音交互技術(shù)逐步發(fā)展,從單輪到多輪對話,合成語音更為自然、真實的接近真人水平。
人臉、手勢等更多通道出現(xiàn),多通道的融合交互成為未來主流。像觸控、語音、手勢、人臉等最有可能成為多通道融合的主流通道,甚至觸覺、嗅覺也有可能納入多通道交互中。
人機協(xié)同就是通過感知、認知決策,最終實現(xiàn)從真實世界到數(shù)字世界的技術(shù)閉環(huán)。現(xiàn)階段機器與人的協(xié)作是從識別人開始,我們所做的事情就是通過人臉識別、聲音識別給設(shè)備裝上眼睛、耳朵。目前的熱點技術(shù)如前端快速識別、遠距離大規(guī)模識別、3D的精細化建模、多模態(tài)識別交互等均為人機協(xié)作的初級階段。 終極目標是通過融合交互提升機器的智能化,讓機器更懂你,交互更自然。