【科大訊飛1024開發(fā)者節(jié)】劉慶峰再談人機耦合,胡郁發(fā)布1024計劃
按:10月24日,以“智匯世界·聲動未來”為主題的「首屆世界聲博會暨2018科大訊飛全球1024開發(fā)者節(jié)」在科大訊飛總部所在地合肥舉行,也受邀參加活動。zai科大訊飛在大會上一再強調(diào)了“人機耦合的戰(zhàn)略早已有之,并將繼續(xù)”,曬出今年比賽成績單,公布了“1024計劃”,并發(fā)布了一系列生態(tài)產(chǎn)品。
本次大會,公布了“1024計劃”的三大計劃,包括:
AI教引計劃2.0
AI生態(tài)計劃2.0
AI公益計劃2.0
發(fā)布了iFLYOS+六大平臺,包括:
iFLYOS
iFLY家居平臺
iFLY機器人平臺
iFLY車載平臺
iFLY客服平臺
iFLY醫(yī)療平臺
iFLY營銷平臺
科大訊飛董事長劉慶峰細數(shù)了科大訊飛走過的經(jīng)歷,在世界性語音競賽中屢屢奪冠,機器翻譯達到英語六級水平,分析了人工智能時代“萬物互聯(lián)”和“數(shù)據(jù)驅(qū)動”兩大趨勢,并一再強調(diào)了人機耦合在語音技術(shù)中的重要性。
以下為整理的會議部分內(nèi)容。
科大訊飛董事長劉慶峰:AI是大勢所趨,人機耦合仍是關(guān)鍵
2016年,我們在歷史上第一次用認知智能,使得機器在作文評分和口語評分中超過了人類老師;2017年我們是全世界第一個讓機器通過了國家執(zhí)業(yè)醫(yī)師資格考試,以456分的高分超過了96.3%的人類考生,從而使得人工智能首次具備了全科醫(yī)生的潛質(zhì)。今年三月份在合肥醫(yī)療機器人開始投入使用,開始只能看150多種病,現(xiàn)在已經(jīng)可以看到300多種病,我們期待今年底能夠看到上千種病,真正成為一個不斷學(xué)習(xí)進步的全科醫(yī)生?,F(xiàn)在我們的翻譯水平也達到甚至超過了大學(xué)英語六級的水平。
萬物互聯(lián)+數(shù)據(jù)驅(qū)動
我們現(xiàn)在可以看到,人工智能時代有兩個非常重要的趨勢:萬物互聯(lián)和數(shù)據(jù)驅(qū)動。
萬物互聯(lián)是最近兩年全球消費電子展、世界互聯(lián)網(wǎng)發(fā)展報告都能明確看到的大趨勢,作為IT產(chǎn)業(yè)的第六次浪潮,越來越多的穿戴式設(shè)備、智能家居、便攜終端和車載設(shè)備開始普及。在此過程中,隨著中國5G建設(shè)即將大規(guī)模到來,更將大力推動萬物互聯(lián)時代的發(fā)展,將會比手機為代表的移動互聯(lián)網(wǎng)時代的終端數(shù)呈現(xiàn)十倍以上的增長。而在這個領(lǐng)域,人們對更自然的人機交互也會提出更高的要求。
隨著人工智能時代的蓬勃發(fā)展,基于數(shù)據(jù)驅(qū)動技術(shù)進步的應(yīng)用發(fā)展成為社會非常重要的方式。數(shù)據(jù)驅(qū)動要求我們在數(shù)據(jù)匯聚的同時,進一步對用戶的隱私保護提出了越來越高的要求,全世界范圍內(nèi)都在高度關(guān)注。我們在今年的兩會,科大訊飛就代表我作為全國人大代表專門提出來了關(guān)于建立國家用戶隱私保護法的議案,萬物互聯(lián)和數(shù)據(jù)驅(qū)動所帶來的后臺技術(shù)要求也越來越高。
在萬物互聯(lián)的大背景下,我們需要適應(yīng)越來越多不同年齡的用戶,比如我們的父母親、爺爺奶奶、小朋友們都要開始使用,因此對于噪音、口音、方言,對于遠距離的識別,提出來越來越高的要求。語音識別對我們今天在座的眾多開發(fā)者來說,如果要做到萬物互聯(lián)中真正的好用、解決剛需,而不是噱頭,它的技術(shù)門檻會進一步抬高,而不是技術(shù)門檻變低。
今年9月7日剛剛揭曉的英文語音識別大賽,面對遠距離、噪音、多人說話的場景國際英文識別比賽,組委會根據(jù)最新的國際算法給了一個基線系統(tǒng),因為噪音特別大,所以基線系統(tǒng)的錯誤率是80%,國際著名機構(gòu)基本都參加了,很多單位都沒有達到基線系統(tǒng)的要求。而科大訊飛在所有四項指標都是全世界第一名,而且超過基線系統(tǒng)40分的準確率,我覺得給中國在語音領(lǐng)域進一步贏得了全世界的尊重。我們把最新的語音識別系統(tǒng)用在我們的訊飛聽見以及我們與開發(fā)者合作的未來參考方案和開放平臺中。
本地&隱私
在今天我們面對萬物互聯(lián),我們需要能聽會說、能理解會思考更多的技術(shù)方案,那么用戶隱私保護怎么辦?企業(yè)當然要自律、要有內(nèi)部的規(guī)則,要遵守國家法律、要尊重用戶、尊重市場規(guī)律,國家要立法,同時我認為技術(shù)進步賦予用戶的選擇權(quán)也非常重要。所以我們在業(yè)界率先推出了離線語音識別,在訊飛的輸入法中如果你不愿意語音的數(shù)據(jù)送到后臺,可以直接選擇離線識別,全在自己本機上,當然我們后臺在線的數(shù)據(jù)是工信部直接頒布的叫“安全可靠語音云”專門給我們進行了鑒定和認證、保護用戶隱私的。但如果大家覺得不放心本地語音合成我們想要朗讀出來的各種聲音,甚至我們可以模仿你女朋友的聲音讀她給你的EMAIL,你不想讓別人知道,自己聽,離線語音合成還有離線翻譯。今天的系統(tǒng)中所有翻譯都是離線的,都是我們在本地一個小小的設(shè)備上實現(xiàn)的。
2015年12月,科大訊飛推出聽見系統(tǒng)之后,很多廠商在跟風(fēng)學(xué)習(xí),但到目前為止,我們看到在各種重大會議場合下的其他友商的產(chǎn)品沒有一個是離線的,都是要到后臺大規(guī)模服務(wù)集群來計算,只有訊飛今天真正地推出了離線翻譯系統(tǒng)。因此在這樣一個公開場合下我們的系統(tǒng)能用,在內(nèi)部開會的保密場合下我們跟老外交流一樣可以用,我們也可以用在外交部等涉密場合,這是我們科大訊飛技術(shù)給我們消費者和用戶所帶來的選擇權(quán)。
AI是大勢所趨
光有技術(shù)當然不代表一切,我們說歷來只有偉大的產(chǎn)品,偉大的技術(shù)必須通過偉大的產(chǎn)品來落地,人工智能真正發(fā)展需要源頭技術(shù)廠商、需要開放平臺、更需要所有創(chuàng)業(yè)者協(xié)同努力,還需要社會的倫理、人文和法律體系的配套。它絕不是單個企業(yè)和單個科研院所的工作、少數(shù)科學(xué)家的工作,是涉及到整個人類的,它將是一個偉大的歷史進程,涉及到社會生活的方方面面。不光是科大訊飛,我們認為隨著技術(shù)在各種專業(yè)有數(shù)據(jù)、有邏輯規(guī)律可循的場合,會大量替代現(xiàn)有的工作崗位,提升現(xiàn)有的工作效率。國際主流的科技媒體和綜合媒體也都有這樣的評述,比如說科學(xué)雜志就預(yù)測說2045年之前全世界50%的現(xiàn)有工作會被人工智能替代,我們在多個場合都跟大家都介紹過,中國這個數(shù)據(jù)是77%,這是科學(xué)雜志的預(yù)測。而BBC預(yù)測人工智能對當前365個行業(yè)的替代率給了一張專門的表。很多人說是不是過于夸大了,我今天告訴大家,只要有數(shù)據(jù)、有規(guī)律可循的領(lǐng)域,機器代替人50%、77%,根本不用等到2045年,未來十年之內(nèi)就將變成現(xiàn)實。所以我們每個人今天都應(yīng)該關(guān)注人工智能,我們每個創(chuàng)業(yè)者都應(yīng)該了解人工智能的大趨勢,我覺得這是必然的趨勢。
當然我們拒絕神話,要知道,因為人工智能還剛剛起步,所以我們在發(fā)展過程中也碰到了各種各樣的情況??拼笥嶏w作為首批入選四大國家人工智能平臺,我們的發(fā)展也受到了各種各樣的討論,甚至有很多行業(yè)跟訊飛溝通探討機器和人的關(guān)系,大家也有顧慮有擔心。但我想人工智能現(xiàn)在這種大勢所趨,其實不是一個人和一個行業(yè)能夠阻擋得了的。就像當年英國的紅旗法案對汽車的限制一樣,最后汽車沒有限制住,還使得英國在汽車工業(yè)上整整落后了30年、耽誤了30年。而人工智能的大潮絕不是我們某個行業(yè)某個個人想阻擋就可以阻擋得了的,即便中國不做,全世界也會做。所以我們只有順應(yīng)這個時代,用好人工智能才是當前的明智之舉。
人機耦合仍是長久共識
在2015年底我們發(fā)布了訊飛聽見,16、17年有很多的數(shù)據(jù)公司對科大訊飛其實是有敵意的,但是現(xiàn)在我們發(fā)現(xiàn),科大訊飛的聽見平臺給大家?guī)砹嗽絹碓蕉嗟牧髁?,給大家?guī)砹嗽絹碓蕉嗟纳?,現(xiàn)在也有越來越多的轉(zhuǎn)寫數(shù)據(jù)公司成了科大訊飛生態(tài)體系的一部分,大家的業(yè)務(wù)量比原來更多更大了,因為原來有很多沒有錢、沒有條件來接受轉(zhuǎn)寫服務(wù)的個人和機構(gòu)。現(xiàn)在開始有這樣的需求了,激活了一個更大的市場,使得原來的轉(zhuǎn)寫公司可以有更多的生意,我想這是一個大勢所趨,大家應(yīng)該協(xié)同起來共同面對這樣一個偉大的歷史進程。
在這個過程中,人機耦合是人工智能系統(tǒng)應(yīng)用落地的關(guān)鍵,即便在各種行業(yè)領(lǐng)域有數(shù)據(jù)和規(guī)律可循,我們也需要最好的人工智能算法、行業(yè)數(shù)據(jù)和應(yīng)用專家共同的打磨。為什么我們通過醫(yī)考機器人的考試?因為我們有很多醫(yī)學(xué)專家,我們跟協(xié)和醫(yī)學(xué)院、跟安徽省立醫(yī)院簽訂的戰(zhàn)略合作協(xié)議,現(xiàn)在安徽省立醫(yī)院已經(jīng)是中國科技大學(xué)第一附屬醫(yī)院了。
從技術(shù)發(fā)展中來看,從最早的人工智能最容易做到的是信息完全充分、規(guī)則完全透明的場合,比如圍棋。稍微難一點的是信息半充分,比如打麻將,當然還有很多領(lǐng)域包括規(guī)則在變化中,比如考試作文,同樣一篇中文,對小學(xué)生、對高中生、對大學(xué)生同樣作文打分應(yīng)該分值是不一樣的,它有不同的體系;信息完全自由,比如說創(chuàng)意,比如說有很多憑直覺和靈感的決策的場所,所以人工智能技術(shù)進化路徑就要面對這樣的信息情況不斷變化、規(guī)律不斷模糊,以及機器從監(jiān)督訓(xùn)練到無監(jiān)督訓(xùn)練自主進化的這樣一個發(fā)展路徑。
在這個過程中,人和機器的深度耦合才是真正的推動人工智能應(yīng)用落地的關(guān)鍵,這個不僅是科大訊飛三年前就確定的核心技術(shù)研究路線,如何研究人工智能時代人和機器的耦合也是我們跟很多合作伙伴共同探討的方向,同時我也認為是人工智能時代社會倫理和人文發(fā)展的需要,我們不能讓機器完全代替人,我們要讓每個人都站在人工智能的平臺之上從而享受人工智能,這也是人機耦合的我們內(nèi)在的精神動力。去年科大訊飛18周年成人禮上,我們都對未來有一段寄語,我們寫給2029年科大訊飛三十而立的時候,我們認為世界將會怎樣?訊飛將會怎樣?我們個人將會怎樣?當然這個東西我們都封存起來,到2029年才會打開,其中有一條我就寫到了人機耦合,我希望到2029年我作為董事長的工作有80%是機器幫我做的,20%是我來做決策的、做判斷的,是一個典型的在企業(yè)治理和董事長決策過程中的人機耦合系統(tǒng),是科大訊飛未來要建信息化系統(tǒng)的一個非常重要的標志。我們昨天還跟全世界最頂尖的人力資源公司在探討如何用人機耦合來推動我們的人力資源管理和內(nèi)部的管理決策。
那么關(guān)于人機耦合,我再給大家說一下關(guān)于翻譯的例子,因為最近大家關(guān)注很多,其實在去年10月21號,科大訊飛就跟上海外國語大學(xué)高翻學(xué)院建立了聯(lián)合實驗室,探討人機耦合的機器翻譯應(yīng)用模式,寫在協(xié)議中的最關(guān)鍵的詞就是人機耦合。經(jīng)過一年左右的發(fā)展,我們做了45個實驗, 45個實驗報告,92個產(chǎn)品改進的建議,我們可以看到有一組的數(shù)據(jù),我們挑出其中兩個給大家看,一個是口譯信息的完整度,上海外國語大學(xué)高翻學(xué)院的學(xué)生都是培養(yǎng)出來都是中國最頂尖的同傳,他們這些學(xué)生的最終驗證結(jié)果是口譯信息的完整度從80%提升了97%。我們可以看到我在說話的時候,我們的機器實時的進行了翻譯,我的速度很快,如果是一個同傳人工來做,他可能會抓住我的主要內(nèi)容但一定會漏掉很多,因為他來不及,又要記又要說,關(guān)鍵的核心是數(shù)據(jù)和信息機器全自動把他轉(zhuǎn)寫出來,給我們的同傳人員去看的時候就可以防止丟失信息,這是一個專門的訊飛同傳助手的設(shè)備。
在本屆世界人工智能大會在上海召開的時候,在同傳的盒子里面我們就放了設(shè)備,跟上海外國語大學(xué)一起做的,可以看到對口譯信息完整度從88提升到97%,而工作壓力降低了80%,這都是有實驗數(shù)據(jù)在整個過程中做支撐的。所以大家可以看到最近上海外國語大學(xué)高翻學(xué)院的院長,張愛玲院長也是一個我非常尊重的翻譯大家,專門撰文寫道,他認為人機耦合是為了不可阻擋的趨勢。那么我們再看一下。在中國翻譯界可以說是最有名的頂尖專家之一、前聯(lián)合國日內(nèi)瓦口譯司的司長,在今年的8月份在上海外國語大學(xué)舉行的同傳挑戰(zhàn)賽中,我們的機器也參加了,他非常驚訝于我們技術(shù)的進展,然后這是他的原話,說真正好的翻譯是會使用機器的翻譯,而不是被機器替代的翻譯,如果我們不能阻止趨勢,我們應(yīng)該引導(dǎo)趨勢順勢而為,我想這就是我們今天整個社會各界應(yīng)有的心態(tài):誰率先適應(yīng)這個時代的潮流,誰就可以站在時代的風(fēng)口浪尖之上,成為未來的人生贏家。
人機耦合也正在成為全球的共識,比如說科大訊飛跟MIT計算機和人工智能實驗室,簽訂戰(zhàn)略合作協(xié)議,其中非常重要的內(nèi)容就是研究腦科學(xué)和數(shù)學(xué)建模方法的結(jié)合以及未來人機耦合的模式。斯坦福大學(xué)李飛飛從谷歌回到斯坦福,最近專門成立了以人為本的人工智能研究院,也是在推動人和機器的融合。我想人機耦合正在成為全球的共識,因此這是科大訊飛多年以來的結(jié)論,我們兩年前就提了理念,不僅僅是技術(shù)發(fā)展趨勢,更是社會倫理的發(fā)展要求。比人類更強大的不是AI,而是掌握了AI的人類,我們會按照這個路徑持續(xù)不移的、堅定不移地推動我們的研究產(chǎn)品以及我們科大訊飛的社會責任。
科大訊飛執(zhí)行總裁胡郁:1024計劃+AI Enable生態(tài)產(chǎn)品
剛才劉慶峰董事長介紹了科大訊飛最近在人工智能核心技術(shù)上取得一些突破性進展。除此以外,我們還取得了非常多的新的成績,我們剛剛在CityScapes測試全部兩項任務(wù)中囊括了冠軍。CityScapes主要測試人在開車過程中所接受到的所有信息,能不能自動對場景、看到的物體進行分類和判斷。
技術(shù)之外:全球化節(jié)點覆蓋+大數(shù)據(jù)超算中心+云原生計劃架構(gòu)
關(guān)于人工智能的劃分,我們說有計算智能,感知智能、運動智能和認知智能。認知智能是說人類具有理解語言、知識表達、復(fù)雜邏輯推理和最終決策的能力,國際上在這個方面也有非常高水平的評測。我們在今年國際語義的識別大賽也取得了很好的成績。在24個參賽隊伍中,我們擊敗了其他參賽隊伍,最終獲得了84.13%的準確率。在圖像識別方面,今年我們又將醫(yī)療領(lǐng)域擴展到糖網(wǎng)病的微動脈瘤的分割任務(wù),我們獲得了血管瘤比賽的第一名,以上都說明科大訊飛的核心技術(shù)在國際處于領(lǐng)先水平。
我們提供給開發(fā)者的技術(shù)不止這些。我們的星云計劃一方面連接開發(fā)者,另一方面連接國內(nèi)外最好的核心技術(shù)研究團隊,將他們的成果整合在我們的開發(fā)者平臺上。根據(jù)現(xiàn)在訊飛擁有的40多個分布在全球各個國家的聯(lián)合實驗室,以及和我們有戰(zhàn)略合作的研究機構(gòu),越來越多世界領(lǐng)先的核心技術(shù)通過我們的星云計劃不斷接入。
我們現(xiàn)在核心技術(shù)總量已經(jīng)達到了153種,然而,光有好的核心技術(shù)并不代表著我們在產(chǎn)品中使用得順暢,我們從三個方面進行了深入的打造,以提升平臺整體的能力。
全球化的節(jié)點分布。我們在北京、上海、合肥、廣州、香港、新加坡、洛杉磯、愛爾蘭都設(shè)定了云計算的分節(jié)點;
大規(guī)模超算中心。同時也在合肥(科大訊飛總部)建立了1.5萬平米的大數(shù)據(jù)中心,現(xiàn)在的運算速度已經(jīng)超過兩億億次每秒,而且單臺最大的服務(wù)器的數(shù)量超過了20個TOPS,內(nèi)存帶寬約為16TB/s;
云原生計算架構(gòu)?;谠圃嬎慵夹g(shù)??焖贅?gòu)建AI云平臺,高效地支撐153項AI能力的快速構(gòu)建與穩(wěn)定運行。
科大訊飛從2010年第一次發(fā)布訊飛語音云平臺開始一直致力于通過更多形式的組合,例如我們考慮過嵌入式軟件、芯片、云計算、軟硬一體,考慮過整體的解決方案和成品級的硬件平臺(AIUI)。去年和今年國際上大的提供商還宣稱他們剛剛能夠提供全雙工的智能語音交互的平臺,而AIUI在2015年已經(jīng)向整個行業(yè)開放了。我們還提出過iFLY inside,希望iFLY inside的所有產(chǎn)品將來能夠非常好地在各個情況下使用。我們在前年和去年也發(fā)布了魔飛麥克風(fēng),軟硬件一體高度集成化的產(chǎn)品,讓很多場景下智能語音能力的基層變得非常簡單、容易。
在這些不同解決方案的引導(dǎo)下,我們也制定了面向開發(fā)者的提升計劃。首先就是三大計劃:教引計劃、生態(tài)計劃和公益計劃。
教引計劃是為了保證所有開發(fā)者可以更好地學(xué)習(xí)到我們所提供的各種各樣的環(huán)境,生態(tài)計劃是為了保證所有的開發(fā)者能夠在整個生態(tài)里和訊飛一起成長;公益計劃是希望所有的開發(fā)者能夠和我們一起用愛心鍛造AI,服務(wù)社會。
AI教引計劃。為了讓更多的人擁有可以實現(xiàn)的夢想,我們在過去的一年中推出了一系列關(guān)于教引計劃的內(nèi)容。例如AI大學(xué),現(xiàn)在AI大學(xué)的學(xué)生已經(jīng)超過24萬人,有超過100節(jié)以上的線上課程,簽約教授達到55位。在AI大學(xué)里面我們提供了豐富的內(nèi)容,例如線上課程、未來課棧、精品課堂、技術(shù)專業(yè)課和AI公開課和AI創(chuàng)業(yè)課,這些豐富的素材為我們的開發(fā)者們提供全方位引導(dǎo)。
我們也在另外兩個方面建立更加全面的體系,一方面我們和高校聯(lián)合培養(yǎng)在校生,我們已經(jīng)通過和北大、清華、中科大、浙大、安大等20學(xué)校的聯(lián)系,進行了27個AI創(chuàng)學(xué)社。另一方面,我們還與一系列做創(chuàng)新者孵化的品牌聯(lián)合培養(yǎng)開發(fā)者,包括線上的公開課、持續(xù)模擬、在線答題、結(jié)業(yè)證書等方面的合作,這些品牌包括大街、發(fā)條、啟迪之星和愛課程。
AI生態(tài)計劃。在這種教育計劃的培訓(xùn)下,越來越多的人能夠接觸到科大訊飛AI生態(tài)計劃,我們要讓更多的AI夢想更好、更快地被開發(fā)出來,這里面包括我們現(xiàn)在做的AI眾創(chuàng)空間。我們提供場地、支持優(yōu)惠的政策、公共的平臺和創(chuàng)投的資金。現(xiàn)在線下創(chuàng)業(yè)平臺入駐企業(yè)已經(jīng)超過了600家,智能科技的產(chǎn)業(yè)規(guī)模超過了800億,帶動就業(yè)人數(shù)超過了3萬人。所以說科大訊飛并不完全是一個在網(wǎng)上向大家提供服務(wù)和能力的公司,我們在線上線下有同樣的內(nèi)容。
另外還有AI生態(tài)沙龍。很多AI開發(fā)者都希望自己開發(fā)的產(chǎn)品能夠被更多的人使用,這包括很多大型企業(yè),比如說國企。通過AI生態(tài)沙龍,我們將好的投資機構(gòu)和好的開發(fā)者聯(lián)系在一起,我們連接的投資機構(gòu)數(shù)量超過了360家,現(xiàn)場參與觀眾超過了6000人,連接創(chuàng)業(yè)的項目達到了400多個。在北京、上海、杭州、天津、長春等十個城市,AI生態(tài)沙龍都蓬勃開展。
我們在這些AI開發(fā)者當中選出來杰出代表,在今天下午會有一個頒獎典禮,和我們AI大的頒獎典禮一起舉行。我們一共選出54個鉆石團隊,有13個在過去的一年中獲得了融資,總估值現(xiàn)在已經(jīng)超過了60億元,AI創(chuàng)業(yè)的土壤中會長出越來越多的明星企業(yè)。
我們新的獨角獸除了AI團隊非常優(yōu)良以外,科大訊飛去年剛開設(shè)的AI服務(wù)市場,將我們的開發(fā)者和to B的需求方對接在一起。在這個方面我們連接所有對AI有需求的企業(yè)客戶,提供品牌和商業(yè)的支持、提供超過180個方案。我們的開發(fā)者中有很多人直接研發(fā)to C產(chǎn)品,也有很多的開發(fā)者研究的是to B產(chǎn)品,我們希望平臺能夠為to C的產(chǎn)品提供品牌銷售渠道和供應(yīng)鏈方面的支持,同時也希望我們的生態(tài)平臺能夠為to B開發(fā)者提供大企業(yè)客戶、投資方等各個方面。只有這樣,我們to C和 to B這兩種商業(yè)模式和整個生態(tài)才能足夠完善,也可以幫助到更多的創(chuàng)業(yè)者和開發(fā)者。
AI公益計劃。AI公益計劃主要是讓更多的人從AI受益,而且讓世界有更多的愛。過去的一年我們的成果首先是我們的方言保護計劃,已經(jīng)有500萬人參加了方言保護計劃的活動,有10萬人上傳了方言語音,我們得到的方言語音條數(shù)超過了20萬條。語音識別方面我們新增了蘇州話識別,在目前我們提供的23個方言語音的識別中,有8個以上的識別正確率超過了90%,剩下的都超過了80%。大家可以看到,在訊飛輸入法里方言識別的使用量越來越多,大家可以非常方便地用自己的母語、家鄉(xiāng)話來實現(xiàn)問候和信息輸入。
三聲有幸計劃是我最覺得自豪和驕傲的一個。從經(jīng)濟利益的角度來講,我們所做的產(chǎn)品應(yīng)該覆蓋最大的人群一定是年輕人、健康的人,我們的先進技術(shù)其實可以幫助社會上很多最需要關(guān)注的人,三聲有幸計劃就是從這個出發(fā)點。
我們一個合作伙伴叫音書科技,服務(wù)了近40萬的聽障者、10所聾啞學(xué)校,成為聾人和外界溝通的一座橋梁,聽到這個消息我特別的興奮,因為我們的技術(shù)真正可以使我們的社會變得更美好。除此之外我們還有心智互動合作,累計服務(wù)6萬的視力障礙者,他們主要是通過語音合成,讓視力障礙者使用互聯(lián)網(wǎng)。
今年我們還做了AI教育公益。在過去的一年當中,我們利用在教育領(lǐng)域的先進技術(shù),走進了西藏,四川,河南,新疆等地,直接捐贈了超過700萬元的設(shè)備,給很多的農(nóng)村學(xué)校的孩子們帶去了歡樂。大家都知道中國的教育資源是不均勻的,在很多貧窮和落后的地區(qū)需要我們做大量的工作。評價一個公司成功與否,可以從銷售收入、產(chǎn)值,但是我覺得企業(yè)能夠帶來什么樣的社會責任感,將來也會成為評價企業(yè)一個非常重要的標準。我也希望在座所有的開發(fā)者能夠和我們一起,盡到對社會的責任心。
未來:交互方式、研發(fā)模式、產(chǎn)品形態(tài)
要知道我們將來做什么,我覺得非常重要的一點:要能夠預(yù)測將來會發(fā)生什么樣的變化。
第一,交互方式從圖形交互、觸摸交互向基于視覺呈現(xiàn)和語音交互發(fā)展。在計算機體系發(fā)展過程中,在每一次計算機代與代的更替中,有一個東西一直在改變我們和機器交互的方式,從最早的七八十年代的圖形交互,到2006年第一代iPhone出現(xiàn)開啟我們觸摸交互的時代,到現(xiàn)在語音交互已經(jīng)成為當前主要的一個交互方式。而語音交互方式的變化必將帶來芯片、云計算、外觀設(shè)計和軟件設(shè)計整個一系列的變化,這是趨勢。
第二,單純軟硬件模式向軟硬件一體的云+端模式變化。原來你只要做個軟件或者做個硬件就能滿足用戶的需求,但是現(xiàn)在隨著移動互聯(lián)網(wǎng)的發(fā)展,軟硬件一體化、云端一體化已經(jīng)成為一個必然的趨勢,任何一個開發(fā)者不能繞開。
第三,面向最終用戶的產(chǎn)品從大C向小C發(fā)展。大家都知道有一些產(chǎn)品一開始有非常多廠家做,比如說PC電腦,最早全球大概有幾萬的廠商在生產(chǎn)電腦,到現(xiàn)在為止世界電腦大廠商不過就幾家;手機也是一樣,現(xiàn)在全球只剩下七大手機廠商。人類歷史上這樣的產(chǎn)品叫做大C,就是大型的消費品,汽車、家電、電腦、手機都是屬于,大家要的是標準化的外形。
但是還有一些產(chǎn)品不是這樣發(fā)展的。有很多的產(chǎn)品,比如玩具、衣服、鞋子,一開始有幾千家?guī)兹f家廠商生產(chǎn),到現(xiàn)在還是有幾千家、幾萬家廠商生產(chǎn)。為什么會有這樣的差異?因為它叫做小C產(chǎn)品,在這些產(chǎn)品上,人類要的不是工具化的和標準化,而是多樣化和差異化。
因為人工智能給我們帶來的不僅是交互的便捷,而且是情感上的依托。這也是為什么我們給每一個人工智能產(chǎn)品都要起一個名字。這個名字代表了很多的東西,這個名字比人類歷史上所有的小C產(chǎn)品都更加的情感化、差異化和多樣化。這也意味著什么?意味著給我們給很多to C的創(chuàng)業(yè)者打開了一道門。創(chuàng)業(yè)者們都可以堅持下去,因為我們不必像生手機、PC的生產(chǎn)一樣,最后只剩下幾家巨頭來競爭。這給我們提供了一個非常廣闊的空間,而在這樣的空間上,我們也需要新的平臺。
第四,參與生態(tài)的物種向多樣化和去寡頭華發(fā)展。在互聯(lián)網(wǎng)時代,互聯(lián)網(wǎng)企業(yè)往往會形成巨頭壟斷,比如說在中國就是BAT。在移動互聯(lián)網(wǎng)時代,你會發(fā)現(xiàn)互聯(lián)網(wǎng)企業(yè)已經(jīng)不能夠獨家壟斷了,為什么?因為很多超級APP進來了。在這個過程中,手機廠商越來越重要,它們的位置越來越關(guān)鍵,移動運營商也在這中間扮演了越來越多的角色。而以后,在物聯(lián)網(wǎng)時代,在人工智能時代,萬物互聯(lián),各種類型的企業(yè)都能參與進來。比如,家電廠商、家居廠商,甚至服裝廠商,都要加入到里面來(因為有越來越多的智能穿戴式的設(shè)備)。像中國廣電這樣的電視運營商、房地產(chǎn)商,也都會越來越多加到整個生態(tài)鏈條里面,這些鏈條中的某一個環(huán)節(jié)會越來越寡頭化。
最后,商業(yè)生態(tài)從中心化向去中心化發(fā)展。一個趨勢是整個商業(yè)生態(tài)系統(tǒng)的變化。在互聯(lián)網(wǎng)時代,我們的商業(yè)生態(tài)系統(tǒng)遵循什么樣的角色?我們遵循一家獨大、贏者通吃、邊際擴張成本極低。如果一直是這樣的話,我們所有的創(chuàng)業(yè)者都不要做事情了,我們只要給幾大巨頭來服務(wù)就可以了。但是正是因為我講了上面的各種各樣的趨勢,我們將看到一個去中心化的商業(yè)系統(tǒng),或者按照我們訊飛的話來說是混合正交的商業(yè)生態(tài)正在變得越來越重要、越來越成熟。什么叫混合正交的商業(yè)生態(tài)?我們都知道中心化的商業(yè)生態(tài)系統(tǒng)中間的控制節(jié)點,他們總希望數(shù)據(jù)是我的、用戶是我的,你的也是我的。但是在一個去中心化的混合正交的商業(yè)生態(tài)系統(tǒng)中,開發(fā)者、傳統(tǒng)企業(yè)、互聯(lián)網(wǎng)企業(yè)、人工智能企業(yè),大家像編一個籃子一樣,混合正交地把大籃子編出來,而籃子里面存放的就是整個生態(tài)系統(tǒng),由所有編成籃子的參與方共同來分享生態(tài)系統(tǒng)。
大家想象一下,在萬物互聯(lián)的人工智能時代,所有原來的品牌,比如說海爾、美的、中國銀行、中國廣電,他們應(yīng)該做什么?我認為他們應(yīng)該做自己的人工智能系統(tǒng)。人工智能系統(tǒng)可以和最終用戶之間發(fā)生連接、產(chǎn)生效益。但是中間有一個東西,類似于過去互聯(lián)網(wǎng)的搜索,比如移動互聯(lián)網(wǎng)的APP是豆瓣、微博、微信。
那么在IoT時代,中間的東西是什么?
中間的東西就是我們原來想給大家提供的這些東西,包括AIUI、云端一體化、魔飛,以及iFLY inside,但是現(xiàn)在我們想有一個新名詞包含這些東西,這個名詞就是IFLYOS。我們會提供整個2.0的方案,包括AI教引計劃2.0、AI生態(tài)計劃2.0、AI公益計劃2.0。
AI教引計劃2.0。在教引計劃里面,我們會建立新的課程建設(shè)計劃導(dǎo)師,我們希望大家能夠用到更多的功能,我們希望全平臺可用、零學(xué)習(xí)門檻、快速集成和業(yè)務(wù)自定義。那么告訴大家一個好消息,我剛才說過的,在新的一年里我們將把科大訊飛開發(fā)者平臺中間的技能提高到200項以上,讓大家有更加豐富的選擇空間。那么在生態(tài)計劃中,新的生態(tài)計劃2.0怎么幫助大家更好的實現(xiàn)?我們將會有專屬的服務(wù)經(jīng)理、全渠道的響應(yīng)、全業(yè)務(wù)的支持和我們7×24小時的服務(wù)保障。
AI生態(tài)計劃2.0。我們還支持對于我們剛才講的to B、to C開發(fā)者。有些開發(fā)者,他是發(fā)展to B的業(yè)務(wù),那么我們會推進業(yè)務(wù)支持的升級,品牌推廣的升級和項目服務(wù)的升級,讓更多服務(wù)to B的開發(fā)者能夠有更好的渠道和力量。除此之外,我們還有最新的1024的投資基金。投資基金將分為三個層面,第一個層面是一級基金,他們主要是種子基金,利用我們的品牌優(yōu)勢為大家賦能;第二個層面是天使基金,讓我們的渠道能量能夠為天使基金的各位開發(fā)者賦能;第三個層面就是星光加速器。開發(fā)者都會通過不同的加速器和基金的聯(lián)合支持來獲取他們更大的能量。
AI公益計劃2.0。今年我們的公益會繼續(xù)在方言保護計劃上進行深入。我們的語音系統(tǒng)已經(jīng)可以識別很多方言,那么機器人能不能掌握方言并且把它講出來?我們在新一年的計劃里,要實現(xiàn)十種方言的識別。我們會把暴風(fēng)雪競賽的最先進的技術(shù)全部放進來,我們也會招募方言保護計劃的各個方面的成員,而且我們將擴大語音識別所有能夠支持的方言的種類,總共多達24種方言。
去年我們做的公益是教育,新的一年我們準備來做醫(yī)療,大家都知道中國有很多地區(qū)醫(yī)療的設(shè)備、設(shè)施、人才和資源是嚴重不足的,我們將投入超過1000萬元的醫(yī)療資源基金,通過提供醫(yī)療服務(wù)便民幫扶,讓欠發(fā)達地區(qū)在醫(yī)療上也能夠獲得提升。大家都知道,在中國國策里,特別是習(xí)總書記也要求把教育和醫(yī)療這兩個方面作為提高民生最重要的方面,所以我們也要引起切實的行動。我也希望我們的開發(fā)者也能夠跟我們一起行動起來。我們最終的目標是什么?科大訊飛基因里是技術(shù)創(chuàng)新型企業(yè),我認為技術(shù)創(chuàng)新企業(yè)的企業(yè)就應(yīng)該做一個去中心化賦能的平臺,以智能語音交互為技術(shù),以去中心化商業(yè)模式為框架,我們希望和所有的開發(fā)者一起來影響人類的生活、影響我們的社會。
iFLYOS+iFLYIoT解決場景化應(yīng)用
我們現(xiàn)在已經(jīng)累計連接了超過21億的終端設(shè)備,雖然這些終端設(shè)備中一些已經(jīng)退役了,我們今年較去年的智能終端設(shè)備的增長達到了40%,生態(tài)合作伙伴達到86萬,較去年增長了68%。
對于開發(fā)者而言,它對于開發(fā)者來講是一個一站式的解決方案,是一個技能平臺,是一個知曉每一位消費者的人工智能系統(tǒng);對于消費者而言,它是一致化的場景和一致化的體驗,以及能夠把眾多的服務(wù)商的人工智能系統(tǒng)帶到他們的面前,只有這樣IOS才能夠成為真正的連接者。
iFLYOS本身就是一個人工智能。一方面,iFLYOS可以讓開發(fā)者更好地開發(fā)出來他所需要的智能硬件;另外一方面,iFLYOS能更好地理解每一個消費者;同時,iFLYOS還知道它背后所連接的這些資源,諸如可以連接餐飲、音樂、旅游行業(yè)廠商或服務(wù)商的人工智能系統(tǒng),并把它們推薦給最終的消費者。
從開發(fā)者角度而言,整個iFLYOS再云端加入了前后端攔截器,在設(shè)備端提供各類硬件模組。從消費者角度來看,iFLYOS已經(jīng)接入超過40億家產(chǎn)品,有上百個內(nèi)置技能供用戶選用。
在他的背后的后臺已經(jīng)有超過100多個技能,例如打開/關(guān)閉電視或空調(diào),操作洗衣機等。另外一方面就是我們的服務(wù)內(nèi)容和素材,例如咪咕音樂現(xiàn)在已經(jīng)有超過2000萬首的正版中文音樂已經(jīng)在我們的iFLYOS開發(fā)平臺上進行了鏈接,用戶可以直接通過我們iFLYOS得到這些數(shù)據(jù)內(nèi)容。
針對產(chǎn)品互聯(lián)問題,科大訊飛也提供了iFLYIoT,iFLYIoT面向企業(yè)可以對接第三方的語音,通過連接數(shù)據(jù)和AI決策構(gòu)造圍繞用戶的閉環(huán)交互體驗,它可以構(gòu)建我們智能互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施,讓每個設(shè)備之間都可以相互輕松的聯(lián)通。
科大訊飛面向企業(yè)提供全鏈路IoT開放平臺,提供高效易用的開發(fā)體驗,完成Demo開發(fā)從原來的3天,到現(xiàn)在3個小時就可以實現(xiàn)。
iFLY家居平臺
在我們和京東合作的叮咚音箱剛推出的時候,有很多做智能家居的伙伴非常急迫地想用上我們的設(shè)備。因為叮咚音箱很大,但是用戶又想把它裝在墻上,所以他們想了一個辦法,在墻上挖一個洞,然后把叮咚音箱塞進去,只把叮咚音箱的麥克風(fēng)留在外面。后來很快推出了叮咚mini,因為叮咚Mini做扁了,就可以直接裝在墻上了。但是這樣就能夠滿足用戶的需求嗎?不是的。因為叮咚音箱的設(shè)計是水平放置才能接受命令,當你把它垂直放置的時候是接收不到命令的。因此,我們研發(fā)了搭載雙層麥克風(fēng)陣列、具有八個麥克風(fēng)的MORFEI麥克風(fēng)。有了MORFEI麥克風(fēng),大家可以就可以把它放置在屋頂、墻面、地面等任何地方了。
科大訊飛的雙層魔飛麥克風(fēng)陣列可以放置在任何地方,今天搭載iFLYOS的MORFEI,在智能家居方面將覆蓋和連接各種各樣的設(shè)備商、方案商,構(gòu)建完整的解決方案。在客廳、廚房、衛(wèi)生間的電視、櫥柜屏幕、魔鏡將都是可行的終端。
iFLY機器人平臺
在過去的兩到三年中,家庭服務(wù)機器人成為非常重要的角色。開發(fā)魔飛是希望可以嵌入到機器人的任何部位,而不會再出現(xiàn)裝在頭部,影響外形設(shè)計?,F(xiàn)在包括訊飛自己的機器人、優(yōu)必選機器人等國內(nèi)超過85%的機器人在使用iFLYOS,主要應(yīng)用在銀行、醫(yī)院、政府、購物等各個方面。
在機器人領(lǐng)域我們向大家介紹兩個合作案例,一個就是優(yōu)必選機器人,優(yōu)必選的機器人現(xiàn)在在居然之家里進行了大量的配置,也應(yīng)用了科大訊飛iFLYOS的整個語音交互的體系,而且現(xiàn)在也有非常良好的表現(xiàn)。我們自己的機器人也被用在紅星美凱龍的購物廣場里面。
iFLY車載平臺
在中國車輛現(xiàn)在越來越多,我們的智能車載平臺現(xiàn)在已經(jīng)和中國基本上所有的車廠進行了合作,為400多款車系提供語音交互的支持。大家都知道寶馬一直非常相信自己的技術(shù),但是最近他們不得不買了一臺奇瑞艾瑞澤5。它為什么要買這臺車?因為它發(fā)現(xiàn)這臺車的車機的中文語音交互的效果是世界上最好的。
現(xiàn)在在車載的應(yīng)用環(huán)境中,我們對外提供多種解決方案:一種是面向B端提供技術(shù),就是和國內(nèi)在售的基本上所有車場,包括大眾、豐田合作,他們已經(jīng)開始在使用我們的技術(shù);另一種則是面向C端,我們有自己的飛魚。另外,我們的平臺已經(jīng)整合了在大數(shù)據(jù)、云計算、機器視覺、智能語音方面的各種能力,可以快速的幫助車輛實現(xiàn)賦能。而且這一智能化的車載系統(tǒng),馬上就要向所有開發(fā)者開放。
iFLY客服平臺
最初語音識別研究的目標就是希望能夠代替客服人員。在過去,我們已經(jīng)有非常多的關(guān)于智能客服的積累,我們覆蓋的場景最多,已經(jīng)能夠完成81%的工作;我們覆蓋的行業(yè)也非常多,因為每個行業(yè)里面的客服都有很多專業(yè)化的知識。在這個基礎(chǔ)上,我們的AI電話機器人已經(jīng)能夠提供非常多的應(yīng)用,我們現(xiàn)在已經(jīng)對接了華為等專業(yè)化的呼叫平臺中心?,F(xiàn)在我們語音引擎的語音識別正確率已經(jīng)超過了98%,合成的自然度已經(jīng)超過了4.5分,不僅如此我們還有高效的可專業(yè)化的可視化操作,你可以通過圖形的拖拽,就能夠構(gòu)建出來你們整個對話系統(tǒng)的邏輯。
我們和海底撈合作的電話客服平臺,也是海底撈智慧餐飲的一個非常重要的部分。通過這個智能客服系統(tǒng),上線一個月就接聽了757萬的來電,服務(wù)了超過193萬的客戶,節(jié)省了10萬小時的人工服務(wù)時間,而且客戶對服務(wù)效果非常滿意。我們之所以能達到這樣的效果,是因為此前不斷為中國移動、中國電信、中國聯(lián)通以及中國銀行、交通銀行、建設(shè)銀行等大客戶的客服中心提供服務(wù)和支持所積累的結(jié)果。
iFLY醫(yī)療平臺
教育和醫(yī)療是國家、政府最關(guān)心的內(nèi)容。在醫(yī)療方面,面向居民需要健康管理、血壓計實時監(jiān)控;面向社區(qū),需要分級診療,和基層治療;面向醫(yī)院,我們需要語音電子病歷,需要提高工作效率;面向區(qū)域,我們需要跨區(qū)域的輔助診療。目前訊飛的人工智能輔助診療平臺已經(jīng)具備了語音、圖像、眼底、西科、西醫(yī)全科輔助慢病管理等各方面的能力,而這些也都是訊飛瞄準醫(yī)療行業(yè)需求后將對外提供的能力。
我們希望我們能夠給開發(fā)者,包括藥企醫(yī)療機構(gòu)進入平臺展現(xiàn)能力的機會,現(xiàn)在我們現(xiàn)在已經(jīng)連接了一百多家的三甲醫(yī)院,3000家以上的基層醫(yī)療機構(gòu),為他們提供人工智能服務(wù),我也希望大家能夠借助于我們這些已有的產(chǎn)品,已有的經(jīng)驗。
iFLY營銷平臺
很多人很奇怪為什么科大訊飛可以做廣告?我們所說的智能營銷業(yè)務(wù)是因為我們手機上有很多的APP他們使用了我們的技能,但是同時我們也注意到這些APP有商業(yè)模式變現(xiàn)的需求,所以我們就開發(fā)了iFLY營銷平臺,把這些分散的APP的流量匯聚起來,然后我們再跟國際、國內(nèi)的大客戶,比如京東來溝通,把廣告需求投放在這些APP和智能硬件上。
我們可以看到我們現(xiàn)在已經(jīng)積累了大量的品牌傳播案例,利用大數(shù)據(jù)、人臉畫像和AI的算法實現(xiàn)精準投放。我們也能夠連接企業(yè)和開發(fā)者,把開發(fā)者擁有的流量和擁有的客戶轉(zhuǎn)變成為我們另外一端的大企業(yè)所需要營銷的一個陣地。并且通過科大訊飛的大數(shù)據(jù)實現(xiàn)廣告主更高的投資回報,我們也希望在這些方面的CPMCPC和CPA能夠達到業(yè)界最高的一個水平。
那么我這地方也舉一個例子,直播吧采用我們tts的整個技術(shù),包括機器翻譯加語音,現(xiàn)在我們已經(jīng)實現(xiàn)了月活3500萬,是2017年的體育資訊類的APP的第一名。在商業(yè)變現(xiàn)方面,2018年我們和直播吧進行合作,已經(jīng)實現(xiàn)了收益2000萬,同比增長了170%。在廣告創(chuàng)新和用戶精準投放方面取得了很好的成績。
一款硬件:訊飛聽見M1轉(zhuǎn)寫機器人
隨后,科大訊飛消費者事業(yè)群副總裁、聽見科技總經(jīng)理王瑋上臺發(fā)布了重量只有93克的M1轉(zhuǎn)寫機器人,預(yù)售價格1299元。
我們大家都知道,室內(nèi)的拾音實際上有兩大難題:噪音干擾和混響。
因為我們在每一個不同的房間里,它的聲場、回聲都不太一樣。所以我們在聽見M1上面有自己獨特的設(shè)計:
第一,使用了24比特的高精度拾音芯片;
第二,我們使用了7+1的環(huán)形麥克風(fēng)。我們還運用了科大訊飛最先進的自適應(yīng)波束形成和去混響的技術(shù),從而實現(xiàn)在環(huán)境里能做到360度無死角的拾音和聲源的精確度可以達到正負5度,什么概念?如果說我走在這個位置上和我走在比如說四點鐘方向和八點鐘方向的時候,它可以用波束形成去驅(qū)動不同的麥克風(fēng),然后把邊上的噪音把它抑制掉,它拾音距離可達十米,這樣的話就真正地解決了室內(nèi)拾音的問題。
近距離、高保真的錄音數(shù)據(jù)識別正確率達到98.24%,8米距離的識別率為97.93%。除此之外,它能夠裝進近百小時的語音數(shù)據(jù),特別設(shè)計了磁盤加密的功能,因為每一個聽見M1都設(shè)置了一個特別的秘鑰,需要和他綁定的聽見APP進行配對的時候才能夠讀取數(shù)據(jù),當你的小機器人丟掉的時候他的數(shù)據(jù)會被丟失。另外它還能夠自帶WiFi的熱點,它和聽見APP一鍵連接能夠做到無線傳輸。