AI要在教育場(chǎng)景落地,這些挑戰(zhàn)必須克服!
近日,“全球AI+智適應(yīng)教育峰會(huì)”在北京嘉里中心大酒店盛大開(kāi)幕,峰會(huì)由聯(lián)合乂學(xué)教育松鼠AI,以及IEEE(美國(guó)電氣電子工程師學(xué)會(huì))教育工程和自適應(yīng)教育標(biāo)準(zhǔn)工作組共同舉辦,匯聚國(guó)內(nèi)外頂尖陣容。
AI智適應(yīng)學(xué)習(xí)是目前產(chǎn)學(xué)研三界關(guān)注度最高的話題之一。此次峰會(huì),主辦方邀請(qǐng)了美國(guó)三院院士、機(jī)器學(xué)習(xí)泰斗Michael Jordan,全球公認(rèn)機(jī)器學(xué)習(xí)之父Tom Mitchell,斯坦福國(guó)際研究院(SRI)副總裁Robert Pearlstein、美國(guó)大學(xué)入學(xué)考試機(jī)構(gòu)ACT學(xué)習(xí)方案組高級(jí)研究科學(xué)家Michael Yudelson等頂尖學(xué)者。
圖為:新東方AI研究院院長(zhǎng) 瞿煒博士
在大會(huì)下午主論壇上,新東方AI研究院院長(zhǎng)瞿煒博士發(fā)表了精彩演講。瞿煒博士在人工智能領(lǐng)域有近20年的豐富研究經(jīng)歷,此前在西門(mén)子公司有過(guò)工作經(jīng)歷。新東方作為中國(guó)最早在美上市的教育公司,在全球已經(jīng)有超過(guò)2000萬(wàn)的學(xué)生使用他們的平臺(tái)。瞿煒博士在現(xiàn)場(chǎng)的演講正是新東方在AI時(shí)代的最新思考。
瞿煒博士認(rèn)為,通用AI已經(jīng)走向瓶頸,場(chǎng)景AI將迎來(lái)新的蓬勃發(fā)展。而對(duì)于AI+教育來(lái)說(shuō),盡管是極具潛力的市場(chǎng),但是依然面臨著諸多挑戰(zhàn),比如語(yǔ)音識(shí)別、人臉識(shí)別、文字識(shí)別、視頻分析等。新東方AI研究院雖然剛剛成立,但會(huì)在整體戰(zhàn)略上走向“開(kāi)放”,并將以N-Brain聯(lián)盟為基點(diǎn),在數(shù)據(jù)、場(chǎng)景、資源層面做更多與業(yè)界、學(xué)界的合作。
以下大部分為瞿煒的演講原文,做了不改變?cè)獾木庉嬇c整理。
作為一個(gè)接觸AI接近20年的老兵,根本就沒(méi)有想到AI能成為一個(gè)行業(yè),甚至在2016年左右的時(shí)候,隨著AlphaGo為公眾所熟悉,AI幾乎是指數(shù)級(jí)地變成了一個(gè)行業(yè),所有的互聯(lián)網(wǎng)公司都在擁抱AI,所有的行業(yè)也越來(lái)越多地去touch AI。
但是新東方很冷靜,俞老師(注:俞敏洪)很冷靜,并沒(méi)有著急,給大家的感覺(jué)是新東方在做什么?其實(shí)我們一直在做AI,各個(gè)BU一直在應(yīng)用AI,但是我們很冷靜地在思考教育+AI到底應(yīng)該怎么做?什么才是最好的時(shí)機(jī)來(lái)?yè)肀I?
AI的冬天來(lái)了,但春天也不遠(yuǎn)
事實(shí)上,AI在兩年的火熱之后,冬天已經(jīng)來(lái)臨了,就像外面北京的冬天來(lái)到了一樣。
語(yǔ)音識(shí)別其實(shí)已經(jīng)很成熟,但是機(jī)器學(xué)習(xí)、NLP、計(jì)算機(jī)視覺(jué)這幾個(gè)技術(shù)(占到AI最重要部分的分支)其實(shí)已經(jīng)過(guò)了它的頂峰。以深度學(xué)習(xí)為例,經(jīng)過(guò)幾年大規(guī)模的應(yīng)用,其實(shí)越來(lái)越多的研究者已經(jīng)發(fā)現(xiàn),它已經(jīng)到達(dá)了一個(gè)瓶頸。我們發(fā)現(xiàn)AI并不是像我們想像的那樣真的能去替代人。
中國(guó)有一句固話叫“冬天來(lái)了,春天還遠(yuǎn)嗎”?AI的一個(gè)冬天來(lái)了,它的下一個(gè)春天是什么呢?其實(shí),很多AI行業(yè)中的人也意識(shí)到了是場(chǎng)景化的AI。
通用化的AI在過(guò)去的兩年中得到了極大的普及,為公眾所接受,很多創(chuàng)業(yè)公司如雨后春筍般地興起,獲得了大量的投資,這兩年大家都感受到了,甚至融資的速度超越了前幾年互聯(lián)網(wǎng)的速度。
但是,它的冬天來(lái)了,因?yàn)楹芏郃I的公司并沒(méi)有商業(yè)化變現(xiàn),當(dāng)他們落地的時(shí)候發(fā)現(xiàn),變現(xiàn)是如此地困難。尤其是在ToC領(lǐng)域。這是為什么呢?
實(shí)際上是因?yàn)锳I和行業(yè)的結(jié)合非常非常困難,不是那么容易的。所以我們看到通用的AI的發(fā)展將會(huì)變成這樣一個(gè)趨勢(shì),但是場(chǎng)景化的AI在AI和行業(yè)的結(jié)合領(lǐng)域會(huì)產(chǎn)生無(wú)窮無(wú)盡的機(jī)會(huì)。
AI+教育將會(huì)是對(duì)整個(gè)教育科技的重構(gòu)
AI+汽車(chē)已經(jīng)形成了垂直的平臺(tái),百度的阿波羅、谷歌的Waymo都產(chǎn)生了這樣的平臺(tái),AI+生活催生了Facebook的出現(xiàn),AI+教育會(huì)出現(xiàn)什么呢?我們非常期待。這也新東方對(duì)AI+教育這件事深度的思考。
我們認(rèn)為AI+教育并不一定就是通用AI技術(shù)直接嫁接到教育領(lǐng)域,像出現(xiàn)了很多產(chǎn)品級(jí)的應(yīng)用一樣,更多的AI+教育將會(huì)是對(duì)整個(gè)教育科技的重構(gòu)。很多數(shù)據(jù)都已經(jīng)準(zhǔn)備好,比如說(shuō)大數(shù)據(jù)、云計(jì)算,但在AI+教育領(lǐng)域必將出現(xiàn)一個(gè)新的大腦,我們姑且稱之為教育大腦,也必將會(huì)出現(xiàn)新的操作系統(tǒng),這種操作系統(tǒng)可能是在云,也可能在端,因?yàn)樗械腁I系統(tǒng)肯定是一個(gè)軟硬結(jié)合的系統(tǒng)。
個(gè)性化的學(xué)習(xí)平臺(tái)將會(huì)雨后春筍地涌現(xiàn)
個(gè)性化的學(xué)習(xí)平臺(tái)將會(huì)雨后春筍地涌現(xiàn)。我們認(rèn)為它一定是開(kāi)放的,為什么?因?yàn)閭€(gè)性化的學(xué)習(xí)太難了,很難一個(gè)公司把它實(shí)現(xiàn)。因?yàn)檫@么多的國(guó)家,這么多的人群,不同的年齡段、不同的學(xué)科,這個(gè)問(wèn)題對(duì)研究界而言,幾乎是沒(méi)有唯一解的,所以不可能由一家公司來(lái)完成。
新東方AI研究院在“新東方AI+教育戰(zhàn)略”基本的步驟,大家可以關(guān)注教育大腦的具體應(yīng)用。
這張圖很多在座的朋友們可能都已經(jīng)看到很多次了,不光是在教育領(lǐng)域,其實(shí)很多的領(lǐng)域都可以用這張圖來(lái)表示,但我們關(guān)心的這8個(gè)領(lǐng)域,最關(guān)注的是他們?cè)谶@個(gè)教育上有什么樣的不一樣,而不僅僅是這8個(gè)詞。所以我借此機(jī)會(huì)介紹一下我們關(guān)注的20個(gè)挑戰(zhàn)。
“AI+教育”的20個(gè)挑戰(zhàn)
語(yǔ)音識(shí)別的挑戰(zhàn):中英混合、專(zhuān)有名詞識(shí)別難、強(qiáng)噪聲
通用的語(yǔ)音引擎真正應(yīng)用到教育這個(gè)場(chǎng)景下的時(shí)候,其實(shí)并不像在很多場(chǎng)景下那么有效,比如說(shuō)通用的新聞,其實(shí)我們很多的云引擎,無(wú)論是谷歌、訊飛、百度的都可以做到接近人或者是超越人的水平,97%以上是沒(méi)有任何問(wèn)題的,99%在特定的場(chǎng)景下也是可實(shí)現(xiàn)的。但當(dāng)進(jìn)入到教育這個(gè)場(chǎng)景下的時(shí)候,卻發(fā)現(xiàn)它們并不產(chǎn)生作用。比如我們應(yīng)用到中英混合識(shí)別問(wèn)題,新東方的很多課程都是在拿中文教英語(yǔ),所以當(dāng)你看這個(gè)波形的時(shí)候,中英之間的切換幾乎是糅在一起的,這對(duì)語(yǔ)音識(shí)別是一個(gè)挑戰(zhàn)的問(wèn)題。
另外進(jìn)入到教育領(lǐng)域,其實(shí)它的場(chǎng)景是非常非常零碎的。你去分科施教的時(shí)候,會(huì)發(fā)現(xiàn)在數(shù)理化有很多的公式和名詞是要分別的,現(xiàn)有的中英文的引擎,我們發(fā)現(xiàn)原有的識(shí)別率在現(xiàn)有的場(chǎng)景下會(huì)下降到70%左右。還有一個(gè)是很多朋友即將面對(duì)的,中國(guó)人學(xué)英語(yǔ)的時(shí)候,我們的發(fā)音(尤其是孩子們的發(fā)音),我們稱之為“chinglish”,用中文引擎用英文引擎識(shí)別都不是有效的,所以我們認(rèn)為是第三種引擎。
還有我們的線下教室是強(qiáng)噪聲、強(qiáng)混響的語(yǔ)音問(wèn)題,這個(gè)問(wèn)題解決起來(lái)非常困難。亞馬遜的Echo之所以能被大規(guī)模地應(yīng)用起來(lái),其實(shí)關(guān)鍵是解決了一個(gè)工程的問(wèn)題,就是語(yǔ)音識(shí)別的問(wèn)題,當(dāng)語(yǔ)音識(shí)別應(yīng)用到教育場(chǎng)景下的時(shí)候,這樣一個(gè)語(yǔ)音增強(qiáng)的工程問(wèn)題必須要面對(duì),否則我們基本上很難去實(shí)現(xiàn)線下場(chǎng)景下真實(shí)的語(yǔ)音識(shí)別。
還有多人混合下的聲文識(shí)別問(wèn)題,教育場(chǎng)景下無(wú)論是線上還是線下,尤其是一對(duì)多的情況,經(jīng)常會(huì)出現(xiàn)多個(gè)孩子同時(shí)回答一個(gè)問(wèn)題,多個(gè)孩子同時(shí)討論一個(gè)問(wèn)題,這種情況下做語(yǔ)音識(shí)別,不得不面臨如何去把這個(gè)聲音分開(kāi)的問(wèn)題,這些問(wèn)題都非常挑戰(zhàn)。
人臉識(shí)別的挑戰(zhàn):超低分辨率、強(qiáng)畸變角度、遮擋
進(jìn)入到人臉識(shí)別,這是這一撥AI炒得最熱的,但進(jìn)入到教育這個(gè)場(chǎng)景下的時(shí)候很多人臉識(shí)別公司也不見(jiàn)了。我們?cè)诤蛶缀醮蠹夷芸吹降乃袊?guó)內(nèi)、國(guó)外最牛的人臉公司進(jìn)行合作。這三個(gè)是我們列舉的很實(shí)際的問(wèn)題。
第一個(gè)是超低分辨率下的人臉識(shí)別的問(wèn)題,右邊這張圖是一個(gè)真實(shí)的線下課堂場(chǎng)景,就用一個(gè)簡(jiǎn)單的監(jiān)控?cái)z像頭試圖來(lái)覆蓋整個(gè)教室,你會(huì)發(fā)現(xiàn)問(wèn)題出現(xiàn)了,當(dāng)你能看清楚第一排的學(xué)生的時(shí)候,你就無(wú)法看清楚最遠(yuǎn)這一排的學(xué)生,你試圖要看清楚兩邊的孩子的時(shí)候,必須要用一個(gè)廣角鏡頭,而這導(dǎo)致了很大的畸變,所以在教育的場(chǎng)景下是非常非?,F(xiàn)實(shí)的,很難像普通的人臉識(shí)別問(wèn)題一樣給你一個(gè)大頭照這么簡(jiǎn)單?;兊慕嵌认碌娜四樧R(shí)別問(wèn)題就出現(xiàn)了。
孩子們是非常活躍的,這也是教育的本質(zhì)所在,這就導(dǎo)致了人臉識(shí)別不是一個(gè)靜態(tài)的,而是老老實(shí)實(shí)地等著你去識(shí)別,你如何在動(dòng)態(tài)的情況下、大遮擋的情況下而不是僅僅是局部遮擋的情況下能夠?qū)崿F(xiàn)人臉的識(shí)別?這是必須要解決的一個(gè)問(wèn)題,不解決表情怎么識(shí)別,怎么時(shí)時(shí)刻刻知道孩子在干什么,所以說(shuō)起來(lái)容易,理想很美好,現(xiàn)實(shí)其實(shí)是很骨感的。
文字識(shí)別挑戰(zhàn):數(shù)理化的公式、手寫(xiě)體難識(shí)別
進(jìn)入文字識(shí)別領(lǐng)域,我們面臨的問(wèn)題是數(shù)理化的公式、圖形、圖像識(shí)別問(wèn)題,還有包括手寫(xiě)體的識(shí)別問(wèn)題,這都是我們必須要解決的。
NLP的挑戰(zhàn):多輪對(duì)話難以實(shí)現(xiàn)、智能批改有局限
還有NLP(自然語(yǔ)言處理)的挑戰(zhàn),最經(jīng)典的是多輪對(duì)話,這個(gè)多輪對(duì)話還不是普通意義上的客服機(jī)器人,我們希望答疑甚至是替代老師,一定是基于內(nèi)容的。當(dāng)基于內(nèi)容領(lǐng)域的時(shí)候,這個(gè)多輪對(duì)答更困難,號(hào)稱能做到二十七輪對(duì)話的話是非常非常困難的,我不認(rèn)為在未來(lái)的一兩年內(nèi)能發(fā)生這樣一件事,但也許我們能解決三輪、五輪、七輪。
線上線下課堂自動(dòng)提煉的問(wèn)題,新東方也是很多教育公司可能的剛需,我們有這么多的課堂,這么多的老師,如何能用AI的手段自動(dòng)地提煉課堂的內(nèi)容是解決教學(xué)一體化的非常重要的手段。
中英作文的智能批改閱卷,其實(shí)已經(jīng)有成熟的產(chǎn)品了,但我們的實(shí)踐發(fā)現(xiàn),要做到真正意義上的批改,必須要進(jìn)入語(yǔ)義層面,這是非常非常有挑戰(zhàn)的。
視頻分析的挑戰(zhàn):線下的情況太復(fù)雜
其實(shí)有很多公司也在向這個(gè)方向努力。我們完整的教學(xué)過(guò)程既包括了老師的分析,也包括了學(xué)生的分析。對(duì)于老師,我們希望對(duì)他所有的教學(xué)過(guò)程進(jìn)行評(píng)價(jià),對(duì)于學(xué)生,我們希望對(duì)他的微表情進(jìn)行分析??墒窃诂F(xiàn)在的場(chǎng)景下,線上簡(jiǎn)單一些,尤其是英語(yǔ)的教學(xué),因?yàn)槲覀儙缀蹩梢哉龑?duì)著他,有一個(gè)大頭照;但線下的情況太復(fù)雜了。
圖譜的挑戰(zhàn):高精知識(shí)地圖缺乏
我們幾乎沒(méi)有看到任何一張基于學(xué)科的高精知識(shí)地圖。當(dāng)AI進(jìn)入到無(wú)人駕駛領(lǐng)域,高精地圖已經(jīng)成為了一個(gè)必然的選項(xiàng),但我們講了半天的AI+教育,卻很難看到一張基于學(xué)科的知識(shí)地圖,所以這是一個(gè)非常非?;A(chǔ)的工作。
AR·VR的挑戰(zhàn):AI合成教師需要互動(dòng)
最近一個(gè)星期最火的事情就是新華社和搜狗一起做了一個(gè)AI合成主播。主播技術(shù)簡(jiǎn)單,因?yàn)樗且粋€(gè)單向的,但當(dāng)我們把這件事放在教育領(lǐng)域談的時(shí)候,就是個(gè)挑戰(zhàn),因?yàn)锳I合成教師不僅僅是一個(gè)單向的講,而是需要互動(dòng)。
機(jī)器學(xué)習(xí)的挑戰(zhàn):自動(dòng)標(biāo)注難、場(chǎng)景零碎、個(gè)性化難
自動(dòng)標(biāo)注的問(wèn)題。所有的AI都牽扯到標(biāo)注,因?yàn)槲覀儸F(xiàn)在接觸到的絕大部分是監(jiān)督式的。AI如何做自動(dòng)的標(biāo)注,小數(shù)據(jù)量的情況不是問(wèn)題,但像新東方這樣擁有海量的公司做這樣的事情的時(shí)候,我們發(fā)現(xiàn)自動(dòng)標(biāo)注是我們必須要面對(duì)的問(wèn)題。
教育場(chǎng)景是如此地零碎和復(fù)雜。其實(shí)具體到每一個(gè)小的場(chǎng)景下的時(shí)候,我們發(fā)現(xiàn),小樣本級(jí)的訓(xùn)練問(wèn)題是如此地突出,這次大會(huì)有一個(gè)主題就是自適應(yīng)學(xué)習(xí),你會(huì)發(fā)現(xiàn)專(zhuān)注到每一個(gè)孩子的時(shí)候,其實(shí)它的樣本數(shù)據(jù)并不多,尤其是冷啟動(dòng)階段。
個(gè)性化學(xué)習(xí)問(wèn)題。這可能是我們繞不開(kāi)的問(wèn)題,因?yàn)橐婚_(kāi)始的時(shí)候不可能對(duì)所有的孩子都有一個(gè)模型來(lái)進(jìn)行推理,如何把一個(gè)模型個(gè)性化到一個(gè)孩子的身上是一個(gè)難題。
新東方的開(kāi)放戰(zhàn)略:以N-Brain聯(lián)盟為基點(diǎn),數(shù)據(jù)、場(chǎng)景、資源全部開(kāi)放
上面這20個(gè)問(wèn)題每一個(gè)都如此具有挑戰(zhàn)性,把它做成了,也許能成為一家偉大的公司,至少能對(duì)這個(gè)行業(yè)產(chǎn)生很大的影響。我們面臨這20個(gè),可能還不止20個(gè),新東方怎么辦?我們的思考其實(shí)很簡(jiǎn)單,就是開(kāi)放。
新東方愿意把數(shù)據(jù)拿出來(lái),把場(chǎng)景拿出來(lái),把資源拿出來(lái),因?yàn)槲覀冎牢覀兊钠鸩胶芡恚覀儾豢赡茉谒猩鲜鲱I(lǐng)域再去重新來(lái)過(guò),新東方AI研究員也不可能以一己之力跟那么多的公司PK,所以我們能做到的就是“開(kāi)放”。
我們兩個(gè)星期之前成立了N-Brain聯(lián)盟。“N”,首先它代表了N種教育場(chǎng)景,也代表了N種可能,更代表了N個(gè)model。N在自然數(shù)集里其實(shí)代表了無(wú)窮的概念,也代表了力,也代表了氮元素占到了大氣層78%的比例,我們希望以這種形態(tài),能和在座的各位朋友合作,共同做好AI+教育這件事情。
目前,我們已經(jīng)和美國(guó)的伊利諾伊大學(xué)、中國(guó)自動(dòng)化科學(xué)研究所這樣頂尖的AI研究機(jī)構(gòu)合作,我們也和北京師范大學(xué)、斯坦福大學(xué)這樣頂級(jí)的教育領(lǐng)域、心理學(xué)領(lǐng)域、認(rèn)知科學(xué)領(lǐng)域、腦科學(xué)領(lǐng)域的研究機(jī)構(gòu)合作,以及與GSV(注:全球硅谷投資公司)等一起合作,我們一起團(tuán)結(jié)資本的力量,還有像騰訊、網(wǎng)易這樣互聯(lián)網(wǎng)的公司,甚至包括很多很多的創(chuàng)業(yè)公司,我們正在合作,越來(lái)越多的公司加入進(jìn)我們這個(gè)聯(lián)盟。新東方可以把數(shù)據(jù)貢獻(xiàn)出來(lái),我們也愿意把所有的場(chǎng)景貢獻(xiàn)出來(lái),我們也愿意把資源貢獻(xiàn)出來(lái)。
新東方AI研究院不僅僅是一個(gè)研究的機(jī)構(gòu)(注:2018年7月成立),同時(shí)我們也愿意做一個(gè)橋,連接內(nèi)部的資源和外部所有的資源,一起把“AI+教育”這件事情做好,我們的目的不是為了新東方自己用,而是希望向所有的機(jī)構(gòu)和所有的公立學(xué)校開(kāi)放。
2018年度AI最佳掘金案例評(píng)選
人工智能風(fēng)雨60年,與其說(shuō)技術(shù)升級(jí)促成了今天的浪潮,不如說(shuō)當(dāng)前的人工智能,終于站在離商業(yè)最近的位置。
去年,首屆「AI 最佳掘金案例年度評(píng)選」活動(dòng)一經(jīng)推出,便受到了AI方案輸出方和AI技術(shù)需求方的極大關(guān)注。評(píng)選從商業(yè)維度出發(fā),尋找用戶/客戶問(wèn)題解決能力強(qiáng)的產(chǎn)品和解決方案。
現(xiàn)在,我們?cè)俅握驹贏I浪潮之巔,正式啟動(dòng)第二屆「AI最佳掘金案例評(píng)選」。
在AI+教育領(lǐng)域我們一共設(shè)置了6個(gè)獎(jiǎng)項(xiàng),歡迎踴躍報(bào)名,報(bào)名地址:https://www.leiphone.com/special/custom/AITopTen2018.html