人工智能呼聲洶涌澎湃 機(jī)器究竟能否替代人工翻譯?_人工智能,機(jī)器學(xué)習(xí),科技創(chuàng)新
當(dāng)一款新的技術(shù),不,應(yīng)該說當(dāng)一個技術(shù)出現(xiàn)了一丁點(diǎn)欣喜的進(jìn)步時,現(xiàn)在科技圈里就立刻往它的身上貼上各種“顛覆”的標(biāo)簽。
人工智能呼聲洶涌澎湃 機(jī)器究竟能否替代人工翻譯?
如果你是一位科技新聞的讀者,想必已經(jīng)對“顛覆”這個字眼感到些許的麻木甚至惡心了吧?那天翻地覆的變化似乎就要出現(xiàn)在明天。
科技媒體善于吸引人們目光,這固然是從業(yè)人員的一種必備本領(lǐng),但如今所有人都左顧右盼,像是熱鍋上的螞蟻一樣焦躁不安,這真的是正常現(xiàn)象嗎?科技媒體眼中??萍紕?chuàng)新把世界世界攪的天翻地覆。沒事兒三天一創(chuàng)新,五天一顛覆,未來我們在這個世界站穩(wěn)腳跟的著力點(diǎn)又是在哪里呢?
在這其中,尤其是以圍繞著“人工智能”的呼聲最為洶涌澎湃。前不久,Google 推出了基于神經(jīng)網(wǎng)絡(luò)而開發(fā)的全新的 Google Translate,引起業(yè)界的一片驚呼。不少人甚至都建議國家完全沒有必要在開設(shè)外語專業(yè)了,翻譯就此在機(jī)器學(xué)習(xí)的帶動下徹底消失了!
然而事實(shí)上,如果我們站的遠(yuǎn)一些去看它,如果還模糊不清就再在額頭上貼個冰塊兒,你就會發(fā)現(xiàn)任何有關(guān)“機(jī)器將取代人工翻譯”的言論都是無稽之談。今天,五十度硅會好好地跟大家掰扯掰扯為什么機(jī)器代替不了人工的翻譯,并由此我們可以稍微聊一聊人與機(jī)器究竟應(yīng)該保持這樣的一種關(guān)系。
Google 的神經(jīng)網(wǎng)絡(luò)翻譯究竟是怎么一回事?
事實(shí)上,十年之前網(wǎng)絡(luò)上就已經(jīng)提供在線翻譯服務(wù)了,而其實(shí)在很早以前,關(guān)于“機(jī)器即將替代人類進(jìn)行翻譯”的論調(diào)就不絕于耳。而之所以如今大家的目光再次回到這上面,完全是因?yàn)?Google 將自己的在線翻譯服務(wù)進(jìn)行了升級換代,推出了一款名為基于“神經(jīng)網(wǎng)絡(luò)”的機(jī)器翻譯系統(tǒng)。
咱們先說說什么是“神經(jīng)網(wǎng)絡(luò)”?
自打有了計(jì)算機(jī)以來,努力讓機(jī)器智能逐漸向人類大腦過渡成為了很多科研人員的一個夢想。但直到如今,在這方面的進(jìn)展幾乎可以用紋絲不動來形容。人們都清楚,機(jī)器和人類的側(cè)重點(diǎn)不一樣。在機(jī)器眼中不費(fèi)吹灰之力的運(yùn)算,邏輯判斷,這在人類來看是需要大量腦力才能完成的事,而對于人類來說,那些輕而易舉就能辦到的事,比如辨識物體,人們的身份,自由流暢的語言溝通,迅速地學(xué)習(xí)并適應(yīng)某一種方言,這些對于機(jī)器來說簡直是不可能完成的任務(wù)。
在好幾次向“人腦”發(fā)起沖鋒未果之后,研究人員提出設(shè)想,為什么我們不搭建一個類似于人腦一樣的神經(jīng)網(wǎng)絡(luò)呢?讓計(jì)算機(jī)運(yùn)算單位之間的關(guān)系搭建,就完全按照人腦來設(shè)計(jì)。雖然,
人類至今尚未明白人腦的工作原理,不過這沒關(guān)系,我們可以先復(fù)制出一個人腦的計(jì)算模型:一件事情并非像計(jì)算機(jī)程序那樣輸入指令輸出結(jié)果,而是在人腦的多個神經(jīng)元傳遞,每個神經(jīng)元都對信息進(jìn)行自己的加工,最后輸出的結(jié)果。計(jì)算機(jī)科學(xué)家用同樣的方式,在輸入和輸出之間,加入了非常多的“節(jié)點(diǎn)”,每個節(jié)點(diǎn)會對前一個節(jié)點(diǎn)傳來的數(shù)據(jù),按照自己擁有的一個權(quán)重系數(shù)進(jìn)行加工,有時候節(jié)點(diǎn)還會分層。這就是“人工神經(jīng)網(wǎng)絡(luò)”(ArTIficial Neural Networks,ANN)。
那么,Google 搞得這次基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng)又是怎么一回事呢?
之前我們經(jīng)常用到的翻譯服務(wù),其實(shí)是基于“詞組”來進(jìn)行的。也就是說,一段文字出現(xiàn)之后,系統(tǒng)會直接把這段文字給拆散了,最小單位就是“詞組”,然后將每個詞組找到相對應(yīng)的翻譯版本,再進(jìn)行次序的調(diào)整,最后出來一篇譯文。這是一個有著明確的先后次序的翻譯工作,即:打散、找對應(yīng)的詞組、排序、其中包括了標(biāo)點(diǎn)符號的重新分割,整理等多個環(huán)節(jié)。
按道理來說它其實(shí)不怎么容易出錯,但是每一個環(huán)節(jié)雖然準(zhǔn)確率還蠻高,但是架不住環(huán)節(jié)多啊,一旦有一個地方出現(xiàn)了偏差,后面就如倒掉的積木一樣全部都散了架了,最后出來的翻譯內(nèi)容當(dāng)然不忍猝讀。
而基于神經(jīng)網(wǎng)絡(luò)的翻譯系統(tǒng),直接跳過了這么多繁瑣的步驟,它直接直接依靠“海量數(shù)據(jù)”來獲勝,也就是說它直接建立起來了兩個對應(yīng)著的平行語言庫,然后讓機(jī)器自己去學(xué)習(xí)如何進(jìn)行對應(yīng)。這樣的法子其實(shí)很早就出現(xiàn)了,但是它也有一定的技術(shù)難題沒有攻破,比如說機(jī)器學(xué)習(xí)起來速度實(shí)在非常慢,而且稍微碰上一些沒怎么見過的話,它就不知道該怎么辦了,但是 Google 這次通過技術(shù)創(chuàng)新,讓它無論在翻譯的準(zhǔn)確性和速度上都獲得了大大的提升。
由此,翻譯再也不是簡單的詞與詞,詞組與詞組的對應(yīng),而是能夠從一段文章的角度去把握全文,這樣出來的譯文更加流暢自然。
那么,這是不是就意味著人類翻譯在此下崗了呢?
既然我們現(xiàn)在知道了 Google 翻譯在此取得的重大進(jìn)展,那么現(xiàn)在是時候把機(jī)器和人類放在翻譯的天平上稱稱斤兩,比較一下孰輕孰重了!