隨著各大公司都在推AI同傳,同傳從業(yè)者似乎都面臨著飯碗不保。
AI同傳真的能取代人類同傳?
近日,眾多媒體報(bào)道,科大訊飛AI同傳被指造假。
事件起因是,9月20日,一位ID為Bell Wang的用戶在知乎發(fā)文“科大訊飛,你的AI同傳操(qi)作(zha)能更風(fēng)騷一點(diǎn)嗎”,狠狠Diss了科大訊飛 AI同傳,指出科大訊飛在現(xiàn)場(chǎng)和直播展示的AI同傳其實(shí)用的是人類同傳翻譯結(jié)果。這件事情隨即引發(fā)了微博上不少同傳從業(yè)者的討論和眾多媒體報(bào)道。
科大訊飛董秘江濤對(duì)記者回應(yīng)稱,“訊飛從沒講過AI同傳的概念,始終強(qiáng)調(diào)是人機(jī)耦合的模式。”
隨后,科大訊飛官方也給出了解釋:
科大訊飛的意思是他們提供的是語音識(shí)別技術(shù),并不是AI同傳,也并沒有提出AI同傳的概念。但是在這次事件中,科大訊飛的做法確實(shí)引起了誤解,事件還存在多處爭(zhēng)議,例如科大訊飛是否有意混淆AI同傳與人工同傳,科大訊飛的人機(jī)耦合具體如何操作?
我們先來回顧下Bell Wang描述的事情經(jīng)過。
9月20日早上,Bell Wang來到上海國際會(huì)議中心,支持2018創(chuàng)新與新興產(chǎn)業(yè)發(fā)展國際會(huì)議(IEID)的高端裝備技術(shù)與產(chǎn)業(yè)分會(huì)的現(xiàn)場(chǎng)同傳工作。
大會(huì)的第一位嘉賓是日本教授,由Bell Wang的同事進(jìn)行英文轉(zhuǎn)中文的同聲傳譯。大會(huì)現(xiàn)場(chǎng)有三塊屏幕,中間是發(fā)言人的演講PPT,左右兩邊分別以中文和英文的方式呈現(xiàn)演講字幕,兩邊屏幕都有 “訊飛聽見” 的logo。
(圖片來自知乎用戶Bell Wang)
Bell Wang發(fā)現(xiàn)英文字幕跟日本教授的說話內(nèi)容有很大出入,“可以說是胡話連篇了”,也就是說“訊飛聽見”難以聽懂日本教授酸爽的英語。
但是呢,另一邊的中文字幕卻是相當(dāng)連貫,顯然不是機(jī)器翻譯的。他也給出了實(shí)錘:
(圖片來自知乎用戶Bell Wang)
上圖這句話里有“就是”這樣的連詞,這是同傳人員順句驅(qū)動(dòng)時(shí)用于聯(lián)系語句用的。還有就是訊飛聽見將“Davos Forum”聽成 “Devils Forum”的時(shí)候,中文翻譯卻正確地顯示成“達(dá)沃斯論壇”。
按照正常流程,訊飛聽見是先識(shí)別英文,然后翻譯成中文,如果英文的識(shí)別錯(cuò)了,如何能翻譯正確呢?
Bell Wang認(rèn)為,“訊飛聽見”Logo會(huì)讓人誤以為中文字幕也是來自“訊飛聽見”,不過他也意識(shí)到,訊飛并沒有直接說中文字幕是自家AI翻譯的。所以他在文章也說他當(dāng)時(shí)能腦補(bǔ)出科大訊飛被戳穿后的辯詞:“我們這次使用的產(chǎn)品是訊飛聽見,識(shí)別同傳的翻譯打在屏幕上方便聽眾,并無意冒充AI同傳,對(duì)惡意造謠者,我們保留訴諸法律的權(quán)力”。
Bell Wang說自己當(dāng)時(shí)的心態(tài)是覺得惡心,但是也只能忍了。
真正讓Bell Wang起心要Diss科大訊飛是大會(huì)直播。知領(lǐng)直播介紹稱“國際高端會(huì)議聽不懂,知領(lǐng)更懂你!本次知領(lǐng)直播引入科大訊飛智能語音技術(shù),實(shí)現(xiàn)了國際高端會(huì)議的中英文頻道切換、智能翻譯和自動(dòng)語音播報(bào),帶給你不一樣的試聽體驗(yàn)!”
Bell Wang用手機(jī)錄了一段直播視頻,直播里是一位說中文的教授,然后訊飛AI說出的是英文。視頻中,教授在說:“講者說可以挖掘數(shù)據(jù),放入圖表”,但是訊飛卻說的是“put it in charge”,如果是訊飛將中文翻譯成英文,絕不可能出現(xiàn)這樣的情況。實(shí)際情況是訊飛識(shí)別了同傳人員的翻譯“put in chart”,誤聽成了“put in charge”。
也就是說,訊飛不是在做AI同傳,而是識(shí)別了同傳人員的語音翻譯然后念了出來。Bell Wang聲稱自己事先并不知道訊飛會(huì)用語音識(shí)別將同傳轉(zhuǎn)化為文字,同時(shí)也不知道直播會(huì)用AI識(shí)別同傳人聲翻譯再播報(bào)出來,是沒有征得同意就冒名使用翻譯成果。
最后Bell Wang說道 “也許有一天AI真的能做到理解自然語言,也許有一天我們這個(gè)職業(yè)會(huì)失業(yè),但絕不是現(xiàn)在;真正突破性的技術(shù)也不可能由一個(gè)沒有操守的公司研發(fā)出來。技術(shù)是無罪的,但以技術(shù)為名吸引資本的目的會(huì)不會(huì)導(dǎo)致虛假包裝和營銷呢?呵呵呵呵?!?/p>
以上是編輯根據(jù)Bell Wang在知乎的發(fā)文進(jìn)行的事件還原。
結(jié)合科大訊飛的回應(yīng),認(rèn)為有不少關(guān)鍵點(diǎn)值得討論。
首先,科大訊飛是不是在造假?
IEID大會(huì)上,科大訊飛用“訊飛聽見”識(shí)別了演講嘉賓的發(fā)言,將語音轉(zhuǎn)化為文字呈現(xiàn)在了屏幕上,同時(shí)也將同傳人員的語音翻譯轉(zhuǎn)化為字幕呈現(xiàn)在另一塊屏幕上,這次大會(huì)上訊飛沒有用到自家的AI翻譯,但是卻沒有表明翻譯是來自于同傳人員,會(huì)讓人誤導(dǎo)全程是“AI同傳”。同傳人員翻譯的成果明顯好于AI,則會(huì)進(jìn)一步誤導(dǎo)大家“AI同傳”已經(jīng)達(dá)到與真人翻譯一樣好的效果。
大會(huì)現(xiàn)場(chǎng),語音識(shí)別轉(zhuǎn)文字有很好的優(yōu)勢(shì),因?yàn)楹芏鄷r(shí)候要聽英文,又要聽同傳耳機(jī)中的中文翻譯會(huì)干擾人的注意力。那么,直播為何不用同傳的原聲呢?科大訊飛的解釋是,避免收聽不暢。
科大訊飛先識(shí)別了同傳人員的語音翻譯結(jié)果,然后再用AI將翻譯結(jié)果語音播報(bào)出來??墒?,AI語音播報(bào)時(shí)卻出現(xiàn)了多次錯(cuò)誤,這是不是有點(diǎn)多此一舉?
科大訊飛全程沒有用到AI翻譯,但是知領(lǐng)直播卻介紹說:“引入科大訊飛智能語音技術(shù),實(shí)現(xiàn)了國際高端會(huì)議的中英文頻道切換、智能翻譯和自動(dòng)語音播報(bào),帶給你不一樣的試聽體驗(yàn)!”
其次,人機(jī)耦合模式到底是啥?
訊飛從沒講過AI同傳的概念,始終強(qiáng)調(diào)是人機(jī)耦合的模式。
從科大訊飛的說明中我們可以看出科大訊飛的人機(jī)耦合和AI同傳確實(shí)不是一回事,“在十位嘉賓演講中,除了三位是由人工同傳的語音轉(zhuǎn)寫探索人機(jī)耦合模式,其余的全部是機(jī)器全自動(dòng)轉(zhuǎn)寫。并且,為了讓觀眾看得清楚,機(jī)器全自動(dòng)轉(zhuǎn)的都采用中英文同屏顯示,人工同傳轉(zhuǎn)寫的都只顯示一個(gè)語種”。
可以看到,大會(huì)上兩個(gè)屏幕分別顯示中文和英文,沒有同屏顯示。但是這樣微弱的區(qū)分,誰能清楚掌握?更合適的方式或許是直接表明此次大會(huì)的同傳由人工提供吧。
況且,這次大會(huì)是純?nèi)斯?,也沒用到所謂的人機(jī)耦合。除非,科大訊飛所謂的人機(jī)耦合就是訊飛聽見”將同傳人員的翻譯結(jié)果轉(zhuǎn)成文字嗎?這樣的話,機(jī)器并沒有做任何與同傳、翻譯相關(guān)的事情。
最后, AI同傳目前究竟什么水平?
其實(shí),AI同傳因?yàn)槟芰Σ粷?jì)在大會(huì)上出洋相的例子很多。
今年4月,博鰲亞洲論壇有4場(chǎng)分論壇應(yīng)用了騰訊AI同傳,結(jié)果,騰訊AI同傳現(xiàn)了單詞亂碼、連續(xù)出現(xiàn)同一個(gè)單詞的卡機(jī)狀況。
最囧的是,騰訊AI同傳將“一帶一路”變著花樣翻譯成了好幾種不同的說法。
此外,到目前為止,支持?jǐn)?shù)百場(chǎng)會(huì)議的搜狗AI同傳,在大會(huì)上也時(shí)常出現(xiàn)各種錯(cuò)誤。目前AI語音轉(zhuǎn)寫的準(zhǔn)確率只有90%左右,轉(zhuǎn)寫過后再翻譯的話,準(zhǔn)確率自然更低。
所以,科大訊飛董事長(zhǎng)劉慶峰多次表示,AI目前的翻譯水平還達(dá)不到同傳的要求。也一直強(qiáng)調(diào)AI不可能取代同傳從業(yè)人員,未來會(huì)是人機(jī)耦合。
AI同傳水平不濟(jì),但是大家卻已經(jīng)沒有耐心等待其完全成熟。在看來,不斷試錯(cuò)能促進(jìn)發(fā)展,但是直面弱點(diǎn)才能有所成長(zhǎng)吧。