亞馬遜語音助手alexa 支持8種自然語音對標(biāo)谷歌
【導(dǎo)讀】:前不久谷歌開發(fā)者大會上,谷歌語音助手新增了不少的功能,其中自然聲音成為亮點,這邊亞馬遜不服了。亞馬遜語音助手alexa,新增支持8種自然語音對標(biāo)谷歌。
一、為什么都推崇自然語音?有多自然?
Alexa新?lián)碛械淖匀徽Z音,是通過Amazon Polly提供的。Amazon Polly是亞馬遜提供的基于深度學(xué)習(xí)技術(shù)將文本轉(zhuǎn)換為逼真語音的服務(wù)。
Amazon Polly支持語音合成標(biāo)記語言 (SSML),它是一種基于XML的W3C標(biāo)準(zhǔn)標(biāo)記語言,適用于語音合成應(yīng)用程序,且支持使用通用 SSML標(biāo)簽進(jìn)行斷句、重音和語調(diào)。
簡而言之,Amazon Polly合成的語音有語氣和聲調(diào)的高低起伏、有語速的快慢交替,也會在講話的過程中適時的停頓斷句。
那么,Amazon Polly是如何將它合成的語音發(fā)送到搭載了Alexa的智能設(shè)備上的呢?
Amazon Polly可以為開發(fā)者提供一個 API,借助此 API,開發(fā)者可以將合成語音快速集成到智能設(shè)備的應(yīng)用程序中。開發(fā)者只需將要轉(zhuǎn)換成語音的文本發(fā)送到 Amazon Polly API,Amazon Polly便會立即將音頻流發(fā)送回應(yīng)用程序中。有了這個API,開發(fā)者可以選擇讓用戶在應(yīng)用程序中進(jìn)行即時語音交互,或?qū)?Amazon Polly發(fā)送回來的音頻流以MP3的格式儲存下來。
Amazon Polly支持的語音、語種不止8種,它可以提供幾十種逼真的語音并支持多個語種。此次亞馬遜僅向Alexa語音應(yīng)用的開發(fā)者提供8種美式英語語音,或許是出于Alexa的很大一部分用戶目前集中于美國的原因。
二、亞馬遜為何要讓Alexa聽起來不一樣?
首先,讓Alexa能發(fā)出更多不同的聲音,有助于提升用戶使用Alexa的感觀,消除人與機(jī)器之間的距離感。例如,當(dāng)小朋友使用Alexa,讓其讀故事時,不同的語音和起伏的語調(diào)會更讓小朋友有代入感。
其次,科技巨頭們?yōu)榱俗プ「嘤脩?,在技術(shù)應(yīng)用上競爭激烈,亞馬遜此舉應(yīng)該是回應(yīng)谷歌上周于I/O大會上宣布Google Assitant將支持6種不同語音一事。谷歌I/O大會上,谷歌CEO Sundar Pichai向大家展示了Google Assitant上通過WaveNet合成的超自然語音,其中一個語音甚至來自于著名R&B歌手John Legend。Sundar Pichai說這是為了適應(yīng)Google Assitan用戶各種不同的發(fā)音習(xí)慣。
亞馬遜為了獲得用戶的芳心,也是煞費心思??墒菫槭裁粗挥杏⒄Z,沒有普通話呢?差評!有一天,語音助手能開口就對我們講出一口流利的粵語,東北話,估計會很受中國消費者歡迎了。
電子發(fā)燒友將于2018年12月6日在深圳舉辦中國物聯(lián)網(wǎng)大會,請對物聯(lián)網(wǎng)、智能汽車、智慧城市、智慧農(nóng)業(yè)、智慧家庭、NB-IoT等熱點領(lǐng)域的廠商和方案關(guān)注的電子工程師關(guān)注我們的大會??梢渣c擊進(jìn)入了解詳細(xì)內(nèi)容。
中國IoT大會由華強(qiáng)聚豐旗下百萬電子工程師平臺電子發(fā)燒友網(wǎng)舉辦,大會已成功舉辦4屆,以“高峰論壇+分論壇”的形式,聚集了100+全球知名廠商,成功吸引6,000+名相電子半導(dǎo)體從業(yè)人員報名參會,影響了20萬+電子工程師。
我們致力于引導(dǎo)中國IoT的風(fēng)向標(biāo),聚集全球IoT產(chǎn)業(yè)領(lǐng)袖,分析各產(chǎn)業(yè)的潛在市場價值,曝光最新技術(shù)方案,提供最佳交流平臺,力求與眾多合作伙伴構(gòu)建物聯(lián)網(wǎng)生態(tài)系統(tǒng)。
時間:2018年12月6日-7日
地點:中國深圳
預(yù)期規(guī)模:2,000+