騰訊云智能+視頻能力全面升級(jí),滿足行業(yè)智能化需求
騰訊云在2017騰訊全球合作伙伴大會(huì)云計(jì)算分論壇上正式宣布智能+視頻能力全面升級(jí),在視頻云的基礎(chǔ)上,為廣大各行各業(yè)用戶提供基于人臉識(shí)別、圖像識(shí)別、OCR識(shí)別、視頻鑒黃、音頻鑒黃、智能客服等人工智能技術(shù)與服務(wù),結(jié)合直播、點(diǎn)播、實(shí)時(shí)音視頻、短視頻、IM等視頻云通信平臺(tái)基礎(chǔ)產(chǎn)品并創(chuàng)造出更具行業(yè)特征的產(chǎn)品特性。
▲騰訊云視頻業(yè)務(wù)總經(jīng)理李郁濤
“智能+視頻”,1+1=N種智能行業(yè)應(yīng)用場(chǎng)景
隨著視頻云朝著行業(yè)垂直化、智能化的不斷滲透和發(fā)展,與人工智能相結(jié)合也已成行業(yè)趨勢(shì)。目前,在人工智能上占有一席之地的關(guān)于語(yǔ)音和圖像的AI技術(shù)種類就有很多,比如語(yǔ)音轉(zhuǎn)文字、文本轉(zhuǎn)語(yǔ)音、聲紋識(shí)別、證件識(shí)別、人臉識(shí)別等相關(guān)技術(shù),這對(duì)于絕大多數(shù)的業(yè)內(nèi)企業(yè)來(lái)說(shuō),巨大技術(shù)門檻是一道不可逾越的鴻溝,只能望“智”興嘆。
不僅如此,要啃下如此繁多且復(fù)雜的技術(shù),勢(shì)必會(huì)投入與之對(duì)應(yīng)的巨大人力和物力,同時(shí)也會(huì)是一場(chǎng)技術(shù)馬拉松,這對(duì)于普通企業(yè)來(lái)說(shuō)都是不太利于可持續(xù)發(fā)展的。企業(yè)應(yīng)當(dāng)在其自身核心業(yè)務(wù)中不斷發(fā)展并建立業(yè)內(nèi)領(lǐng)先優(yōu)勢(shì),現(xiàn)在大多數(shù)企業(yè)正不斷將其自身業(yè)務(wù)上云,結(jié)合云的優(yōu)勢(shì)來(lái)實(shí)現(xiàn)業(yè)務(wù)的增長(zhǎng)和突破已是行業(yè)共識(shí)。
作為視頻云行業(yè)的領(lǐng)先者,騰訊云在基于早兩年推出并在業(yè)內(nèi)建立領(lǐng)先地位的視頻云PaaS產(chǎn)品以來(lái),結(jié)合時(shí)下騰訊尖端人工智能技術(shù),面向企業(yè)用戶提供一整套“智能+視頻”的全新視頻以及通信平臺(tái)能力,旨在為企業(yè)客戶創(chuàng)造更多的智能化應(yīng)用場(chǎng)景。
在此次的解決方案中,騰訊云將語(yǔ)音和圖像方面的AI能力和視頻云基礎(chǔ)產(chǎn)品做了深度的融合和創(chuàng)新,不僅在原有的PaaS層服務(wù)結(jié)合AI技術(shù)有了重大升級(jí)之外,還提供了豐富的AI元素組件,幫助客戶更好地理解具體的技術(shù)能力場(chǎng)景,并加快集成各個(gè)產(chǎn)品和服務(wù)的所需的開發(fā)周期,應(yīng)對(duì)瞬息萬(wàn)變的市場(chǎng),給企業(yè)提供更有力的行業(yè)競(jìng)爭(zhēng)力。
三大能力升級(jí),音視頻識(shí)別準(zhǔn)確率99%
騰訊“智能+視頻”能力本次升級(jí)發(fā)布主要分為語(yǔ)音+AI、聲紋+AI、視頻+AI三個(gè)方面。
首先在語(yǔ)音+AI方面,騰訊云可提供語(yǔ)音文字互轉(zhuǎn)(語(yǔ)音轉(zhuǎn)文字、文字轉(zhuǎn)語(yǔ)音、語(yǔ)義識(shí)別)、廣告過(guò)濾、違禁檢測(cè)、涉政檢測(cè)等能力,可以有效過(guò)濾國(guó)家法律限制的物品信息、涉政敏感信息等,幫助用戶進(jìn)行敏感詞隔離和輿情監(jiān)控。
其次在聲紋+AI方面,騰訊云在去年推出鑒黃V1.0版后,再一次對(duì)升級(jí)了鑒黃能力,此次升級(jí)是通過(guò)音頻內(nèi)容、聲紋識(shí)別技術(shù),提供識(shí)別準(zhǔn)確率超過(guò)99%、檢索時(shí)間小于150ms的音頻鑒黃V2.0版,通過(guò)音頻鑒黃能力能夠廣泛用于版權(quán)保護(hù)、敏感過(guò)濾及游戲角色標(biāo)注等情況,進(jìn)一步擴(kuò)大鑒黃相關(guān)業(yè)務(wù)范圍。
在視頻+AI方面,騰訊云可在直播、點(diǎn)播等場(chǎng)景中可實(shí)現(xiàn)實(shí)時(shí)字幕和視頻內(nèi)容自動(dòng)翻譯。根據(jù)相關(guān)數(shù)據(jù)顯示,在環(huán)境噪聲50db左右、沒有回音消除的背景下用騰訊云的互動(dòng)直播音視頻會(huì)話時(shí),自動(dòng)字幕識(shí)別準(zhǔn)確率高達(dá)96%以上,識(shí)別的文本均在1S內(nèi)返回并顯示。
基于傳統(tǒng)圖像特征識(shí)別與深度學(xué)習(xí),騰訊云的手勢(shì)識(shí)別能力還可應(yīng)用于直播和短視頻上,動(dòng)態(tài)手勢(shì)識(shí)別率接近99%,而移動(dòng)客戶端CPU僅增長(zhǎng)2%。
此外,騰訊云基于綁卡驗(yàn)證、OCT技術(shù)、人臉識(shí)別、活體檢驗(yàn)、騰訊輔助身份信息大數(shù)據(jù)的多維度綜合模型,進(jìn)一步升級(jí)了直播平臺(tái)主播的身份實(shí)名認(rèn)證能力,識(shí)別通過(guò)率已高達(dá)95%,誤判率僅為0.01%,為互聯(lián)網(wǎng)網(wǎng)絡(luò)凈化又增加一大利器。
實(shí)際運(yùn)用已有成功案例
滿足行業(yè)智能化需求
目前,騰訊云的“智能+視頻”能力已經(jīng)在網(wǎng)絡(luò)庭審、小微客服機(jī)器人、微信小程序保險(xiǎn)定損、視頻檢索等實(shí)際運(yùn)用中有了成功案例。例如解決約80%小型案件的網(wǎng)絡(luò)庭審,騰訊云可智能識(shí)別語(yǔ)音所屬對(duì)象(法官、原告、被告、書記員等),語(yǔ)音文字識(shí)別準(zhǔn)確率95%以上,達(dá)到實(shí)時(shí)筆錄效果,釋放近90%書記員人力。
在微信小程序保險(xiǎn)定損之中,騰訊云可幫助保險(xiǎn)企業(yè)快速進(jìn)行OCR證件識(shí)別、視頻定損等,實(shí)現(xiàn)音視頻、小程序、AI的融會(huì)貫通。此外,騰訊云還讓媒體音像資料的視頻檢索成為可能,囊括市場(chǎng)主流視頻文件格式。
騰訊云視頻業(yè)務(wù)總經(jīng)理李郁濤表示,此次升級(jí)發(fā)布的“智能+視頻”能力,將騰訊云長(zhǎng)久以來(lái)的音視頻技術(shù)經(jīng)驗(yàn)和AI能力充分結(jié)合起來(lái),將幫助通信、視頻、社交、游戲、廣電等行業(yè)用戶更加智能化的開展業(yè)務(wù)。業(yè)內(nèi)分析認(rèn)為,騰訊“智能+視頻”能力的升級(jí)發(fā)布,也將有助于泛娛樂、在校教育、互聯(lián)網(wǎng)金融、線上法院、智能客服等新生業(yè)態(tài)的快速發(fā)展。