搜狗率先發(fā)布個性化語音識別技術(shù)
(文章來源:CCTIME飛象網(wǎng))
搜狗最新推出的“個性化語音識別”服務,在語音輸入識別準確率及識別速度方面實現(xiàn)全面提升。此次產(chǎn)品升級后,基于搜狗領先的語音識別技術(shù)及為用戶制定的專屬詞匯庫,搜狗語音輸入就像擁有了“讀心術(shù)”,大幅提升了語音識別準確率,降低了用戶在語音輸入后的手動調(diào)整率。這一“超能力”讓用戶直呼搜狗輸入法越來越“懂人心”。
語音擴展了手機輸入法的場景適用范圍,支持用戶在不方便手動輸入的情況下,一鍵語音錄入文本內(nèi)容。由于語音識別的精準度會直接影響用戶使用頻率和使用場景,因此,如何有效提高語音識別的準確性,是輸入法行業(yè)的尖端技術(shù)之爭。搜狗此次突破此技術(shù)難關(guān),在語音輸入領域率先推出“個性化語音識別”,大幅優(yōu)化了用戶在語音內(nèi)容錄入時的使用體驗。
同音詞組、用戶慣用語、口頭禪等一直是語音輸入的“重災區(qū)”,搜狗輸入法的“個性化語音識別”可切實解決這一類問題。比如,當用戶語音錄入“cheng zhi”時,輸入結(jié)果顯示“誠摯、橙汁、懲治”等大眾通用詞匯的概率比較大,一般對于人名“程志”的敏感度則不高?!皞€性化語音識別”在AI語音識別技術(shù)及大數(shù)據(jù)融合的基礎上,挖掘用戶個性化內(nèi)容,可有效提升具備個人特色詞句的識別準確率,降低用戶語音輸入過程中的手動修改率,讓用戶在日常生活中表達、傳遞信息的效率再次提高。
市場上大部分智能設備都支持語音喚醒功能,這是語音識別技術(shù)的第一階段“聽懂”,將“聽懂”的語音轉(zhuǎn)換成相應的文字,同時還要保證轉(zhuǎn)換的準確性,這是語音識別技術(shù)的第二個階段“讀心”。
第一階段“聽懂”已經(jīng)在各行業(yè)中發(fā)展成熟,是因為經(jīng)過算法輔助和程序糾正,即使機器獲取的語音素材不那么完整,也能理解語音基本含義,并作出相應反應。第二階段“讀心”難在如何對用戶個人的語音進行精準識別,以使另一方在接受信息時,不會因為“文本畸意”產(chǎn)生誤解。
目前,搜狗通用語音識別已全面引入了行業(yè)前沿的深度學習技術(shù),其中基于DTSS(Deep Transformer-based Sequence to Sequence model)的端到端聲學模型、神經(jīng)網(wǎng)絡語言模型和智能標點預測等技術(shù),可有效推動搜狗語音識別的通用效果和體驗,在行業(yè)中處于領先地位。此次“個性化語音識別”針對用戶的語音輸入習慣進行精準優(yōu)化,從而使得在保障通用識別準確性的情況下,還可將用戶常用語詞組錯誤率相對下降近40%,實現(xiàn)語音識別第二階段“讀心”的至關(guān)技術(shù)突破。
語音輸入是人與機器實現(xiàn)溝通的橋梁,現(xiàn)如今,人工智能科技發(fā)展迅速、滲入領域遼闊,AI智能科技產(chǎn)品種類不斷豐富,這些都意味著輸入領域需要更高精尖輸入技術(shù)的革新。搜狗輸入法在開創(chuàng)初期最大的特點是實現(xiàn)了輸入法和互聯(lián)網(wǎng)的結(jié)合,一直以來對于互聯(lián)網(wǎng)科技的發(fā)展趨勢都有著靈敏的嗅覺,“個性化語音識別”正是順應新潮流的智慧科技產(chǎn)物。
不難想象,在人工智能普及的未來,通過搜狗語音個性化資源的實現(xiàn),可有效提高用戶人機自然交互的語音轉(zhuǎn)化。除此之外,“個性化語音識別”還可根據(jù)用戶私人特征和性格習慣,在智能家居、智能教育、智能醫(yī)療等與大眾日常生活息息相關(guān)的各個產(chǎn)業(yè)領域,為用戶構(gòu)造專屬習慣用語詞庫,為用戶打造與AI智能設備最輕松的語音環(huán)境。
從大眾化到個性化,從滿足普遍適用到細化私人特征,在人工智能、機器學習引領的智慧科技時代,精準個性化用戶服務是每個互聯(lián)網(wǎng)科技產(chǎn)品的剛需。從“聽懂”到“讀心”,搜狗“個性化語音識別”增強了輸入法產(chǎn)品的私人屬性,滿足了用戶個性特征的表達,可賦能科技時代智慧輸入法新理念。