(文章來源:人工智能網)
智能語音是人工智能技術的重要組成部分,包括語音識別、語義理解、自然語言處理、語音交互等。當前,人工智能的關鍵技術均以實現感知智能和認知智能為目標。語音識別、圖像識別和機器人視覺、生物識別等目前最火熱的領域,主要解決的是感知智能的需求,就是使得人工智能能夠感知周圍的世界,能夠“聽見”或者“看到”。
自然語言理解、智能會話、智能決策、人機交互等技術更加側重的是認知智能的領域,解決“聽懂”、“看懂”,并且根據學習到的知識對人類的要求或者周圍的環(huán)境做出反應的能力。在關鍵技術層中,語音識別、自然語義理解(Nature Language Process, NLP)、機器學習領域的關鍵技術在人工智能技術當中居于重要地位,是人機交互技術的基礎。
智能語音技術在經濟社會中應用場景持續(xù)擴展,目前已被廣泛應用于教育、醫(yī)療、客服、個人語音助手等行業(yè)市場和個人用戶等領域。中國智能語音市場已形成了包括上游的基礎設施制造(芯片、傳感器、算力)、中游的技術實現(語音合成、語音識別、語義理解等)以及下游的眾多應用服務(家居、客服、教育等)的完整產業(yè)鏈結構。
智能語音技術在整個產業(yè)鏈中起到了承接的作用,將人工智能的技術低層產業(yè)化,并在智能家居、可穿戴設備、機器人等行業(yè)落地,是整個人工智能產業(yè)鏈中的關鍵一環(huán)。根據中國信息通信研究院的數據顯示,2018年中國人工智能市場規(guī)模達230億元,智能語音所占市場份額為22%,約50.4億元。
在整個人工智能產業(yè)中,智能語音產業(yè)化程度相對成熟,是所占份額比例較大的細分領域,由2014年的8.5億元人民幣發(fā)展至2018年的50.4億元人民幣,整個行業(yè)始終保持著高速發(fā)展,并將在未來持續(xù)保持下去。預計到2023年,智能語音行業(yè)市場規(guī)模將突破100億元人民幣。
智能語音技術以其廣闊的產業(yè)化應用席卷人們日常生活和工作的方方面面,其產業(yè)規(guī)模的大幅提升主要源于兩方面的驅動支持。第一,大數據、云計算等技術的快速發(fā)展使得智能語音技術的應用不斷成熟,能夠滿足政府、金融、家電、汽車等多領域垂直行業(yè)的應用需求。
第二,各國政府、相關行業(yè)及資本都持續(xù)關注智能語音技術的研發(fā)和產業(yè)化。作為戰(zhàn)略性和前瞻性的重要新興產業(yè),語音交互技術始終是世界各國科學界和投資界的關注焦點,各國都力爭率先取得關鍵技術突破,占據產業(yè)先機位置,以取得智能語音產業(yè)的領導權。中國、美國、歐洲、日本等國政府均專門立項予以重點扶持,并投入重金設立專項計劃。
相比西方國家,語音識別技術和自然語言處理技術在中國的發(fā)展尤其迅猛,很大程度上是由自身的獨特因素所導致。如用戶規(guī)模較大,以及中文難以手寫等。
(1)用戶群體龐大:作為人口大國,中國有著更大的用戶基數,且人均資源少,可用機器替代的崗位數量多于其余國家,有著廣闊的增長空間。如在客服領域,在中國每個客服需要處理的業(yè)務數量遠大于西方國家,智能語音識別技術能夠很好地解決類似問題。
(2)中文難以手寫:與其他語系的文字相比,中文的手寫較為繁瑣,語音相比打字是一種更為自然的輸入方式。且漢語句法和語法相對簡單,沒有虛擬語氣和條件語句,降低了語音識別的難度。
? ? ? ?