www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀]   自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,

  自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯系,但又有重要的區(qū)別。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現自然語言通信的計算機系統(tǒng),特別是其中的軟件系統(tǒng)。因而它是計算機科學的一部分。

  自然語言處理(NLP)是計算機科學,人工智能,語言學關注計算機和人類(自然)語言之間的相互作用的領域。

  總結自然語言處理發(fā)展的曲折歷史可以看出,基于規(guī)則的理性主義方法和基于統(tǒng)計的經驗主義方法各有千秋,因此,我們應當用科學的態(tài)度來分析它們的優(yōu)點和缺點。

  我們認為,基于規(guī)則的理性主義方法的優(yōu)點是:

  * 基于規(guī)則的理性主義方法中的規(guī)則主要是語言學規(guī)則,這些規(guī)則的形式描述能力和形式生成能力都很強,在自然語言處理中有很好的應用價值。

  * 基于規(guī)則的理性主義方法可以有效地處理句法分析中的長距離依存關系(long-distance dependencies)等困難問題,如句子中長距離的主語和謂語動詞之間的一致關系(subject-verb agreement)問題,wh 移位(wh-movement)問題。

  * 基于規(guī)則的理性主義方法通常都是明白易懂的,表達得很清晰,描述得很明確,很多語言事實都可以使用語言模型的結構和組成成分直接地、明顯地表示出來。

  * 基于規(guī)則的理性主義方法在本質上是沒有方向性的,使用這樣的方法研制出來的語言模型,既可以應用于分析,也可以應用于生成,這樣,同樣的一個語言模型就可以雙向使用。

  * 基于規(guī)則的理性主義方法可以在語言知識的各個平面上使用,可以在語言的不同維度上得到多維的應用。這種方法不僅可以在語音和形態(tài)的研究中使用,而且,在句法、語義、語用、篇章的分析中也大顯身手。

  * 基于規(guī)則的理性主義方法與計算機科學中提出的一些高效算法是兼容的,例如,計算機算法分析中使用Earley 算法(1970 年提出)和Marcus 算法(1978 年提出)都可以作為基于規(guī)則的理性主義方法在自然語言處理中得到有效的使用。

  基于規(guī)則的理性主義方法的缺點是:

  * 基于規(guī)則的理性主義方法研制的語言模型一般都比較脆弱,魯棒性很差,一些與語言模型稍微偏離的非本質性的錯誤,往往會使得整個的語言模型無法正常地工作,甚至導致嚴重的后果。不過,近來已經研制出一些魯棒的、靈活的剖析技術,這些技術能夠使基于規(guī)則的剖析系統(tǒng)在剖析失敗中得到恢復。

  * 使用基于規(guī)則的理性主義方法來研制自然語言處理系統(tǒng)的時候,往往需要語言學家、語音學家和各種專家的配合工作,進行知識密集的研究,研究工作的強度很大;基于規(guī)則的語言模型不能通過機器學習的方法自動地獲得,也無法使用計算機自動地進行泛化。

  * 使用基于規(guī)則的理性主義方法設計的自然語言處理系統(tǒng)的針對性都比較強,很難進行進一步的升級。例如,斯羅肯(Slocum)在1981 年曾經指出,LIFER 自然語言知識處理系統(tǒng)在經過兩年的研發(fā)之后,已經變得非常之復雜和龐大,以至于這個系統(tǒng)原來的設計人很難再對它進行一點點的改動。對于這個系統(tǒng)的稍微改動將會引起整個連續(xù)的“水波效應”(ripple effect),以至于“牽一發(fā)而動全身”,而這樣的副作用是無法避免和消除的。

  * 基于規(guī)則的理性主義方法在實際的使用場合其表現往往不如基于統(tǒng)計的經驗主義方法那樣好。因為基于統(tǒng)計的經驗主義方法可以根據實際訓練數據的情況不斷地優(yōu)化,而基于規(guī)則的理性主義方法很難根據實際的數據進行調整。基于規(guī)則的方法很難模擬語言中局部的約束關系,例如,單詞的優(yōu)先關系對于詞類標注是非常有用的,但是基于規(guī)則的理性主義方法很難模擬這種優(yōu)先關系。

  不過,盡管基于規(guī)則的理性主義方法有這樣的或那樣的不足,這種方法終究是自然語言處理中研究得最為深入的技術,它仍然是非常有價值和非常強有力的技術,我們決不能忽視這種方法。事實證明,基于規(guī)則的理性主義方法的算法具有普適性,不會由于語種的不同而失去效應,這些算法不僅適用于英語、法語、德語等西方語言,也適用于漢語、日語、韓國語等東方語言。在一些領域針對性很強的應用中,在一些需要豐富的語言學知識支持的系統(tǒng)中,特別是在需要處理長距離依存關系的自然語言處理系統(tǒng)中,基于規(guī)則的理性主義方法是必不可少的。

 

  我們認為,基于統(tǒng)計的經驗主義方法的優(yōu)點是:

  * 使用基于統(tǒng)計的經驗主義方法來訓練語言數據,從訓練的語言數據中自動地或半自動地獲取語言的統(tǒng)計知識,可以有效地建立語言的統(tǒng)計模型。這種方法在文字和語音的自動處理中效果良好,在句法自動分析和詞義排歧中也初露鋒芒。

  * 基于統(tǒng)計的經驗主義方法的效果在很大的程度上依賴于訓練語言數據的規(guī)模,訓練的語言數據越多,基于統(tǒng)計的經驗主義方法的效果就越好。在統(tǒng)計機器翻譯中,語料庫的規(guī)模,特別是用來訓練語言模型的目標語言語料庫的規(guī)模,對于系統(tǒng)性能的提高,起著舉足輕重的作用。因此,可以通過擴大語料庫規(guī)模的辦法來不斷提高自然語言處理系統(tǒng)的性能。

  * 基于統(tǒng)計的經驗主義方法很容易與基于規(guī)則的理性主義方法結合起來,從而處理語言中形形色色的約束條件問題,使自然語言處理系統(tǒng)的效果不斷地得到改善。

  * 基于統(tǒng)計的經驗主義方法很適合用來模擬那些有細微差別的、不精確的、模糊的概念(如“很少、很多、若干”等),而這些概念,在傳統(tǒng)語言學中需要使用模糊邏輯(fuzzy logic)才能處理。

  基于統(tǒng)計的經驗主義方法的缺點是:

  * 使用基于統(tǒng)計的經驗主義方法研制的自然語言處理系統(tǒng),其運行時間是與統(tǒng)計模式中所包含的符號類別的多少成比例線性地增長的,不論在訓練模型的分類中還是在測試模型的分類中,情況都是如此。因此,如果統(tǒng)計模式中的符號類別數量增加,系統(tǒng)的運行效率會明顯地降低。

  * 在當前語料庫技術的條件下,要使用基于統(tǒng)計的經驗主義方法為某個特殊的應用領域獲取訓練數據,還是一件費時費力的工作,而且很難避免出錯?;诮y(tǒng)計的經驗主義方法的效果與語料庫的規(guī)模、代表性、正確性以及加工深度都有密切的關系,可以說,用來訓練數據的語料庫的質量在很大的程度上決定了基于統(tǒng)計的經驗主義方法的效果。

  * 基于統(tǒng)計的經驗主義方法很容易出現數據稀疏的問題,隨著訓練語料庫規(guī)模的增大,數據稀疏的問題會越來越嚴重,這個問題需要使用各種平滑(smoothing)技術來解決。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉