可用于智能機(jī)器人的互聯(lián)網(wǎng)知識庫都有哪些
掃描二維碼
隨時隨地手機(jī)看文章
(文章來源:百家號)
知識工程、Web數(shù)據(jù)挖掘、自然語言處理等領(lǐng)域大量的研究工作,致力于大規(guī)模知識的獲取,為打造機(jī)器智腦提供了豐富的知識庫來源。目前互聯(lián)網(wǎng)上可用于智能機(jī)器人的知識庫包括以下各類知識:
事實知識(Factual Knowledge)是關(guān)于某個特定實體的基本事實。例如(中國,首都,北京)。事實知識是知識圖譜中最常見的知識類型。大部分實體的事實可以對應(yīng)實體的特定屬性或者關(guān)系。很多以實體為中心組織的知識庫均富含此類知識,比如DBpedia、Freebase以及CN-DBpedia等。
概念知識(Taxonomy Knowledge)分為兩類,一類是實體與概念之間的類屬關(guān)系,例如(柏拉圖,哲學(xué)家)另一類為子概念與父概念的子類關(guān)系(Subclass,比如(唯心主義哲學(xué)家,Subclassof,哲學(xué)家)一個概念有子概念,也可能同時具有父概念,使得整個概念集合構(gòu)成層級體系。概念之間的層級關(guān)系是本體定義中最為重要的部分,特定領(lǐng)域的概念知識是機(jī)器認(rèn)知領(lǐng)域的基本框架。
典型概念知識圖譜(有時簡稱概念圖譜)包括Yago、Probase、WikiTaxonomy等。概念是歸納的前提,是基于概念推理的(類別推理taxonomy reasoning)依據(jù)。概念知識是一種典型的元知識(meta-knowledge)元知識除了概念知識之外還包括概念之間的屬性,概念與屬性的領(lǐng)域與約束等這些知識通常在傳統(tǒng)的本體中加以定義與明確。
詞匯知識:主要包括實體與詞匯之間的關(guān)系(比如實體的命名、稱謂、英文名等)以及詞匯之間的關(guān)系(包括同義詞、反義詞、縮寫詞以及上下位詞關(guān)系等)例如(柏拉圖,英文名,“Plato”)(趙匡胤,廟號,宋太祖)、(妻子,同義詞,老婆)些跨語言知識庫比如BabelNet,專注于建立實體或概念之間的跨語言等價關(guān)系。
? ? ? ?詞匯知識的自動化獲取在目前的實際應(yīng)用中已經(jīng)取得較好效果。從豐富的領(lǐng)域語料自動挖掘領(lǐng)域詞匯,并建立詞匯之間的語義關(guān)聯(lián)以及詞匯與實體之間的關(guān)聯(lián)已經(jīng)成為知識圖譜構(gòu)建最為重要的一步。詞匯知識也是相對簡單的知識。人類學(xué)習(xí)某個新領(lǐng)域往往是從該領(lǐng)域的術(shù)語或者詞匯開始的。因此,賦予機(jī)器認(rèn)知領(lǐng)域詞匯,是實現(xiàn)機(jī)器認(rèn)知整個領(lǐng)域知識的第一步。此類典型知識圖譜包括WordNet等。
常識知識:常識是人類通過身體與世界交互而積累的經(jīng)驗與知識,是人們在交流時無須言明就能理解的知識。例如我們都知道鳥有翅膀,鳥能飛等。再比如,若x是個人,那么x要么是男人,要么是女人。常識的表征與定義、獲取與理解等問題一直都是人工智能發(fā)展的瓶頸。常識知識的基本特點是我們每個人都知道,但很少在文本里提及,使得基于文本抽取的常識獲取方式效果有限。典型的常識知識圖譜包括Cyc、ConceptNet等。
領(lǐng)域知識服務(wù)機(jī)器人需要建立人類社會與生活相關(guān)的方方面面的知識庫。比如日常陪伴機(jī)器人需要具備衣食住行等各方面的知識庫,當(dāng)用戶抱怨“空氣不好”時,機(jī)器人能夠開啟空氣凈化器;當(dāng)用戶感冒了,機(jī)器人應(yīng)該能夠結(jié)合醫(yī)學(xué)和用戶醫(yī)療知識庫提供相應(yīng)的藥物與生活建議;在午餐時間,機(jī)器人能通過飲食知識庫推薦近期的飲食等。