帶你了解數(shù)據(jù)信息知識之間的關(guān)系與區(qū)別
大數(shù)據(jù)是比較火的一個熱詞,但說到什么是數(shù)據(jù),很多人首先想到的是數(shù)字,如1,2,3等。其實這是數(shù)據(jù)的狹義定義。數(shù)據(jù)所涉及的范圍很廣,并且隨著技術(shù)的發(fā)展,數(shù)據(jù)的定義范圍也越來越寬泛,比如在互聯(lián)網(wǎng)時代文字,圖片和視頻都是數(shù)據(jù),醫(yī)院里面的醫(yī)學(xué)影像圖片也都是數(shù)據(jù),甚至包括公司和工廠的設(shè)計圖案、解決方案等等。
數(shù)據(jù)是一種客體存在,并隨著文明的發(fā)展而不斷擴大和變化。以前并不是數(shù)據(jù)的,但現(xiàn)在看來都已經(jīng)變成了數(shù)據(jù)內(nèi)的范疇,比如在互聯(lián)網(wǎng)出現(xiàn)之前,文字并不被認(rèn)為是數(shù)據(jù),但是互聯(lián)網(wǎng)出來以后,通過將文字進行電子化儲存,因此成了可以計算的文本,這就涉及到自然語言處理技術(shù)。甚至包括我們聊天記錄、網(wǎng)頁內(nèi)容、打電話記錄、用戶生存內(nèi)容(UGC)、論壇評論,購物數(shù)據(jù),社會關(guān)系,行程記錄等等都是數(shù)據(jù)內(nèi)容。數(shù)據(jù)也經(jīng)歷了從結(jié)構(gòu)化到非結(jié)構(gòu)化的轉(zhuǎn)變,而且非結(jié)構(gòu)化數(shù)據(jù)中蘊含這更大的價值。
由于人們多數(shù)據(jù)的概念沒有那么清晰,容易將數(shù)據(jù)、信息和知識這三個的理念弄混,特別是數(shù)據(jù)與信息,真是傻傻分不清楚。雖然數(shù)據(jù)、信息、知識之間存在這聯(lián)想,但還是很有必要將三者有個合理的認(rèn)識,下面就來詳細(xì)講講他們之間的區(qū)別與關(guān)系。
信息是對世界人和事等描述,它比數(shù)據(jù)更加抽象。信息是隱藏在數(shù)據(jù)背后的規(guī)律,需要人類的挖掘和探索才能夠發(fā)現(xiàn)。比如地球的面積和質(zhì)量,物理學(xué)中的參數(shù),圓周率等。
數(shù)據(jù)是信息的載體,從數(shù)據(jù)到信息不僅是一門技術(shù),也是一門藝術(shù)。以胡夫大金字塔為例,該金字塔的周長和高度的比值為大約6.29,金字塔的長為20埃及古尺長,寬為10埃及古尺長,但高度為11.18埃埃及古尺長。為什么不是一個整數(shù)?
通過考古專家的分析,這是為了保證對角線都是整數(shù),分別是15和25。通過對這些數(shù)據(jù)處理,我們可以得到在古埃及就懂得了勾股定理。
數(shù)據(jù)和信息處理以后就會得到知識。而知識是數(shù)據(jù)和信息的更加高級和抽象的概念。知識具有系統(tǒng)性、規(guī)律性和可預(yù)測性。
數(shù)據(jù)、信息和知識這三者都是社會生產(chǎn)活動中的一種基礎(chǔ)性資源,都可以采用數(shù)宇、文宇、符號、圖形、聲音、影視等多媒體來表示。而且,它們都同時具有客觀性、真實性、正確性、價值性、共享性,結(jié)構(gòu)性等特點。
比如我們通過觀察可以記錄星球的位置和出現(xiàn)的時間等原始數(shù)據(jù),再對得到的數(shù)據(jù)進行分析和挖掘,就能夠計算出星球運動的規(guī)律,這就是信息,然后對信息進行總結(jié)和提煉,就可以得到開普勒三定律,這就是知識。而得到的知識,能夠使我們更加清晰的了解世界和生活,還能夠通過知識不斷改變我們周圍的世界。而所有的一切的基礎(chǔ)就是數(shù)據(jù)。
數(shù)據(jù)、信息和知識是知識工作者對客觀事物感知和認(rèn)識的3個連貫的階段。
(1)數(shù)據(jù)的組織階段。數(shù)據(jù)是一種將客觀事物按照某種測度感知而獲取的原始記錄,它可以直接來自測量儀器的實時記錄,也可以來自人的認(rèn)識,但是大量的數(shù)據(jù)多是借助于數(shù)據(jù)處理系統(tǒng)自動地從數(shù)據(jù)源進行采集和組織的。數(shù)據(jù)源是指客觀事物發(fā)生變化的實時數(shù)據(jù)。
(2)信息的創(chuàng)造階段。信息是根據(jù)一定的發(fā)展階段及其目的進行定制加工而生產(chǎn)出來的。信息系統(tǒng)就是用于加工、創(chuàng)造信息產(chǎn)品的人機系統(tǒng)。根據(jù)對象、目的和加工深度的不同,可以將信息產(chǎn)品分為一次信息、二次信息直至高次信息。
(3)知識的發(fā)現(xiàn)階段。知識是知識工作者運用大腦對獲取或積累的信息進行系統(tǒng)化的提煉、研究和分析的結(jié)果,知識能夠精確地反映事物的本質(zhì)。
從數(shù)據(jù)到信息再到知識,3個階段是螺旋上升的循環(huán)周期。人們運用信息系統(tǒng),對信息和相關(guān)的知識進行規(guī)律性、本質(zhì)性和系統(tǒng)性的思維活動,創(chuàng)造新的知識。之后,新的知識又開辟了需要進一步認(rèn)識的對象領(lǐng)域,然后使人們補充獲取新的數(shù)據(jù)和信息,進人新一輪的上升式循環(huán)周期。