交網絡的興起,各種智能終端的出現。將來產生大數據的還有一塊,就是智能制造這塊,可能比前面這些產生的數據還要多。從大數據的種類來看,大數據實際上包括小數據,我們談大數據的時候,一定不要把它和小數據完全隔離開來,因為它一定包括小數據,也包括過去我們常使用的統計數據,當然現在越來越多地表現為交易的數據和行為的數據,以及傳感數據等,具備的基本特點是多、雜、碎、快。
此外,它還能做一些小數據不能做的事。大數據分為五個功能,第一個,識別的功能,可以識別人的身份、位置、狀態(tài)、真假。這和以前的互聯網是有區(qū)別的?;ヂ摼W1993年剛剛商業(yè)化的時候,流傳著一句話,就是“在互聯網上,沒有人知道你是一條狗”,現在不一樣了,現在在網上不僅知道你是不是一條狗,他還知道你喜歡誰。
第二個,重現功能。我剛才一進這個屋,首先就注意到這個攝像功能,誰要干壞事,可以把它拉過來重新看一遍,非常容易。重現功能還可以實現食品的追溯、藥品的追溯等。第三個,關聯功能。過去在工業(yè)經濟時代,我們更加注重因果關系,誰是因,誰是果,現在強調一種相關的關系,它可以產生一些聯想和具體分析。像我們搞搜索的時候,搜索出很多的東西,還有廣告的推送,就是聯想在發(fā)揮作用。
我們知道,比如啤酒與尿布的關系,比如人們喜歡吃得最多的是草莓,等等,都可以通過分析得出結論。第四個,溢價效應。一組數據一旦被公開,會產生一系列新的數據。這幾年我發(fā)現北京、上海以及我們貴州這邊,都在做數據的這種大數據使用的競賽活動,大家發(fā)現公布一組數據以后,會得到很多種新的創(chuàng)新應用方案,產生新的數據,而且能夠得出一些規(guī)律,產生一些作用。第五個,預測功能。
通過大數據,可以預測經濟的變化、天氣的變化,可以預測自然災害,也可以預測一些疾病的流行,更可以預測一些人的基本行為。這些都是大數據可以做一些過去小數據做不了的事。