什么是大數(shù)據(jù)分析?大數(shù)據(jù)又可以帶來(lái)什么?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
本文中,小編將對(duì)大數(shù)據(jù)予以介紹,如果你想對(duì)大數(shù)據(jù)的詳細(xì)情況有所認(rèn)識(shí),或者想要增進(jìn)對(duì)大數(shù)據(jù)的了解程度,不妨請(qǐng)看以下內(nèi)容哦。
一、什么是大數(shù)據(jù)分析
正如前面說(shuō)的,大數(shù)據(jù)分析其實(shí)就體現(xiàn)在“大”這個(gè)特點(diǎn)上,即對(duì)規(guī)模巨大的數(shù)據(jù)進(jìn)行分析。比較經(jīng)典也比較廣為接受的對(duì)大數(shù)據(jù)概念的定義為IBM提出的“5V”特征:1.數(shù)據(jù)量大(Volume,數(shù)據(jù)存量大,待處理分析的數(shù)據(jù)規(guī)模大);2.速度快(Velocity,不僅是存量大,數(shù)據(jù)的增長(zhǎng)速度也快,這就對(duì)及時(shí)的大數(shù)據(jù)處理也提出了要求);3.類型多(Variety,數(shù)據(jù)類型可以歸為結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化,但具體的形式卻千差萬(wàn)別,盡管最后都會(huì)轉(zhuǎn)化為數(shù)據(jù)流,但不同形式的數(shù)據(jù)處理的方法和難度并不相同);4.價(jià)值(Value,大數(shù)據(jù)的處理成本大,于是我們需要常常思考,我們分析大數(shù)據(jù)的價(jià)值是什么,而我個(gè)人的觀點(diǎn)是:數(shù)據(jù)是客觀現(xiàn)實(shí)的一個(gè)反饋,我們分析數(shù)據(jù)其實(shí)是在分析過(guò)去,它一定是有價(jià)值,只不過(guò)這個(gè)價(jià)值的挖掘難易程度不盡相同);5.真實(shí)性(Veracity,數(shù)據(jù)量大一定會(huì)伴隨這數(shù)據(jù)的失真,部分?jǐn)?shù)據(jù)不確定的情況,所以在分析過(guò)程中還要考慮數(shù)據(jù)的真實(shí)性問(wèn)題,這決定了從中挖掘出的數(shù)據(jù)價(jià)值的難易)。
這只是眾多定義中的一種,其他的定義也是一樣的,總的來(lái)說(shuō)就是,“大數(shù)據(jù)”首先的特點(diǎn)是量大,這就導(dǎo)致了處理難度的升高,那這件事這么費(fèi)勁會(huì)什么要做呢?就得了解到大數(shù)據(jù)的潛在價(jià)值。當(dāng)然,我個(gè)人覺(jué)得,現(xiàn)在的大數(shù)據(jù)處理的價(jià)值在于可以通過(guò)中央平臺(tái)去同時(shí)處理海量的數(shù)據(jù),節(jié)省空間和成本,大家應(yīng)該會(huì)有感觸,就是很多公司會(huì)建立自己的數(shù)據(jù)中臺(tái),輸出各種數(shù)據(jù)、圖表和報(bào)告,相當(dāng)于一個(gè)大的數(shù)據(jù)池,但是具體的分析為什么還是要落實(shí)到各個(gè)業(yè)務(wù)線呢,就是因?yàn)閷?shí)際中的東西千差萬(wàn)別,很難用一套既定的方法或模式走太遠(yuǎn),所以需要結(jié)合各個(gè)業(yè)務(wù)部門對(duì)實(shí)際的客戶需求的理解、對(duì)實(shí)際數(shù)據(jù)的理解進(jìn)行再加工。推薦大家可以去看本書:《痛點(diǎn)》,它是大數(shù)據(jù)分析下的一股清流,專注于小數(shù)據(jù)分析,從小數(shù)據(jù)中挖掘出價(jià)值。
二、大數(shù)據(jù)可帶來(lái)什么
人們對(duì)大數(shù)據(jù)的癡迷是可以理解的。畢竟,在現(xiàn)實(shí)生活中,有很多分歧和不同的意見(jiàn)。最有說(shuō)服力的往往是數(shù)據(jù)。冰冰的數(shù)據(jù)往往是非主觀的,它確實(shí)比主觀的觀點(diǎn)更值得信賴,這意味著社會(huì)進(jìn)步已經(jīng)取得了進(jìn)步!但一旦大數(shù)據(jù)(Big data)被夸大或不當(dāng)使用,人們的錯(cuò)誤觀點(diǎn)往往會(huì)加深并進(jìn)一步固化!
大數(shù)據(jù)起著很大的作用,可以給我們帶來(lái)很多好處,但是它并不是萬(wàn)能的,也有很多的局限性,一旦迷信的大數(shù)據(jù)沒(méi)有做認(rèn)真的分析和判斷,往往把這個(gè)偶然的現(xiàn)象當(dāng)作規(guī)律來(lái)處理,這時(shí)你就會(huì)投入大量的資源去分配,教訓(xùn)就會(huì)接踵而至!
大數(shù)據(jù)主要做三件事:了解用戶,了解信息,了解關(guān)系。如果這三件事之間還有一件事要提及的話,那就是所謂的趨勢(shì);還有政府所做的輿論監(jiān)督,它可以監(jiān)測(cè)大規(guī)模的數(shù)據(jù)和分析人們的活動(dòng)行為。大數(shù)據(jù)最大的特點(diǎn)是數(shù)據(jù)量大、種類多,記錄了大量的細(xì)節(jié)、過(guò)程,存儲(chǔ)了各種記錄和信息
但是大數(shù)據(jù),利用效率較低、質(zhì)量差、內(nèi)容繁雜、占用存儲(chǔ)空間大。大數(shù)據(jù)記錄太多數(shù)據(jù),不一定都是需要的,有時(shí)重要的信息只占很低比例,這就是質(zhì)量低、利用效率低。大數(shù)據(jù)是人工智能、智慧城市等的基礎(chǔ),因?yàn)橛写罅繑?shù)據(jù),得以使人工智能快速訓(xùn)練、從中提取經(jīng)驗(yàn);獲取重要信息、聯(lián)合組網(wǎng),形成規(guī)模宏大的智慧集群。
大數(shù)據(jù)是中性的,有利有弊。要記錄數(shù)據(jù)、從大量數(shù)據(jù)中、獲取有用的數(shù)據(jù)、篩濾信息、對(duì)有用數(shù)據(jù)進(jìn)行提取、排序等,需要消耗大量的資源去處理。大數(shù)據(jù)不僅僅指的數(shù)據(jù)體量大,數(shù)據(jù)記錄多。更重要的是數(shù)據(jù)的維度要豐富。如精準(zhǔn)獲客,就需要知道人的年齡,性別,位置變化,消費(fèi)行為,支付數(shù)據(jù)等數(shù)據(jù),維度越豐富,畫像越精準(zhǔn),一個(gè)維度就好比一個(gè)像素,像素越高,照片越清晰。
以上便是小編此次帶來(lái)的有關(guān)大數(shù)據(jù)的全部?jī)?nèi)容,十分感謝大家的耐心閱讀,想要了解更多相關(guān)內(nèi)容,或者更多精彩內(nèi)容,請(qǐng)一定關(guān)注我們網(wǎng)站哦。