工業(yè)大數(shù)據(jù)的分類和挑戰(zhàn)
實際上,工業(yè)數(shù)據(jù)有三個特點。第一個特點是多模態(tài)。過去很簡單粗暴地將數(shù)據(jù)分成結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),但工業(yè)企業(yè)不是這樣。今天看到的很多好像格式不一樣的、非結(jié)構(gòu)化的工程數(shù)據(jù),真正把它打開的時候是不一樣的。非結(jié)構(gòu)化數(shù)據(jù)的使用效率取決于結(jié)構(gòu)化的程度,只有結(jié)構(gòu)化才可以被高效利用;第二個特點是高通量,很多設(shè)備是不停機的,所有的數(shù)據(jù)是7*24小時連續(xù)產(chǎn)生的,量非常大;第三個特點是強關(guān)聯(lián),在工業(yè)的不同行業(yè),數(shù)據(jù)關(guān)聯(lián)遵循不同的規(guī)律而非簡單的聚合。
所以工業(yè)大數(shù)據(jù)本身的特點帶來了非常多的挑戰(zhàn)。除了數(shù)據(jù)獲取的挑戰(zhàn),隨之而來的就是數(shù)據(jù)分析、應(yīng)用的挑戰(zhàn)。這里邊最大的限制是因果關(guān)系,即數(shù)據(jù)驅(qū)動的方法只能告訴我們關(guān)聯(lián)性,而無法不能告訴我們因果性。比如淘寶推薦商品,只知道推薦相關(guān)商品,卻不關(guān)心這個事情的因果——為什么用戶是這樣的人。但這在工業(yè)上是行不通的,尤其是控制方面,因此模型需要長時間的分析和驗證。
工業(yè)領(lǐng)域存在白盒模型和灰盒模型,白盒模型即工業(yè)機理,企業(yè)會根據(jù)工業(yè)機理設(shè)計工序、產(chǎn)品結(jié)構(gòu)和工藝,這是第一步。當它們被設(shè)計完之后,運行中又會出現(xiàn)大量的不確定性,這些不確定性的消除靠的就是專家、工匠的經(jīng)驗,讓整個流程生產(chǎn)變得更加穩(wěn)定和高效,這是灰盒態(tài)。不再對機理和知識本身進行分析和理解的數(shù)據(jù)模型,是一種黑盒模型。
工業(yè)大數(shù)據(jù)和工業(yè)智能的本質(zhì)就是,將這些經(jīng)驗和知識量化學習出來,挖掘心中有口中無的隱性知識,或者嘗試通過數(shù)據(jù)方法把統(tǒng)計關(guān)系找到,再交還給工匠分析。工業(yè)就是工業(yè),它存在的時間比信息化時間長,積淀比信息化多,而大數(shù)據(jù)和人工智能技術(shù)只是給工業(yè)上帶來小的變化,嘗試幫它去消除不確定性。