為何要將以人工智能為中心的大數(shù)據(jù)分析轉變?yōu)榭蓤?zhí)行的信息?
有些人可能認為大數(shù)據(jù)分析是機器學習或人工智能的同義詞,但其實這并不正確。雖然這些技術的某些方面可能被用于大數(shù)據(jù)的分析應用中,但只關注它們肯定會造成混淆和不切實際的期望。圍繞人工智能的炒作,暗示當將其應用于大數(shù)據(jù)時,會自動生成有用的信息。它可以在最終用戶很少或沒有努力的情況下產(chǎn)生結果。然而,數(shù)據(jù)分析用戶的體驗往往卻截然不同。
專注于創(chuàng)業(yè)公司的分析公司CB Insights認為,當前人工智能處于一種非理性的“繁榮”。人工智能技術的實際應用與營銷炒作之間存在負相關性,這會對用戶造成混淆。
例如,某供應商分享了一個案例研究,聲稱他們使用了以人工智能為中心的數(shù)據(jù)分析解決方案來解決生產(chǎn)問題。在演示文稿中,供應商展示了他們發(fā)現(xiàn)的生產(chǎn)過程和產(chǎn)品結果之間的相關性公式。該回歸公式是一個很好的工具,但說它就等同于人工智能顯然是種誤導。公式使用的甚至不是回歸變量;它是機器學習算法的一個最基本形式,也是在Microsoft Excel 2007數(shù)據(jù)分析工具包中就引入的一個功能。
一個有著10多年歷史的功能,被重新包裝和炒作為人工智能,表明在對認知計算的理解方面出現(xiàn)了混淆。這其中的一部分原因是人們?nèi)狈κ裁词侨斯ぶ悄?、機器學習、深度學習和其它形式 "認知計算" 的理解,以及對監(jiān)督和無監(jiān)督變量的論據(jù)。
這種炒作與痛苦的現(xiàn)實形成了鮮明對比,現(xiàn)實是很多企業(yè)收集到的大量數(shù)據(jù)甚至沒有被分析或利用,從而無法提供有價值的信息,不能被工程師和分析人員用其來生成可執(zhí)行的信息。
過程數(shù)據(jù)分析
雖然許多先進技術 (包括人工智能)可用于數(shù)據(jù)分析應用程序,但大數(shù)據(jù)分析的重點不應放在技術上。相反,重點應該放在用戶體驗上,以及如何將信息加速應用到過程優(yōu)化中。
重點應該放在精通這一領域的專家(SME)——過程工程師、數(shù)據(jù)分析專家等,以及他們在數(shù)據(jù)中尋找信息的能力上。不管數(shù)據(jù)分析應用程序中使用的是什么技術,目標始終是讓沒有太多數(shù)據(jù)科學專業(yè)知識的用戶能夠訪問和實施該解決方案。
設計良好的數(shù)據(jù)分析應用程序,應該使行業(yè)專家能夠獲取相應的信息。當數(shù)據(jù)分析應用程序挖掘其它功能時,應該在過程專家可以訪問的易于使用的功能環(huán)境中實現(xiàn)這些創(chuàng)新。
數(shù)據(jù)分析應用程序應該使用可用的技術幫助最終用戶獲得成功。如果采用的是機器學習或人工智能,那很好,但數(shù)據(jù)分析應用程序不應僅限于這些功能,或其它為了市場炒作而限制其他功能。有許多算法和創(chuàng)新技術,都可以為想要挖掘數(shù)據(jù)洞察力的用戶提供幫助。
算法功能可以包括為了進行數(shù)據(jù)清理的數(shù)字信號處理、過程信號中的形狀檢測以及分布式計算的Map-reduce模型。無論是調(diào)用機器學習、人工智能、還是其它算法,都不是重點。重點是幫助最終用戶更快地獲得成功。
數(shù)據(jù)連接
認知計算算法是過程制造和工業(yè)物聯(lián)網(wǎng)(IIoT)解決方案中,進行數(shù)據(jù)分析的重要組成部分,但只是其中的一部分。其它方面還包括數(shù)據(jù)整理(這是必要的數(shù)據(jù)連接),清理和以及為了使用而進行的數(shù)據(jù)語境化。數(shù)據(jù)分析應用程序的重點,必須包括這些準備步驟,以便加快從數(shù)據(jù)連接到信息發(fā)布的速度。
此外,數(shù)據(jù)分析應用程序應使用戶能夠?qū)⒎治鰯U展到所需的任何級別。最終用戶將繼續(xù)擴展使用數(shù)據(jù)分析應用程序以及對特定算法的需求。因此,數(shù)據(jù)分析應用程序應包括通過REST API、OData等特性對其它算法的可擴展性,并將算法集成到用戶體驗中。
側重問題解決
當數(shù)據(jù)分析應用程序允許用戶關注問題而不是技術時,用戶可以將精力更集中于如何快速獲得所需的結果。下文將從制藥、電力、冶煉、石化和造紙行業(yè)中出現(xiàn)的實際問題中,解析大數(shù)據(jù)分析的應用。
● 制藥實驗室分析
問題: 當從實驗室轉向全面生產(chǎn)時,在實驗室中實現(xiàn)的反應,不能在規(guī)模生產(chǎn)時重復。使用手動方法和現(xiàn)有的數(shù)據(jù)管理工具 (如電子表格),很難找到原因。
解決方案: 通過大數(shù)據(jù)分析,將匯集與實驗室和全面生產(chǎn)相關的不同來源的數(shù)據(jù)進行分析。這使得制藥企業(yè)能夠快速比較這兩個過程,并確定關鍵的區(qū)別,調(diào)整規(guī)模生產(chǎn)的參數(shù)以提高產(chǎn)量。
● 發(fā)電廠污染控制
問題: 工廠運行人員無法從工廠的自動化系統(tǒng)中快速獲取足夠的信息,實時控制污染減排設備。這經(jīng)常會導致添加過量的化學藥品,從而產(chǎn)生額外的成本。
解決方案: 數(shù)據(jù)分析應用程序處理信息的能力,可以快速地控制污染減排系統(tǒng),就像控制其它任何過程變量一樣,對化學物品如氮氧化物、硫磺氧化物的使用進行優(yōu)化,減少汞的排放,在延長設備壽命的同時,降低化學藥品的成本。
● 冶煉運營控制
問題: 像冶煉一樣受到嚴格管制并且高能耗的生產(chǎn)工藝,很難用傳統(tǒng)的電子表格來描述。因此,要平衡多個因素,并在成本、環(huán)境因素和能效之間做出最佳權衡幾乎是不可能的。
解決方案: 數(shù)據(jù)分析被用于分析多個變量之間的關系,這使得在任何給定時間,基于關鍵變量來控制過程都變得更容易。通過嘗試各種可能方案,簡化了為不斷變化的成本或新法規(guī)而進行的配比調(diào)整。
● 煉油反應床監(jiān)控
問題:由于煉油廠的工況復雜,會造成各種問題,因此難以預測反應床的結垢。來自各傳感器的數(shù)據(jù)往往帶有噪音,因此就很難確定實際趨勢并采取相應的糾正措施。
解決方案: 數(shù)據(jù)分析解決方案利用其數(shù)據(jù)清洗和膠囊技術,消除噪聲,并確定導致加速結垢的關鍵運行工況。在穩(wěn)態(tài)條件下創(chuàng)建基準,使您可以很容易地確定何時出現(xiàn)問題,并執(zhí)行預測性維護。
● 紙漿和紙張質(zhì)量評價
問題: 制漿機的制漿工藝可根據(jù)可用性混合各種木材品種。要想驗證原料的變化會不會對最終產(chǎn)品產(chǎn)生負面影響是很困難的,這主要是因為從制漿到成品的時間很長。
解決方案: 數(shù)據(jù)分析應用以歷史紙漿數(shù)據(jù)為基礎,確定紙漿的最終產(chǎn)品質(zhì)量。然后,在紙漿輸送到造紙機之前,生產(chǎn)者開始測試紙漿,并利用這些信息,準確預測最終產(chǎn)品的關鍵特性。
使用正確的數(shù)據(jù)分析應用程序,將有助于制造企業(yè)實現(xiàn)效率提升的目標。當前的炒作和承諾,將會隨著時間的推移而變得成熟,數(shù)據(jù)分析將成為工業(yè)環(huán)境中所期望的和穩(wěn)定的必要組成部分。但是,具有行業(yè)專家和專業(yè)知識的最終用戶將會領先一程。
集成人工智能、機器學習和其它技術,將使數(shù)據(jù)分析應用程序能夠從大數(shù)據(jù)中更快的生成可執(zhí)行的信息。?
有效數(shù)據(jù)分析的4個要求
要實現(xiàn)IIoT的好處,需要重新審視軟件分析產(chǎn)品。目標是找到一個產(chǎn)品,可以提供完整和靈活的方法,從生產(chǎn)數(shù)據(jù)中提取有價值的信息。數(shù)據(jù)分析軟件,可以給過程專家提供第一手的有價值的數(shù)據(jù)信息,使他們能夠自定義分析并改進生產(chǎn)結果。
能為IIoT的實施提供有價值的數(shù)據(jù)分析需要注意以下4個方面:
1. 生產(chǎn)率提升
這需要一種應用方法,以便工程師和分析人員可以很容易地使用該軟件,作為他們調(diào)查和發(fā)現(xiàn)工作的一部分,以快速改善生產(chǎn)。分析工具必須適合具有專業(yè)知識以及對工廠了解的人員使用,而不是那些軟件領域方面的專家但不了解該工藝過程的人員,如程序員、數(shù)據(jù)專家。
2. 時間序列數(shù)據(jù)
任何IIoT實施的核心,都是來自傳感器的模擬數(shù)據(jù)。這些數(shù)據(jù)通常難以操作、清理和情景化。典型的手動解決方案需要在Excel表中或編程腳本中花費數(shù)小時來自定義。IIoT的數(shù)據(jù)分析工具,應促進和加速對時間序列數(shù)據(jù)的調(diào)查,以便工程師能夠?qū)W⒂诎l(fā)現(xiàn)和洞察而不是數(shù)據(jù)的處理或操作。
3. 數(shù)據(jù)種類和語境
這允許傳感器數(shù)據(jù)由與其關聯(lián)的批處理或資產(chǎn)來組織管理,也可以很容易地被分解為連續(xù)過程中的機器狀態(tài)和條件。這一點很重要,因為最典型的工況是新舊數(shù)據(jù)混合在一起,或者混合了來自不同來源的控制數(shù)據(jù)。
4. 協(xié)作支助
這使得團隊成員之間以及一個或多個設施之間的共享發(fā)現(xiàn)和討論成為可能。 這需要能從任何平臺(包括PC、平板電腦和智能手機)上運行的任何瀏覽器訪問數(shù)據(jù)分析軟件。 因此,為了從采集的數(shù)據(jù)中獲得最大收益,過程制造企業(yè)應該尋找了解數(shù)據(jù)背景以及企業(yè)面臨的業(yè)務和過程挑戰(zhàn)的系統(tǒng)供應商。這些供應商可以在集成協(xié)議、部署和體系結構方面進行大量的提升,使過程工廠能夠集中精力,從各種IIoT方案中獲得最大的價值。?