數(shù)據(jù)治理和高質(zhì)量的區(qū)塊鏈如何協(xié)同發(fā)展
怎么發(fā)展好區(qū)塊鏈是當前亟須回答的關鍵命題。本文認為,先從數(shù)據(jù)存證、共享入手是務實策略,考慮到技術前沿在公有鏈,我們應支持公有鏈的研究,為了防范風險,須改造公有鏈。基于現(xiàn)實環(huán)境,聯(lián)盟鏈或許是應用落地的較優(yōu)選擇。應加強國產(chǎn)密碼算法應用和創(chuàng)新發(fā)展,以保障我國區(qū)塊鏈安全可控。當前最重要的是,我們應提倡區(qū)塊鏈的高質(zhì)量發(fā)展,為此,需要加強鏈上和鏈下數(shù)據(jù)治理(Data Governance),建立有效的區(qū)塊鏈數(shù)字治理體系。
習近平總書記在中共中央政治局第十八次集體學習的講話內(nèi)涵豐富,思想深邃。他敏銳地抓住現(xiàn)代信息技術發(fā)展的前沿熱點,強調(diào)要加快推動區(qū)塊鏈技術和產(chǎn)業(yè)創(chuàng)新發(fā)展,高屋建瓴地提出我國區(qū)塊鏈技術發(fā)展藍圖,為我們指引了方向。同時他又要求客觀辯證地看待創(chuàng)新技術的“雙刃劍”效應,強調(diào)要加強對區(qū)塊鏈技術的引導和規(guī)范,加強風險研究和分析,加強行業(yè)自律,落實安全責任,依法治鏈,推動區(qū)塊鏈安全有序發(fā)展。
應該說,要不要發(fā)展區(qū)塊鏈,已無爭議,怎么發(fā)展才是當前亟須回答的關鍵命題。本文認為,先從數(shù)據(jù)存證、共享入手是務實策略,考慮到技術前沿在公有鏈,我們應支持公有鏈的研究,基于現(xiàn)實環(huán)境,聯(lián)盟鏈或許是應用落地的較優(yōu)選擇。密碼學是區(qū)塊鏈技術的重要基石,應加強國產(chǎn)密碼算法應用和創(chuàng)新發(fā)展,以保障我國區(qū)塊鏈安全可控。當前最重要的是,我們應提倡區(qū)塊鏈的高質(zhì)量發(fā)展,為此,需要加強鏈上和鏈下數(shù)據(jù)治理(Data Governance),建立有效的區(qū)塊鏈數(shù)字治理體系。
先從數(shù)據(jù)存證、共享入手,逐步向價值網(wǎng)絡發(fā)展,是務實的落地策略
從現(xiàn)階段技術成熟度看,區(qū)塊鏈在價值轉(zhuǎn)移方面,還存在性能上的爭議,但其本身就是一個點對點的數(shù)據(jù)共享網(wǎng)絡,因此其在數(shù)據(jù)存證、共享方面的適用性存在較少分歧。在總書記的重要講話中,促進數(shù)據(jù)共享是他指出的五大區(qū)塊鏈作用之一,也是他強調(diào)的區(qū)塊鏈重點應用方向。利用區(qū)塊鏈數(shù)據(jù)可信優(yōu)勢,建立數(shù)據(jù)存證、共享的創(chuàng)新模式,可實現(xiàn)政務數(shù)據(jù)跨部門、跨區(qū)域共同維護和利用,促進城市地區(qū)在信息、資金、人才、誠信等方面更大規(guī)模的互聯(lián)互通,保障生產(chǎn)要素在區(qū)域內(nèi)有序高效流動,提升城市管理的智能化、精準化水平。
但是區(qū)塊鏈技術本身對數(shù)據(jù)高度冗余的要求,客觀上增加了計算與存儲開銷;另外,區(qū)塊鏈技術在數(shù)據(jù)透明方面的特性,須結(jié)合安全多方計算、同態(tài)加密、零知識證明等隱私保護技術,才能在各方自主可控前提下大范圍應用,而隱私保護技術本身的效率還在提高過程中。
因此,當前比較合理的實現(xiàn)方法是鏈上共享數(shù)據(jù)的Hash指紋存證與信息披露,真實數(shù)據(jù)按照“數(shù)據(jù)不出門、數(shù)據(jù)不落地、數(shù)據(jù)可用不可見”三原則,依托安全隱私保護技術在鏈下按照授權來共享使用。將來隨著基礎設施與安全技術的進步,有計劃地將系統(tǒng)和受保護的真實數(shù)據(jù)遷移到區(qū)塊鏈上,進而發(fā)展成為價值網(wǎng)絡。
技術研究在公有鏈,場景應用在聯(lián)盟鏈
從私有鏈到聯(lián)盟鏈、公有鏈,社區(qū)信任程度逐步遞減,相應帶來的技術難題(比如共識機制、性能問題、隱私保護等)逐步遞增。私有鏈類似于傳統(tǒng)信息系統(tǒng),聯(lián)盟鏈是相互信任的機構之間的互聯(lián)互通,介于去中心化和中心化之間,根據(jù)業(yè)務場景的要求,不一定只采用POS或POW,可采用PBFT等傳統(tǒng)共識機制,也可以采用多種共識協(xié)議相結(jié)合的混合共識機制,Libra即是聯(lián)盟鏈。而公有鏈的相互信任程度最低,高度開放和容錯下的安全和性能挑戰(zhàn)所要求的技術水平最高。公有鏈的前沿技術突破,將為聯(lián)盟鏈和私有鏈現(xiàn)有技術問題提供新的解決方案。因此,就學術而言,區(qū)塊鏈的技術創(chuàng)新關鍵點更多的是在公有鏈上。支持公有鏈的研究,推進聯(lián)盟鏈的應用,是我國區(qū)塊鏈發(fā)展戰(zhàn)略的應有之義。
以監(jiān)管科技應對金融科技,是區(qū)塊鏈治理的應對之道
可以說,區(qū)塊鏈的去中心化對金融監(jiān)管提出了全新的命題和挑戰(zhàn),完全開放自由的公有鏈存在合規(guī)風險,如承載金融科技應用則必須予以改進。應對之道或許是以監(jiān)管科技應對金融科技,聯(lián)盟鏈是許可鏈,既可以開展跨機構應用,也可為行業(yè)自律和監(jiān)管提供服務。有鑒于此,可考慮在不損害區(qū)塊鏈技術優(yōu)勢的前提下,在公有鏈上增加監(jiān)管節(jié)點,保障公有鏈的合法合規(guī),或者采用多鏈策略,即采用聯(lián)盟鏈+公有鏈的“二元模式”,聯(lián)盟鏈向相關監(jiān)管部門注冊,開展鏈上監(jiān)管,去中心化應用則使用公有鏈,開展去中心化商業(yè)活動。若有需要,監(jiān)管者亦可從聯(lián)盟鏈穿透到公有鏈,管控全局?;谝婪ê弦?guī)的現(xiàn)實要求,聯(lián)盟鏈或許是應用落地的較優(yōu)選擇。
國產(chǎn)密碼算法的應用和創(chuàng)新發(fā)展,是我國區(qū)塊鏈安全可控的基礎
本質(zhì)上,區(qū)塊鏈是一個基于密碼學原理的分布式共享存儲與計算系統(tǒng),其對中心化機構的揚棄和對密碼學技術的依賴,標志著一種全新范式的控制權的轉(zhuǎn)移。就這一個角度而言,國產(chǎn)密碼算法的應用和創(chuàng)新發(fā)展,意義重大。關鍵領域的區(qū)塊鏈應用,密碼學技術必須符合國家密碼標準。
目前,國家密碼局公布的中國自主研發(fā)的國家商用密碼算法,包括SSF33、SM1(SCB2)、SM2、SM3、SM4、SM7、SM9、祖沖之密碼算法(ZUC)等。其中SSF33、SM1、SM4、SM7、ZUC是對稱算法;SM2、SM9是非對稱算法;SM3是哈希算法。國密算法有優(yōu)點,但也有需要改進的地方。以SM2為例,相比傳統(tǒng)的橢圓曲線簽名算法ECDSA,兩者的簽名和驗簽的核心步驟相近,SM2簽名驗證算法加入了較多的檢錯功能,提高了簽名驗證系統(tǒng)的數(shù)據(jù)完整性、系統(tǒng)可靠性和安全性;與廣泛應用的RSA數(shù)字簽名算法相比,SM2在同等安全強度下所需密鑰位數(shù)更少,且密鑰對生成速度,簽名速度均優(yōu)于RSA數(shù)字簽名算法。但SM2也有其劣勢,比如驗簽速度相比RSA處于明顯的劣勢,尚需改進。
目前國密算法還沒有覆蓋到同態(tài)加密、零知識證明、多方安全計算等,亟須拓展相應國密算法庫,并實現(xiàn)標準化。而隨著我國區(qū)塊鏈應用跨出國門,國密算法也應一并走向世界,成為國際標準。這些都對我國國密算法提出了更高的要求。
雖然區(qū)塊鏈的應用是去中心化的,但區(qū)塊鏈的密碼標準體系是由特定的機構來制定的。某種意義上,誰掌握了密碼標準體系,誰就掌握了區(qū)塊鏈發(fā)展的話語權。
加強鏈上和鏈下數(shù)據(jù)治理,是現(xiàn)階段推動區(qū)塊鏈高質(zhì)量發(fā)展的關鍵
如前述所言,數(shù)據(jù)的互聯(lián)互通應是現(xiàn)階段區(qū)塊鏈技術的重點應用方向,聯(lián)盟鏈或?qū)⑹瞧渲饕问健5覀儜岢珔^(qū)塊鏈的高質(zhì)量發(fā)展,警惕“大干特干,一擁而上”的無序低質(zhì)量發(fā)展。需要強調(diào)的是,區(qū)塊鏈上的數(shù)據(jù)應該是具備較高價值的可公開的不宜修改的數(shù)據(jù)。這是它的特性,更是它的優(yōu)勢和品質(zhì)所在。若無謂地把無價值的且可隨意更改的數(shù)據(jù)上鏈,實際上是對區(qū)塊鏈技術的濫用,也無法構建起符合實際業(yè)務需求的應用。為此,我們需要建立有效的區(qū)塊鏈數(shù)據(jù)治理體系,以保障區(qū)塊鏈應用的質(zhì)量和品質(zhì)。
通俗來說,數(shù)據(jù)治理是指所有為提高數(shù)據(jù)質(zhì)量而展開的業(yè)務、技術和管理活動,包括組織架構、政策制度、技術工具、數(shù)據(jù)標準、流程規(guī)范、監(jiān)督考核等。國際數(shù)據(jù)管理協(xié)會(DAMA)的《數(shù)據(jù)管理知識體系指南(DMBOK)》則將數(shù)據(jù)治理框架定義為數(shù)據(jù)控制、數(shù)據(jù)架構管理、數(shù)據(jù)開發(fā)、數(shù)據(jù)操作管理、數(shù)據(jù)安全管理、數(shù)據(jù)質(zhì)量管理、參考數(shù)據(jù)和主數(shù)據(jù)管理、數(shù)據(jù)倉庫和商務智能管理、文件和內(nèi)容管理、元數(shù)據(jù)管理等10個方面。針對區(qū)塊鏈技術的特性,或許可從以下幾個方面入手,構建區(qū)塊鏈數(shù)據(jù)治理體系:
第一,加強鏈下數(shù)據(jù)治理的評估與監(jiān)督,防止短板效應
區(qū)塊鏈技術可以解決鏈上的信任問題,保障鏈上數(shù)據(jù)的真實性、準確性與一致性,但對于鏈下數(shù)據(jù),區(qū)塊鏈則“鞭長莫及”,無法保證其質(zhì)量。倘若鏈下源頭數(shù)據(jù)被“污染”了,區(qū)塊鏈上流轉(zhuǎn)的數(shù)據(jù)就成了“垃圾”,也就是所謂的“垃圾進垃圾出”(“Garbage in, Garbage out”)。因此,高質(zhì)量鏈下數(shù)據(jù)是高質(zhì)量區(qū)塊鏈的前提。而要實現(xiàn)這個前提,則需要依靠各節(jié)點的鏈下數(shù)據(jù)治理。雖然說各節(jié)點的鏈下數(shù)據(jù)治理似乎是各家自己的事情,但某一節(jié)點的數(shù)據(jù)治理缺失往往會限制區(qū)塊鏈的整體質(zhì)量和價值,形成短板效應。因此,各節(jié)點應采取有效的技術工具、管理手段和組織體系,對數(shù)據(jù)在計劃、獲取、存儲、共享、維護、應用、消亡全生命周期可能存在的質(zhì)量問題,進行識別、度量、監(jiān)控、預警和改進。
為了避免短板效應,可考慮成立聯(lián)盟鏈聯(lián)合工作組,評測各節(jié)點鏈下數(shù)據(jù)治理的成熟度,督促各方提高上鏈的數(shù)據(jù)質(zhì)量,必要時可設置數(shù)據(jù)治理成熟度的準入門檻。目前已經(jīng)有了比較成熟的數(shù)據(jù)治理評價模型可供采用,比如IBM的數(shù)據(jù)治理成熟度評估模型、CMMI的數(shù)據(jù)能力成熟度模型(DMM)、EDM的數(shù)據(jù)能力成熟度模型(DCAM)、DataFlux的數(shù)據(jù)治理成熟度模型、Oracle MDM主數(shù)據(jù)管理成熟度模型、MD3M主數(shù)據(jù)管理能力成熟度模型,以及我國信息技術標準化技術委員在2014年啟動并于2018年發(fā)布的《數(shù)據(jù)管理能力成熟度評估模型》(Data Capability Maturity Model,簡稱DCMM)國家標準。
第二,參照主數(shù)據(jù)管理理論,開展鏈上數(shù)據(jù)治理
在數(shù)據(jù)治理框架中,主數(shù)據(jù)管理是核心。所謂的主數(shù)據(jù)是指描述機構核心業(yè)務實體的、在機構內(nèi)外被廣泛應用和共享的數(shù)據(jù),是機構的核心資產(chǎn),具有高價值和高敏感性。構建統(tǒng)一的主數(shù)據(jù)標準,可將原先各個處于豎井之中的業(yè)務系統(tǒng)在主數(shù)據(jù)層面實現(xiàn)互通和共享,保障主數(shù)據(jù)的全局一致性和準確性。事實上,區(qū)塊鏈技術也可看作跨節(jié)點主數(shù)據(jù)的集成技術或架構。因此,我們可參照主數(shù)據(jù)管理理論,開展鏈上數(shù)據(jù)治理。
一是清晰的業(yè)務需求。不是所有的數(shù)據(jù)都要上鏈。只有需要多方共享的高價值數(shù)據(jù),或者說只有主數(shù)據(jù),才需要上鏈,早期甚至只有主數(shù)據(jù)的Hash指紋存證在鏈上。
二是明確的主數(shù)據(jù)規(guī)則和標準。聯(lián)盟鏈的各方應預先在標準和規(guī)則層面達成一致:是各節(jié)點的上鏈數(shù)據(jù)在鏈下統(tǒng)一標準,還是各自規(guī)范,僅在上鏈時通過數(shù)據(jù)抽取引擎(比如ETL、ESB),將異構數(shù)據(jù)轉(zhuǎn)為鏈上統(tǒng)一格式的標準數(shù)據(jù)集。如果是前者,那么各方應共同制定鏈下數(shù)據(jù)標準,即統(tǒng)一的數(shù)據(jù)定義、分類、記錄格式和編碼,以及分類規(guī)范、編碼結(jié)構、數(shù)據(jù)模型、屬性描述。如果是后者,各節(jié)點在數(shù)據(jù)上鏈之前通過數(shù)據(jù)抽取引擎,對欲上鏈的數(shù)據(jù)進行一系列的加工處理,以形成標準統(tǒng)一的主數(shù)據(jù),然后再根據(jù)鏈上數(shù)據(jù)操作規(guī)范要求進行數(shù)據(jù)存證與信息披露。
三是統(tǒng)一的鏈上元數(shù)據(jù)標準。為了使多源的鏈上數(shù)據(jù)能被區(qū)塊鏈各參與節(jié)點方準確理解和使用,需要事先對每個數(shù)據(jù)元素進行元數(shù)據(jù)定義,消除數(shù)據(jù)的二義性,降低數(shù)據(jù)集成的成本,讓各方能夠在統(tǒng)一的邏輯框架上解讀和驗證鏈上與鏈下數(shù)據(jù)。
四是適當?shù)母深A機制。歐盟《通用數(shù)據(jù)保護條例》(General Data Protection RegulaTIon,簡稱GDPR)規(guī)定數(shù)據(jù)主體享有知情同意權、訪問權、拒絕權、可攜權、刪除權(被遺忘權)、更正權、持續(xù)控制權等多項權利。其中,刪除權(被遺忘權)是數(shù)據(jù)主體有權要求數(shù)據(jù)控制者立刻刪除與其有關的個人數(shù)據(jù)及其副本、備份和任何鏈接。更正權是指數(shù)據(jù)主體有權要求數(shù)據(jù)控制者更正并且完善與其有關的個人數(shù)據(jù)的權利。從這一角度看,區(qū)塊鏈的難以篡改與上述兩個數(shù)據(jù)主體權利存在一定的沖突。因此,需要在聯(lián)盟鏈上建立適當?shù)母深A機制,以滿足法律上的數(shù)據(jù)主體權利保護要求和其他合規(guī)要求,而且這也是保障良好網(wǎng)絡生態(tài)的應有之義。
五是科學的管理體系。數(shù)字治理本質(zhì)上是一種管理活動,需要有相應的運維組織、管理流程和考核機制,推動數(shù)據(jù)標準規(guī)范的落地實施和有效執(zhí)行。比如可考慮成立聯(lián)盟鏈聯(lián)合工作組,負責開展明確數(shù)據(jù)需求、制定標準、統(tǒng)一規(guī)則、監(jiān)督評估等治理工作,并負責評測各節(jié)點的鏈下數(shù)據(jù)治理成熟度,行使節(jié)點的許可準入權力。
第三,加強數(shù)據(jù)安全管理與隱私保護,保障數(shù)據(jù)資產(chǎn)價值
隨著數(shù)字經(jīng)濟時代的到來,數(shù)據(jù)已成為關鍵的生產(chǎn)要素。數(shù)據(jù)具有經(jīng)濟價值,是重要資產(chǎn)。如何在數(shù)據(jù)共享的同時避免數(shù)據(jù)泄露,自然是數(shù)據(jù)治理的重中之重。在需求規(guī)劃時,各節(jié)點應預先梳理各自的數(shù)據(jù),識別哪些是非密數(shù)據(jù),哪些是保密數(shù)據(jù),哪些是敏感數(shù)據(jù),哪些是邊緣數(shù)據(jù),哪些可公開,對誰可見,和誰共享,在此基礎上,根據(jù)數(shù)據(jù)的價值、敏感性和隱私性進行分級,制定訪問控制矩陣和差異化隱私策略。在數(shù)據(jù)上鏈時,應保證接口安全。無論鏈上數(shù)據(jù)訪問,還是鏈下數(shù)據(jù)訪問,應有身份認證、分級授權等訪問控制,防止攻擊者假冒合法用戶獲得訪問權限,保證系統(tǒng)和數(shù)據(jù)的安全。在數(shù)據(jù)的傳輸和共享過程中,可根據(jù)數(shù)據(jù)的共享和安全需要,對不同的數(shù)據(jù)進行脫敏,或者采用數(shù)據(jù)加密技術,比如零知識證明(ZKP)算法對數(shù)據(jù)加密,亦可采用一些通道技術來限制數(shù)據(jù)共享范圍,控制數(shù)據(jù)泄露風險。
結(jié)語
當前,區(qū)塊鏈技術已儼然成為一種不可阻擋的技術趨勢,是全球產(chǎn)業(yè)變革的全新賽道,各國均在發(fā)力,加速布局。在這樣一個全球矚目的陣地,我們應扎實備戰(zhàn),搶占技術制高點。習總書記的講話是我國區(qū)塊鏈技術創(chuàng)新和產(chǎn)業(yè)發(fā)展的指導思想和根本遵循,我們應積極貫徹落實總書記重要講話精神,珍惜戰(zhàn)略機遇,求真務實,勇于探索,使區(qū)塊鏈技術在建設網(wǎng)絡強國、發(fā)展數(shù)字經(jīng)濟、助力經(jīng)濟社會發(fā)展等方面真正發(fā)揮作用。