區(qū)塊鏈數(shù)字貨幣投資智能量化分析引擎“QUBE”介紹
傳統(tǒng)金融行業(yè)過去 20 年在 IT 基礎(chǔ)設(shè)置、中心化數(shù)據(jù)存儲(chǔ)及互聯(lián)網(wǎng)生態(tài)推動(dòng)下,脫離初期人工記賬和電話交易,成為影響全球經(jīng)濟(jì)發(fā)展的最重要行業(yè)之一,催生 Bloomberg等基礎(chǔ)數(shù)據(jù)服務(wù)提供商;數(shù)字貨幣金融時(shí)代,由區(qū)塊鏈、大數(shù)據(jù)和人工智能相關(guān)技術(shù)共同推動(dòng):如何從大數(shù)據(jù)中實(shí)時(shí)發(fā)現(xiàn)投資機(jī)會(huì)點(diǎn)、通過人工智能量化分析決策作為商業(yè)決策輔助、利用神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)進(jìn)行市場(chǎng)預(yù)測(cè)及風(fēng)險(xiǎn)預(yù)警,將會(huì)成為未來行業(yè)趨勢(shì)。
項(xiàng)目背景及定位
目前全球數(shù)字貨幣超 3781 種,每天都形成新的區(qū)塊鏈生態(tài)組成部分。數(shù)字貨幣的區(qū)塊 鏈本身包含 17 種類型數(shù)據(jù),如:發(fā)行總量、挖礦難度、損耗量、流通鎖定量、區(qū)塊交 易數(shù)據(jù)、礦工費(fèi)等。
目前全球數(shù)字交易平臺(tái)有超 467 個(gè),數(shù)字貨幣超 3781 種,其中超 1765 種可在交易平 臺(tái)中交易,形成 3183 交易對(duì),數(shù)字仍不斷快速增加。全球交易平臺(tái)產(chǎn)生實(shí)時(shí)交易價(jià)格, 實(shí)時(shí)掛單與交易量等,每秒數(shù)據(jù)產(chǎn)生大量變化。不同交易所間交易價(jià)格平均最大差值 9.73%,二八法則長(zhǎng)尾交易量平均分布平臺(tái) 382 個(gè),但仍約有 63.9%的交易在 OTC 或 其他方式進(jìn)行。除此之外,還有 OTC 數(shù)據(jù)、非交易數(shù)據(jù)、期貨衍生品數(shù)據(jù)等,相關(guān)標(biāo)的 信息 69 類。
在區(qū)塊鏈完全去中心化和匿名技術(shù)模型下,數(shù)字貨幣在眾多獨(dú)立分布式交易中心交易, 與傳統(tǒng)金額行業(yè)相比,98.9%的常規(guī)分析數(shù)據(jù)無(wú)法獲取。最關(guān)鍵的價(jià)和量數(shù)據(jù),僅有 12.9% 能實(shí)時(shí)覆蓋,且分布在 73 個(gè)數(shù)據(jù)源中。并且,目前 98%的交易所只提供交易實(shí)時(shí)數(shù)據(jù) (76.9%的數(shù)據(jù)僅為當(dāng)前時(shí)間戳數(shù)據(jù)),完全沒有歷史數(shù)據(jù)作為投資決策參考。
過去一年統(tǒng)計(jì),區(qū)塊鏈和數(shù)字貨幣日均產(chǎn)生 17875 條新聞資訊、537819 條 UGC 信息, 日均 555694 條輿情信息中,包括市場(chǎng)的利空利好以及投資者的看多看空,這些不確定 性信息一定程度致使數(shù)字貨幣價(jià)格平均每小時(shí)波動(dòng) 5.5%,且 24 小時(shí)不停盤。
如何從眾多區(qū)塊、獨(dú)立分布式交易所、繁雜輿情信息中抓取海量數(shù)據(jù),并對(duì)日均 5.6017T (目前)結(jié)構(gòu)化化處理、積累,形成目前全球唯一區(qū)塊鏈?zhǔn)袌?chǎng)結(jié)構(gòu)式數(shù)據(jù)中心;在此基礎(chǔ)上分析規(guī)律、洞察本質(zhì)、捕捉機(jī)會(huì)點(diǎn)、智能化進(jìn)行市場(chǎng)預(yù)測(cè)和風(fēng)險(xiǎn)預(yù)警、給商業(yè)決策 帶來價(jià)值,最終形成行業(yè)基礎(chǔ)和行業(yè)標(biāo)準(zhǔn),全面公開共享,并提供智能量化分析引擎, 是 QUBE 的定位。
據(jù) 2018 年 1 月 1 日數(shù)據(jù)測(cè)算,全球證券交易市場(chǎng)市值 100 萬(wàn)億美元,區(qū)塊鏈數(shù)字貨 幣總市值 7552.7 億美元,僅占傳統(tǒng)證券市場(chǎng)市值的 0.76%。傳統(tǒng)證券交易二級(jí)市場(chǎng)中 量化輔助交易占比已達(dá) 19.6%,QUBE 率先定位細(xì)分?jǐn)?shù)字貨幣市場(chǎng),未來有極強(qiáng)的發(fā)展 空間和預(yù)期。
QUBE 服務(wù)于:
? 3000 萬(wàn)數(shù)字貨幣投資者 (10%為收費(fèi) VIP 用戶) - 計(jì)劃為個(gè)人投資者推出以幣種為單位的量化策略機(jī)器人
? 10000 家專業(yè)金融機(jī)構(gòu) (全部為收費(fèi)用戶)
? 500 家專業(yè)數(shù)字資產(chǎn)基金 (全部為收費(fèi)用戶)
解決方案及模型
QUBE 智能量化分析引擎,解決方案基于數(shù)據(jù)大規(guī)模處理和深度學(xué)習(xí)算法的數(shù)據(jù)降維、噪點(diǎn)去除、特征提取、模型訓(xùn)練等過程,在神經(jīng)網(wǎng)絡(luò)量化因子優(yōu)化歸一后,形成最終結(jié)果輸出。其核心是對(duì)日均 5.6017T(目前)海量數(shù)據(jù)進(jìn)行處理,包括區(qū)塊鏈數(shù)據(jù)、各類交易平臺(tái)數(shù)據(jù),網(wǎng)絡(luò)信息輿情數(shù)據(jù)等,通過人工智能技術(shù)體系下的一系列算法模型訓(xùn)練,最終對(duì)數(shù)字貨幣市場(chǎng)各類博弈行為進(jìn)行模型預(yù)測(cè)和數(shù)據(jù)量化。
解決方案概述
1) 數(shù)據(jù)獲取
我們通過全球 276 個(gè)節(jié)點(diǎn)來獲取數(shù)據(jù),通過 WebSocket、API 接口,配合爬蟲實(shí)時(shí)抓 取 467 個(gè)交易平臺(tái)數(shù)據(jù)中 1765 個(gè)數(shù)字貨幣的 3183 交易對(duì)價(jià)格、實(shí)時(shí)掛單與交易量等信息,覆蓋 95%以上幣種,90%以上交易平臺(tái),平均 3.9 秒鐘刷新更新數(shù)據(jù)。 通過爬蟲技術(shù)抓取影響區(qū)塊鏈?zhǔn)袌?chǎng)投資的文字信息,分類為資訊類信息和 UGC 信息, 共 6786 個(gè)信息源,日均 876 萬(wàn)未結(jié)構(gòu)化數(shù)據(jù);通過對(duì)區(qū)塊鏈節(jié)點(diǎn)數(shù)據(jù)的監(jiān)聽挖掘,獲 取區(qū)塊鏈隱藏信息,并結(jié)構(gòu)化存儲(chǔ) 17 類數(shù)據(jù)。QUBE 引擎目前每分鐘平均獲取原始數(shù) 據(jù) 3.91GB,處理后存儲(chǔ)數(shù)據(jù)倉(cāng)庫(kù)。
2) 數(shù)據(jù)量化
全球 26 個(gè)數(shù)據(jù)中心進(jìn)行數(shù)據(jù)處理,去除噪點(diǎn),輸入模型量化,形成交易數(shù)據(jù)的中心結(jié) 構(gòu)化數(shù)據(jù)庫(kù);通過語(yǔ)義分析對(duì)輿情原始數(shù)據(jù)進(jìn)行處理,切詞標(biāo)簽化,深度學(xué)習(xí)量化成市 場(chǎng)多空影響因子與情緒因子一系列指標(biāo);對(duì)區(qū)塊鏈數(shù)據(jù)進(jìn)行技術(shù)處理后,形成實(shí)時(shí)數(shù)據(jù) 源。
通過 AI 人工智能對(duì)數(shù)據(jù)進(jìn)行量化處理,在 983 個(gè)維度上進(jìn)行深度建模分析,形成 28919 中間因子機(jī)器學(xué)習(xí),最終形成 397 類直接量化數(shù)據(jù)的價(jià)值輸出結(jié)果。眾所周知,數(shù)據(jù)建 模處理和人工智能訓(xùn)練需要大規(guī)模計(jì)算量,我們利用區(qū)塊鏈技術(shù)招募合作伙伴,進(jìn)行分 布式計(jì)算來解決算力問題,推動(dòng)相關(guān)技術(shù)落地時(shí)間比傳統(tǒng)模式 ROI 提高 87%。
3) 智能策略
日均產(chǎn)生的 5.6017T 數(shù)據(jù)中,包括大量有價(jià)值信息,通過機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法,在 最小時(shí)間戳為 1 分鐘維度上進(jìn)行迭代結(jié)果導(dǎo)入訓(xùn)練,優(yōu)選最佳的數(shù)字貨幣投資策略。
QUBE 引擎從 2017 年 7 月份開始啟動(dòng)運(yùn)行,到目前共 5 個(gè)月算法和模型訓(xùn)練時(shí)間,AI 人工智能投資策略啟動(dòng)后,與比特幣單一幣種的同期收益相比提高 27.9%。且月環(huán)比引 擎本身提高 11.6%,呈現(xiàn)環(huán)比率增加。QUBE 引擎的目標(biāo)是在 2018 年推出 60 類智能 量化策略并產(chǎn)品化。
引擎核心模型
QUBE 引擎的核心為以深度學(xué)習(xí)算法為基礎(chǔ)的模型,旨在利用各類區(qū)塊鏈貨幣的海量歷 史數(shù)據(jù),結(jié)合自動(dòng)獲取的每日交易數(shù)據(jù)和區(qū)塊鏈生態(tài)相關(guān)數(shù)據(jù)(如交易各類信息量化、 輿情數(shù)據(jù)、區(qū)塊數(shù)據(jù)、貨幣匯率等),作為模型輸入樣本數(shù)據(jù),通過大量運(yùn)算訓(xùn)練并迭代 優(yōu)化 AI 模型,最終實(shí)現(xiàn)能夠發(fā)現(xiàn)一定時(shí)間范圍內(nèi)或特定場(chǎng)景下區(qū)塊價(jià)格的動(dòng)態(tài)變化風(fēng) 險(xiǎn)規(guī)律。
模型的原始數(shù)據(jù)主要分交易數(shù)據(jù)和輿情數(shù)據(jù)等。其中,交易數(shù)據(jù)為定量數(shù)據(jù),包含各大 交易平臺(tái)的交易數(shù)據(jù)、行情數(shù)據(jù)、OTC 場(chǎng)外交易數(shù)據(jù)記錄、以及各類貨幣的實(shí)時(shí)交易匯 率。輿情數(shù)據(jù)為定性數(shù)據(jù),包括與區(qū)塊鏈相關(guān)的各類新聞、資訊、公告、用戶 UGC 信息等等,輿情數(shù)據(jù)最終被量化為對(duì)某個(gè)時(shí)間段的影響因子,與交易數(shù)據(jù)一并作為 AI 模 型的數(shù)據(jù)源。
通過定義市場(chǎng)趨勢(shì)的指標(biāo),將市場(chǎng)背景按照多、空、震蕩等 27 個(gè)因子劃分成若干情形, 按幣種發(fā)行時(shí)間,將幣種劃分為新幣、短期、長(zhǎng)期等 36 個(gè)類型;按幣種價(jià)格,將幣種 劃分為微額、小額、中額、大額等 45 種類型;按照輿情指數(shù),將市場(chǎng)情緒劃分為買入、 賣出、觀望等 13 個(gè)類型。按上述方法,將整個(gè)區(qū)塊鏈?zhǔn)袌?chǎng)的 N 個(gè)特征進(jìn)行提取和分類, 即 N 維市場(chǎng),若每個(gè)維度有 M 個(gè)分類,則市場(chǎng)被量化成 NxM 的矩陣,將 NxM 個(gè)組 合情形下的價(jià)格、短期走勢(shì)、中長(zhǎng)期走勢(shì)進(jìn)行抽象,即特征向量化。
按照上述分類,將任意時(shí)間點(diǎn)歷史數(shù)據(jù)以及每日更新的數(shù)據(jù)快速分解為各類特征的描述, 可快速作為輸入數(shù)據(jù)納入最終模型中,并利用機(jī)器學(xué)習(xí)算法訓(xùn)練出能夠快速對(duì)市場(chǎng)進(jìn)行 判讀和走勢(shì)預(yù)測(cè)的 AI 模型。這是引擎的核心模型。
模型為監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的結(jié)合,初始特征的分類和輸入,幫助模型快速解讀市場(chǎng), 隨著數(shù)據(jù)量的增多和特征的明顯,模型可自動(dòng)發(fā)現(xiàn)市場(chǎng)中存在的隱含特征,同時(shí)也可將 持續(xù)超出臨界置信的特征自動(dòng)篩除。AI 模型的最終輸出結(jié)果為對(duì)當(dāng)前時(shí)段價(jià)格、成交 量、市場(chǎng)情緒的短期趨勢(shì)和長(zhǎng)期趨勢(shì)的概率分布,最終形成 397 類直接量化數(shù)據(jù)的價(jià)值 輸出結(jié)果。
引擎核心算法
QUBE 引擎的核心算法包括輿情分析、時(shí)序預(yù)測(cè)、回歸分析和機(jī)器學(xué)習(xí)模型等,我們團(tuán) 隊(duì)成員不僅在人工智能方向有充分的技術(shù)儲(chǔ)備,同時(shí)具備豐富的量化金融建模經(jīng)驗(yàn)。人 工智能的關(guān)鍵是算法和對(duì)應(yīng)的巨型數(shù)據(jù)量訓(xùn)練,我們公開部分引擎基礎(chǔ)算法,供行業(yè)監(jiān) 督反饋和驗(yàn)證。
產(chǎn)品結(jié)構(gòu)及計(jì)劃
產(chǎn)品結(jié)構(gòu)介紹
產(chǎn)品功能舉例
主頁(yè)全部功能模塊:
QUBE 引擎實(shí)時(shí)更新四大關(guān)鍵模塊(原始數(shù)據(jù)獲取系統(tǒng)、數(shù)據(jù)處理結(jié)構(gòu)化系統(tǒng)、特征 提取與量化系統(tǒng)、AI 深度學(xué)習(xí)模型系統(tǒng))的運(yùn)營(yíng)狀態(tài)指標(biāo)。QUBE 引擎的 8 大類別、 48 個(gè)功能模塊,將按計(jì)劃逐步上線。
功能模塊示例:(海量數(shù)據(jù)平臺(tái)/全部幣種)
目前 QUBE Beta V0.1 版已開通“All Token”功能模塊,支持 1385 個(gè)幣種的 376 個(gè) 交易平臺(tái)價(jià)格、實(shí)時(shí)掛單、交易量等交易數(shù)據(jù),每 3.6 分鐘之內(nèi)輪回更新周期,其中 176 個(gè)幣種數(shù)據(jù)在 3.9 秒內(nèi)更新。
功能模塊示例:(輿情信息量化指標(biāo):[-10,+10] )
QUBE Beta V0.1 版已開通輿情量化模塊的輿情分析功能,QUBE 抓取全球共 6786 個(gè) 信息源,日均 876 萬(wàn)未結(jié)構(gòu)化數(shù)據(jù)。通過語(yǔ)義分析智能識(shí)別量化,最終產(chǎn)生 3 大量化 指數(shù) (網(wǎng)絡(luò)輿情指數(shù)、市場(chǎng)多空指數(shù)和投資情緒指數(shù)) ,從-10 到+10,已支持 1 小時(shí) /24 小時(shí)維度,數(shù)據(jù) 5 分鐘內(nèi)更新。QUBE Beta V0.1 版已支持中、英文信息量化指數(shù), 以 5 個(gè)月為周期上線新語(yǔ)言的信息量化指數(shù)。