比特幣地址挖掘的方法及相關(guān)數(shù)學(xué)原理解析
7月10日,據(jù)Coinmarketcap顯示,比特幣上漲突破一年歷史中高位達(dá)到12955 USD,目前比特幣市值達(dá)到1695億美元 ,在過(guò)去的三個(gè)月內(nèi)漲幅達(dá)到76.48%。變幻的市場(chǎng)中,加密貨幣大戶“巨鯨”們也在等待著再次吸籌的機(jī)會(huì)。
?
6月全球研究機(jī)構(gòu)Diar報(bào)告顯示,自2019年起大戶地址累積比特幣的數(shù)量超過(guò)10萬(wàn)枚,數(shù)量增長(zhǎng)了10%;7月最新比特幣富豪榜數(shù)據(jù)也顯示出巨鯨地址的籌碼動(dòng)向。目前,據(jù)Coinhills統(tǒng)計(jì),24小時(shí)內(nèi)BTC交易量最大的分別是:BitMEX、bitFlyer、OKEx、COINBIG,而擁有比特幣排行除了屬于 Binance、Bitstamp、Bitfinex 和 Huobi 的 4 個(gè)最大的加密錢包之外,許多比特幣地址持有者的身份仍然不為人所知。如何追蹤和挖掘這些巨鯨用戶?如何及時(shí)知道巨鯨用戶比特幣交易動(dòng)態(tài)?
1. 背景
比特幣是一種廣為人知的加密貨幣,雖然每筆交易都是在鏈上的,數(shù)據(jù)都是可查的,但是人們還是不知道地址屬于哪個(gè)人或者組織。目前,如果對(duì)于個(gè)人的話,還沒(méi)有一套行之有效的方法去找出他的地址,但是對(duì)于機(jī)構(gòu)來(lái)說(shuō),地址是可以通過(guò)數(shù)據(jù)挖掘的方法找出來(lái)的。
現(xiàn)在有一些網(wǎng)站已經(jīng)統(tǒng)計(jì)了一些公布出來(lái)的地址,例如 walletexplorer.com 。這個(gè)網(wǎng)站統(tǒng)計(jì)了四大類,交易最活躍,持幣量最大的網(wǎng)站。它們將比特幣地址分成了以下幾類:
1. 交易所
2. 礦池
3. 服務(wù)機(jī)構(gòu)
4. Du博網(wǎng)站
但這些機(jī)構(gòu)會(huì)經(jīng)常性的更換地址,如何找到這些地址,或者說(shuō)挖掘出這些地址,就是本文的主要討論的問(wèn)題。
2. 技術(shù)原理
對(duì)于比特幣來(lái)說(shuō),它的地址數(shù)據(jù)挖掘,主要是依賴于比特幣的交易的一些特性。
1.多輸入歸并
如果在一筆交易中,出現(xiàn)多個(gè)輸入的地址,那么多個(gè)輸入的地址,就屬于同一個(gè)主體。在某個(gè)地址的交易中,它出現(xiàn)在了輸入一側(cè),和它一起出現(xiàn)在輸入側(cè)的其它地址,可以被認(rèn)為是屬于同一個(gè)主體(比如說(shuō)交易所)。
滿足條件:- 輸入地址數(shù)不為1
這里面的隱含的數(shù)學(xué)關(guān)系,將在后續(xù)的文章中詳細(xì)介紹
例如,下圖所示交易中,在輸入側(cè)(圖中左側(cè))共有5個(gè)地址,通常情況下,可以認(rèn)為該5個(gè)地址屬于同一主體。
2.轉(zhuǎn)賬與找零
如果一筆交易中,出現(xiàn)了有且只有2個(gè)輸出地址的時(shí)候,并且這兩個(gè)地址都不是輸入地址時(shí),其中一個(gè)地址是接收轉(zhuǎn)賬,那另一個(gè)就是找零地址。那么這個(gè)找零地址的主體,應(yīng)該和輸入方是同一個(gè)人。
這個(gè)推理的邏輯其實(shí)是,比特幣的找零機(jī)制。在默認(rèn)的情況下,找零會(huì)出現(xiàn)在一個(gè)新的地址中。
滿足條件:
1. 輸出地址數(shù)為2
2. 輸入地址數(shù)不為2
3. 輸入地址和輸出地址不能相同
4. 其中一個(gè)輸出地址的btc數(shù),必須是擁有4位以上小數(shù)的值
5. 另一個(gè)輸出地址,不能在以往的(多輸入或者轉(zhuǎn)賬與找零地址中)地址的集合中
例如,下圖所示交易中,在輸出側(cè)(圖中右側(cè))有且只有有2個(gè)地址,且輸入側(cè)有85個(gè)地址。上一個(gè)例子中我們已經(jīng)知道了那輸入側(cè)的85個(gè)地址屬于同一個(gè)主體,那么通過(guò)這個(gè)規(guī)則,輸出側(cè)中擁有4位小數(shù)的地址,和那85個(gè)地址屬于同一主體。
3.數(shù)學(xué)原理
參考文獻(xiàn)[1]中提出了一個(gè)概率假設(shè),來(lái)代表不同數(shù)據(jù)源的概率模型??紤]不同類型的模型(我們將其視為獨(dú)立的,以使其在計(jì)算上可解決):
3. 意義
Bitcoin地址挖掘有以下幾方面的作用:
1.統(tǒng)計(jì)各個(gè)交易所的資產(chǎn)數(shù),可以更好了解交易所的持幣量,和bitcoin的流通量。
2.預(yù)測(cè)市場(chǎng)變化。一般市場(chǎng)出現(xiàn)變化的時(shí)候,對(duì)于交易所來(lái)說(shuō),總會(huì)有大額的資金流動(dòng)。通過(guò)監(jiān)測(cè)各個(gè)交易所的大額流入流出,可以更好預(yù)測(cè)市場(chǎng)變化。
3.對(duì)于個(gè)人用戶來(lái)說(shuō),可以了解機(jī)構(gòu)的資產(chǎn)狀況,便于用戶作出正確的投資決策。