哈希函數(shù)的特點(diǎn)及應(yīng)用介紹
傳說(shuō),在人類成功打造出第一臺(tái)超級(jí)智能電腦之時(shí),決定做一個(gè)小測(cè)驗(yàn),來(lái)試試看這臺(tái)超級(jí)電腦的能耐到底能到多少?實(shí)驗(yàn)的設(shè)計(jì)很簡(jiǎn)單:讓超級(jí)電腦計(jì)算圓周率是多少。于是,在人們還沒反應(yīng)出來(lái)的一瞬間,這臺(tái)超能電腦已經(jīng)攻占整個(gè)地球,然后對(duì)外太空發(fā)動(dòng)了戰(zhàn)爭(zhēng),征服整個(gè)銀河系,把整個(gè)可知的宇宙空間變成了巨大的超能電腦,最后花上了無(wú)盡的時(shí)間,只為了計(jì)算出人類給它的這個(gè)問題:圓周率。
這是我在閱讀人類大歷史這本書中讀到的一篇故事,原文討論的內(nèi)容是算法程序?qū)τ谌祟惖耐{;那些不斷產(chǎn)生出來(lái)并且持續(xù)的在優(yōu)化、改進(jìn),聲稱用以改善人類生活的算法軟件,既使一開始創(chuàng)作者本身是完全出于良好善意,或是學(xué)術(shù)研究而建立的系統(tǒng),最終仍可能會(huì)完全失控的造成毀滅性的結(jié)果。這個(gè)故事讓我想起了Bitcoin等加密貨幣的挖礦程序算法,在過(guò)去一段時(shí)間以來(lái)對(duì)我們生活的沖擊影響。還記得2017年加密貨幣正夯時(shí),全球的挖礦熱潮引爆的全民搶電瘋,當(dāng)時(shí)就有媒體報(bào)導(dǎo)指出,加密貨幣的挖礦機(jī)器將會(huì)導(dǎo)致社會(huì)大眾無(wú)電可用,甚至有人傳言,那年夏天的幾次臺(tái)電臨時(shí)跳電事件,就是太多人在挖比特幣造成的。
這篇文章,就是要來(lái)談?wù)劚忍貛磐诘V背后的那個(gè)算法:加密哈希函數(shù)。
原本呢,我是計(jì)劃在第二篇就開始進(jìn)入程序開發(fā)的部分,只是我發(fā)現(xiàn)到,不先了解哈希函數(shù)的原理功能、或是留給讀者自行g(shù)oogle,會(huì)破壞這個(gè)系列文章的完整性,尤其是在實(shí)作內(nèi)存塊鏈的不可逆性、或是Key創(chuàng)建等功能,讀者的感受與理解會(huì)有差異,所以還是決定,在進(jìn)入開發(fā)區(qū)塊鏈之前,寫一篇文章來(lái)專門介紹哈希函數(shù),尤其是其在密碼學(xué)方面的應(yīng)用
哈希函數(shù)應(yīng)用在區(qū)塊鏈的哪些地方?
1. 區(qū)塊鏈透過(guò)哈希函數(shù)的結(jié)果,將數(shù)據(jù)串聯(lián)成為一條難以篡改的連接
2. 比特幣、以太幣、瑞波幣等電子加密貨幣(題外話,有人說(shuō)要正名為密碼貨幣),透過(guò)哈希函數(shù)產(chǎn)生錢包地址
3. 在加密貨幣挖礦(Mining)的世界,使用Hash Rate: TH/s(trillions of hashes per second)來(lái)計(jì)算區(qū)塊鏈 network的運(yùn)算能力
4. Bitcoin透過(guò)調(diào)整哈希函數(shù)的難度,控制整個(gè)Bitcoin network平均每10分鐘產(chǎn)生一個(gè)block內(nèi)存塊。
那我們就開始來(lái)了解哈希函數(shù)算法吧
首先,哈希函數(shù)具有下列兩項(xiàng)特點(diǎn):
1. 無(wú)論傳入(input)哈希函數(shù)的數(shù)據(jù)量大小,哈希函數(shù)回傳的數(shù)據(jù)長(zhǎng)度都是固定的相同的input,回傳
2. 相同的output;不同的input,回傳不同的output;
換句話說(shuō),哈希函數(shù)的回傳結(jié)果(稱之為hash value),是一個(gè)長(zhǎng)度一致,但是數(shù)據(jù)內(nèi)容卻是獨(dú)一無(wú)二(unique)的數(shù)值。所以,如果看到兩個(gè)完全不一樣的”hash value”,我們就可以推斷其原始的input一定是不一樣的;反之,兩個(gè)相同的hash value,其原本的input值則會(huì)是一模一樣的。
我們可以用Python內(nèi)置的SHA-256 Hash Algorithm,展示一下上述的哈希函數(shù)特性
import hashlib
x1=”my 1st Bitcoin”.encode()
y1=hashlib.sha256(x1).hexdigest()
x2=”I am not Satoshi Nakamoto”.encode()
y2=hashlib.sha256(x2).hexdigest()
print(f’y1= {y1}’)
print(f’y2= {y2}’)
print(f’y1 include {len(y1)} words’)
print(f’y2 include {len(y2)} words’)
如果尚未安裝Python,可以利用下面這個(gè)網(wǎng)址試試,看看將my 1st Bitcoin Hash后的值是不是和上圖用Python跑出來(lái)的值(y1=后面的那串)是一樣的:
https://anders.com/區(qū)塊鏈/hash.html
加密哈希函數(shù)是哈希函數(shù)于密碼學(xué)上的一項(xiàng)應(yīng)用,上述的SHA-256就是一個(gè)加密哈希函數(shù)的實(shí)作產(chǎn)品。
哈希函數(shù)還有另一項(xiàng)特點(diǎn):one-way(單向)function
以上述的Python程序?yàn)槔?,在已知input值=”my 1st Bitcoin”,透過(guò)sha256 funcTIon,可以快速的算出hash value=”a5e4c0673fcedff2bc2174123e97b511d5d17f4317869e7bd60d0a6d3d7fa1c6”;但反過(guò)來(lái)說(shuō),我們想從”a5e4c0673fcedff2bc2174123e97b511d5d17f4317869e7bd60d0a6d3d7fa1c6”這一串?dāng)?shù)據(jù)中反推出input的值:”my 1st Bitcoin”,唯一的方式是透過(guò)暴力解法,也就是不斷地丟字串給sha256 funcTIon,直到得到hash value是一樣時(shí),也就是傳入的input字串為”my 1st Bitcoin”時(shí),才能得到答案。各位可以想像這猜中的機(jī)率是多低?如果你能一猜就中,那你也不用在這研究?jī)?nèi)存塊鏈了,直接去買樂透比較快。
區(qū)塊鏈透過(guò)上述哈希函數(shù)的三個(gè)特性,構(gòu)架起了內(nèi)存塊鏈中的數(shù)據(jù),只要一經(jīng)寫入就無(wú)法修改的獨(dú)特功能。
各位可以到下面這個(gè)網(wǎng)址體驗(yàn)區(qū)塊鏈如何透過(guò)哈希函數(shù),緊密的連接起每一個(gè)Block內(nèi)存塊,并且堅(jiān)固地保障了已經(jīng)建立完成的Block區(qū)塊,其內(nèi)容是難以被竄改的。
https://anders.com/區(qū)塊鏈/區(qū)塊鏈.html
Base58編碼
在文章前頭,我們?cè)岬竭^(guò)哈希函數(shù)應(yīng)用在加密貨幣錢包地址的例子,你可能在一些網(wǎng)站或Blog上,看到過(guò)這些亂碼數(shù)字。實(shí)際應(yīng)用上,部落客或是賣家,會(huì)提供一組很像亂碼的Bitcoin addresses,讓你可以支付比特幣給對(duì)方;Bitcoin addresses,看起來(lái)似乎是一堆英數(shù)字的隨機(jī)編碼,但其中也是有特殊的設(shè)計(jì):所有的Bitcoin addresses都是使用Base58進(jìn)行編碼。
解釋Base58前,先來(lái)看看比較常見的,例如已經(jīng)應(yīng)用在Email上的電腦編碼:Base64。Base64編碼包含了26個(gè)小寫英文字母、26個(gè)大寫英文字母、10個(gè)阿拉伯?dāng)?shù)字(0~9),和兩個(gè)特殊字元(+和?—?)。
Base58是Base64的子集合,提供一個(gè)較高可讀性、和較容易發(fā)現(xiàn)和防范錯(cuò)誤的編碼格式,因此廣為眾多加密貨幣所使用。Base58剔除了容易辨識(shí)錯(cuò)誤、或是在某些字體格式看起來(lái)十分類似的字元:數(shù)字0,大寫的英文字母O,小寫的英文字母l、大寫的英文字母I,并且移除了特殊字元(+和?—?)。換句話說(shuō),Base58就是包含了大、小寫英文字母,和阿拉伯?dāng)?shù)字,但移除了四個(gè)字元(0,O,l,I)的集合:
Bitcoin’s Base58 alphabet:
123456789ABCDEFGHJKLMNPQRSTUVWXYZabcdefghijkmnopqrstuvwxyz
Hashing Power
最后,如果對(duì)于Bitcoin Network hashing power有興趣的讀者,可以到下面這個(gè)網(wǎng)址查看Bitcoin網(wǎng)絡(luò)的hash rate變化:
https://www.區(qū)塊鏈.com/charts/hash-rate
粗略估算,Bitcoin network整體的hashing power,從2009年一秒鐘不到一個(gè)MegaHash(MH/sec),如今一秒鐘已經(jīng)超過(guò)40個(gè)ExaHash(EH/sec),光用表面數(shù)字計(jì)算,成長(zhǎng)幅度超過(guò)40兆。
HashPower的單位換算可參考下列網(wǎng)址
https://coinguides.org/hashpower-converter-calculator/
OK,我們已經(jīng)透過(guò)兩篇文章對(duì)內(nèi)存塊鏈有ㄧ定程度的基礎(chǔ)了解了,該是動(dòng)手寫一個(gè)區(qū)塊鏈程序的時(shí)候了。
在進(jìn)入下一篇文章進(jìn)行開發(fā)前,請(qǐng)各位先確定電腦的開發(fā)環(huán)境已經(jīng)安裝好下列Python版本和相關(guān)modules
· Python 3.6+
· flask 0.12.2
· requests 2.18.4
我另外使用了兩個(gè)flask module,以建立表單和畫面
· flask-wtf
· flask-bootstrap
上述modules皆可透過(guò)PIP安裝
· pip install flask
· pip install requests
· pip install flask-wtf
· pip install flask-bootstrap
那,就先請(qǐng)各位準(zhǔn)備好Python環(huán)境啦。