www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 公眾號(hào)精選 > 21ic電子網(wǎng)
[導(dǎo)讀]哈夫曼樹(Huffman)又稱為最優(yōu)二叉樹,是指對(duì)于一組帶有確定權(quán)值的葉子結(jié)點(diǎn)所構(gòu)造的具有帶權(quán)路徑長度最短的二叉樹。 那么,這種數(shù)據(jù)結(jié)構(gòu)究竟有什么用呢?我們今天就來揭曉答案。 計(jì)算機(jī)系統(tǒng)是如何存儲(chǔ)信息的呢? 計(jì)算機(jī)不是人,它不認(rèn)識(shí)中文和英文,更不認(rèn)識(shí)





哈夫曼樹(Huffman)又稱為最優(yōu)二叉樹,是指對(duì)于一組帶有確定權(quán)值的葉子結(jié)點(diǎn)所構(gòu)造的具有帶權(quán)路徑長度最短的二叉樹。


那么,這種數(shù)據(jù)結(jié)構(gòu)究竟有什么用呢?我們今天就來揭曉答案。一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?



計(jì)算機(jī)系統(tǒng)是如何存儲(chǔ)信息的呢?


計(jì)算機(jī)不是人,它不認(rèn)識(shí)中文和英文,更不認(rèn)識(shí)圖片和視頻,它唯一“認(rèn)識(shí)”的就是0(低電平)和1(高電平)。


因此,我們?cè)谟?jì)算機(jī)上看到的一切文字、圖像、音頻、視頻,底層都是用二進(jìn)制來存儲(chǔ)和傳輸?shù)摹?/span>


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


從狹義上來講,把人類能看懂的各種信息,轉(zhuǎn)換成計(jì)算機(jī)能夠識(shí)別的二進(jìn)制形式,被稱為編碼。


編碼的方式可以有很多種,我們大家最熟悉的編碼方式就屬ASCII碼了。


在ASCII碼當(dāng)中,把每一個(gè)字符表示成特定的8位二進(jìn)制數(shù),比如:

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


顯然,ASCII碼是一種等長編碼,也就是任何字符的編碼長度都相等。

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?



為什么這么說呢?讓我們來看一個(gè)例子:


假如一段信息當(dāng)中,只有A,B,C,D,E,F(xiàn)這6個(gè)字符,如果使用等長編碼,我們可以把每一個(gè)字符都設(shè)計(jì)成長度為3的二進(jìn)制編碼:


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


如此一來,給定一段信息 “ABEFCDAED”,就可以編碼成二進(jìn)制的 “000 001 100 101 010 011 000 100 011”,編碼總長度是27。


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


但是,這樣的編碼方式是最優(yōu)的設(shè)計(jì)嗎?如果我們讓不同的字符對(duì)應(yīng)不同長度的編碼,結(jié)果會(huì)怎樣呢?比如:


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


如此一來,給定的信息 “ABEFCDAED”,就可以編碼成二進(jìn)制的 “0 00 10 11 01 1 0 10 1”,編碼的總長度只有14。


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?



哈夫曼編碼(Huffman Coding),同樣是由麻省理工學(xué)院的哈夫曼博所發(fā)明,這種編碼方式實(shí)現(xiàn)了兩個(gè)重要目標(biāo):


1.任何一個(gè)字符編碼,都不是其他字符編碼的前綴。

2.信息編碼的總長度最小。

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?



哈夫曼編碼的生成過程是什么樣子呢?讓我們看看下面的例子:


假如一段信息里只有A,B,C,D,E,F(xiàn)這6個(gè)字符,他們出現(xiàn)的次數(shù)依次是2次,3次,7次,9次,18次,25次,如何設(shè)計(jì)對(duì)應(yīng)的編碼呢?


我們不妨把這6個(gè)字符當(dāng)做6個(gè)葉子結(jié)點(diǎn),把字符出現(xiàn)次數(shù)當(dāng)做結(jié)點(diǎn)的權(quán)重,以此來生成一顆哈夫曼樹:


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


這樣做的意義是什么呢?


哈夫曼樹的每一個(gè)結(jié)點(diǎn)包括左、右兩個(gè)分支,二進(jìn)制的每一位有0、1兩種狀態(tài),我們可以把這兩者對(duì)應(yīng)起來,結(jié)點(diǎn)的左分支當(dāng)做0,結(jié)點(diǎn)的右分支當(dāng)做1,會(huì)產(chǎn)生什么樣的結(jié)果?


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


這樣一來,從哈夫曼樹的根結(jié)點(diǎn)到每一個(gè)葉子結(jié)點(diǎn)的路徑,都可以等價(jià)為一段二進(jìn)制編碼:


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


上述過程借助哈夫曼樹所生成的二進(jìn)制編碼,就是哈夫曼編碼。


現(xiàn)在,我們面臨兩個(gè)關(guān)鍵的問題:


首先,這樣生成的編碼有沒有前綴問題帶來的歧義呢?答案是沒有歧義。


因?yàn)槊恳粋€(gè)字符對(duì)應(yīng)的都是哈夫曼樹的葉子結(jié)點(diǎn),從根結(jié)點(diǎn)到這些葉子結(jié)點(diǎn)的路徑并沒有包含關(guān)系,最終得到的二進(jìn)制編碼自然也不會(huì)是彼此的前綴。


其次,這樣生成的編碼能保證總長度最小嗎?答案是可以保證。


哈夫曼樹的重要特性,就是所有葉子結(jié)點(diǎn)的(權(quán)重 X 路徑長度)之和最小。


放在信息編碼的場(chǎng)景下,葉子結(jié)點(diǎn)的權(quán)重對(duì)應(yīng)字符出現(xiàn)的頻次,結(jié)點(diǎn)的路徑長度對(duì)應(yīng)字符的編碼長度。


所有字符的(頻次 X 編碼長度)之和最小,自然就說明總的編碼長度最小。


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?



一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?


       
  1. privateNode root;

  2. privateNode[] nodes;


  3. //構(gòu)建哈夫曼樹

  4. publicvoid createHuffmanTree(int[] weights) {

  5. //優(yōu)先隊(duì)列,用于輔助構(gòu)建哈夫曼樹

  6. Queue<Node> nodeQueue = newPriorityQueue<>();

  7. nodes = newNode[weights.length];


  8. //構(gòu)建森林,初始化nodes數(shù)組

  9. for(int i=0; i<weights.length; i++){

  10. nodes[i] = newNode(weights[i]);

  11. nodeQueue.add(nodes[i]);

  12. }


  13. //主循環(huán),當(dāng)結(jié)點(diǎn)隊(duì)列只剩一個(gè)結(jié)點(diǎn)時(shí)結(jié)束

  14. while(nodeQueue.size() > 1) {

  15. //從結(jié)點(diǎn)隊(duì)列選擇權(quán)值最小的兩個(gè)結(jié)點(diǎn)

  16. Node left = nodeQueue.poll();

  17. Node right = nodeQueue.poll();

  18. //創(chuàng)建新結(jié)點(diǎn)作為兩結(jié)點(diǎn)的父節(jié)點(diǎn)

  19. Node parent = newNode(left.weight + right.weight, left, right);

  20. nodeQueue.add(parent);

  21. }

  22. root = nodeQueue.poll();

  23. }


  24. //輸入字符下表,輸出對(duì)應(yīng)的哈夫曼編碼

  25. publicString convertHuffmanCode(int index) {

  26. return nodes[index].code;

  27. }


  28. //用遞歸的方式,填充各個(gè)結(jié)點(diǎn)的二進(jìn)制編碼

  29. publicvoid encode(Node node, String code){

  30. if(node == null){

  31. return;

  32. }

  33. node.code = code;

  34. encode(node.lChild, node.code+"0");

  35. encode(node.rChild, node.code+"1");

  36. }


  37. publicstaticclassNodeimplementsComparable<Node>{

  38. int weight;

  39. //結(jié)點(diǎn)對(duì)應(yīng)的二進(jìn)制編碼

  40. String code;

  41. Node lChild;

  42. Node rChild;


  43. publicNode(int weight) {

  44. this.weight = weight;

  45. }


  46. publicNode(int weight, Node lChild, Node rChild) {

  47. this.weight = weight;

  48. this.lChild = lChild;

  49. this.rChild = rChild;

  50. }


  51. @Override

  52. publicint compareTo(Node o) {

  53. returnnewInteger(this.weight).compareTo(newInteger(o.weight));

  54. }

  55. }


  56. publicstaticvoid main(String[] args) {

  57. char[] chars = {'A','B','C','D','E','F'};

  58. int[] weights = {2,3,7,9,18,25};

  59. HuffmanCode huffmanCode = newHuffmanCode();

  60. huffmanCode.createHuffmanTree(weights);

  61. huffmanCode.encode(huffmanCode.root, "");

  62. for(int i=0; i<chars.length; i++){

  63. System.out.println(chars[i] +":"+ huffmanCode.convertHuffmanCode(i));

  64. }

  65. }



這段代碼中,Node類增加了一個(gè)新字段code,用于記錄結(jié)點(diǎn)所對(duì)應(yīng)的二進(jìn)制編碼。


當(dāng)哈夫曼樹構(gòu)建之后,就可以通過遞歸的方式,從根結(jié)點(diǎn)向下,填充每一個(gè)結(jié)點(diǎn)的code值。

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?



—————END—————




作者:小灰

來源:程序員小灰


推薦閱讀

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?

你和大牛工程師之間到底差了啥?
加入技術(shù)交流群,與高手面對(duì)面 
添加管理員微信
一組漫畫告訴你,“哈夫曼編碼”是什么鬼?
加入“中國電子網(wǎng)微信群”交流

一組漫畫告訴你,“哈夫曼編碼”是什么鬼?
具體加群詳情請(qǐng)戳

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!

21ic電子網(wǎng)

掃描二維碼,關(guān)注更多精彩內(nèi)容

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉