ffmpeg學習(1)——解碼
FFmpeg是相當強大的多媒體編解碼框架,在深入分析其源代碼之前必須要有基本的多媒體基礎知識,否則其源代碼會非?;逎y懂。本文將從介紹一些基本的多媒體只是,主要是為研讀ffmpeg源代碼做準備,比如一些編解碼部分,只有真正了解了多媒體處理的基本流程,研讀ffmpeg源代碼才能事半功倍。
下面分析一下多媒體中最基本最核心的視頻解碼過程,平常我們從網上下載一部電影或者一首歌曲,那么相應的多媒體播放器為我們做好了一切工作,我們只用欣賞就ok了。目前幾乎所有的主流多媒體播放器都是基于開源多媒體框架ffmpeg來做的,可見ffmpeg的強大。下面是對一個媒體文件進行解碼的主要流程:
1.??? 解復用(Demux)
當我們打開一個多媒體文件之后,第一步就是解復用,稱之為Demux。為什么需要這一步,這一步究竟是做什么的?我們知道在一個多媒體文件中,既包括音頻也包括視頻,而且音頻和視頻都是分開進行壓縮的,因為音頻和視頻的壓縮算法不一樣,既然壓縮算法不一樣,那么肯定解碼也不一樣,所以需要對音頻和視頻分別進行解碼。雖然音頻和視頻是分開進行壓縮的,但是為了傳輸過程的方便,將壓縮過的音頻和視頻捆綁在一起進行傳輸。所以我們解碼的第一步就是將這些綁在一起的音頻和視頻流分開來,也就是傳說中的解復用,所以一句話,解復用這一步就是將文件中捆綁在一起的音頻流和視頻流分開來以方便后面分別對它們進行解碼,下面是Demux之后的效果。
2. ?? 解碼(Decode)
這一步不用多說,一個多媒體文件肯定是經過某種或幾種格式的壓縮的,也就是通常所說的視頻和音頻編碼,編碼是為了減少數(shù)據(jù)量,否則的話對我們的存儲設備是一個挑戰(zhàn),如果是流媒體的話對網絡帶寬也是一個幾乎不可能完成的任務。所以我們必須對媒體信息進行盡可能的壓縮。
3.????FFmpeg中解碼流程對應的API函數(shù)
了解了上面的一個媒體文件從打開到解碼的流程,就可以很輕松的閱讀ffmpeg代碼,ffmpeg的框架也基本是按照這個流程來的,但不是每個流程對應一個API,下面這副圖是我分析ffmpeg并根據(jù)自己的理解得到的ffmpeg解碼流程對應的API,我想這幅圖應該對理解ffmpeg和編解碼有一些幫助。
Ffmpeg中Demux這一步是通過avformat_open_input()這個api來做的,這個api讀出文件的頭部信息,并做demux,在此之后我們就可以讀取媒體文件中的音頻和視頻流,然后通過av_read_frame()從音頻和視頻流中讀取出基本數(shù)據(jù)流packet,然后將packet送到avcodec_decode_video2()和相對應的api進行解碼。