FFMPEG小白之視音頻基礎知識

最新 02-23

首先，向雷霄驊致敬

必備知識：

c語言及其開發環境

視頻播放器的原理

播放視頻文件的流程:

封裝格式數據（即FLV、MKV、MP4等等視頻文件）

通過解封裝格式將視頻數據和音頻數據進行解析

得到音頻壓縮數據（aac mp3 等）和視頻壓縮數據（h.264 mpeg2 等）

（需要注意的是，這些壓縮數據佔用內存空間小，而視頻壓縮數據又稱碼流，不能直接用於顯示）

音頻

音頻壓縮數據進行音頻解碼得到音頻採樣數據（即 pcm等）

同樣視頻也是類似的

視頻壓縮數據進行視頻解碼得到視頻像素數據（即 yuv 等）

然後，將視頻像素數據和音頻採樣數據進行視音頻同步從而呈現給我們視頻和音頻享受

備註：

1.通過mediaoinfo能夠看到文件的一些常用信息比如視頻格式音頻平均混合碼率等視頻解析度音頻採樣率

2.視頻封裝格式中的 MPEG2-TS格式特點：不包含文件頭，由數據大小固定的ts packet組成，所以此類型的文件如果文件頭丟失，也能正常播放；另一種 FLVg格式特點：包含文件頭，數據有大小不固定的tag構成，所以正因為有文件頭，所以當文件開頭丟失的時候就會導致不能正常播放。

3.上面說的視頻編碼數據，其實是對視頻像素數據（RGB YUV等）壓縮成的視頻碼流，從而降低視頻的數據量，一般如果直接用視頻像素數據存儲視頻的話，會佔用很多物理空間。目前最常用的，就是H.264,目前90%都在使用h.264視頻編碼格式，而MPEG2 現在一些數字電視在使用。查看視頻編碼格式的軟體有Elecard Stream Eye

視頻編碼格式

h.264編碼格式

他的存儲方式是將視頻的畫面按照單位存儲，即1幀畫面經過壓縮編碼後，存儲到1個NALU單位中，但是他的壓縮方法很複雜，包含了幀內預測、幀間預測、熵編碼、環路濾波等環節構成。比較複雜，所以暫不深究。

H.264的優點是可以將圖像數據壓縮至100倍以上,即100m的圖像數據可以用其壓縮至1m。