在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的“大神”,有的是刚开始学习的初学者。在和大家探讨的过程中,我忽然发现了一个问题:在“大神”和初学者之间好像有一个不可逾越的鸿沟。“大神”们水平高超,探讨着深奥的问题;而初学者们还停留在入门阶段。究竟是什么原因造成的这种“两极分化”呢?最后,我发现了问题的关键:FFMPEG难度比较大,却没有一个循序渐进,由简单到复杂的教程。现在网上的有关FFMPEG的教程多半难度比较大,不太适合刚接触FFMPEG的人学习;而且很多的例子程序编译通不过,极大地打消了学习的积极性。我自己在刚开始学习FFMPEG的时候也遇到了很大的困难。为了帮助更多的人快速成为“大神”,我想总结一个学习FFMPEG的方法,方便大家循序渐进的学习FFMPEG。
0. 背景知识
本章主要介绍一下FFMPEG都用在了哪里(在这里仅列几个我所知的,其实远比这个多)。说白了就是为了说明:FFMPEG是非常重要的。
使用FFMPEG作为内核视频播放器:
Mplayer,ffplay,射手播放器,暴风影音,KMPlayer,QQ影音...
使用FFMPEG作为内核的Directshow Filter:
ffdshow,lav filters...
使用FFMPEG作为内核的转码工具:
ffmpeg,格式工厂...
事实上,FFMPEG的视音频编解码功能确实太强大了,几乎囊括了现存所有的视音频编码标准,因此只要做视音频开发,几乎离不开它。
1. ffmpeg程序的使用(ffmpeg.exe,ffplay.exe,ffprobe.exe)
本章主要介绍一下ffmpeg工程包含的三个exe的使用方法。
ffmpeg的官方网站是:
编译好的windows可用版本的下载地址(官网中可以连接到这个网站,和官方网站保持同步):
该网站中的FFMPEG分为3个版本:Static,Shared,Dev。
前两个版本可以直接在命令行中使用,他们的区别在于:Static里面只有3个应用程序:ffmpeg.exe,ffplay.exe,ffprobe.exe,每个exe的体积都很大,相关的Dll已经被编译到exe里面去了。Shared里面除了3个应用程序:ffmpeg.exe,ffplay.exe,ffprobe.exe之外,还有一些Dll,比如说avcodec-54.dll之类的。Shared里面的exe体积很小,他们在运行的时候,到相应的Dll中调用功能。
Dev版本是用于开发的,里面包含了库文件xxx.lib以及头文件xxx.h,这个版本不包含exe文件。
打开系统命令行接面,切换到ffmpeg所在的目录,就可以使用这3个应用程序了。
1.1 ffmpeg.exe
ffmpeg是用于转码的应用程序。
一个简单的转码命令可以这样写:
将input.avi转码成output.ts,并设置视频的码率为640kbps
ffmpeg -i input.avi -b:v 640k output.ts
具体的使用方法可以参考:
详细的使用说明(英文):
1.2 ffplay.exe
ffplay是用于播放的应用程序。
一个简单的播放命令可以这样写:
播放test.avi
ffplay test.avi
具体的使用方法可以参考:
详细的使用说明(英文):
1.3 ffprobe.exe
ffprobe是用于查看文件格式的应用程序。
这个就不多介绍了。
详细的使用说明(英文):
2. ffmpeg库的使用:视频播放器
本章开始介绍使用ffmpeg的库进行开发。
2.1 ffmpeg库的配置
从网站上
1.下载Dev版本,里面包含了ffmpeg的xxx.h头文件以及xxx.lib库文件。
2.下载Shared版本,里面包含了ffmpeg的dll文件。
3.将这两部分文件拷贝到VC工程下面就可以了
注:可能会出现问题,参见:
如果不想自己手动配置,可以下载已经配置好的工程:
2.2 最简单的视频播放器
学习文章《》中的代码,这是ffmpeg做视频播放器最简单的代码了,是我自己精简出来的,已经不能再简化了,每一行都很重要。
ffmpeg的函数介绍:
注1:播放视频或音频数据的时候会用到SDL。有关SDL可以参考:
SDL参考文档:
注2:如果想查看解码后的数据,需要用到 YUV播放器:或都可以
2.3 相关结构体的研究
ffmpeg的结构体之间的关系参考文章:
结构体中每个变量的分析,参考文章:
3. ffmpeg库的使用:音频播放器
3.1 最简单的音频播放器
学习文章《》 中的代码,和最简单的视频播放器一样,这是最简单的音频播放器,每一行代码都很重要。
注:如果想要查看解码后的数据(PCM数据),需要用到Audition。
4. ffmpeg库的使用:一个真正的播放器——ffplay
4.1 真正的播放器
ffplay流程图如文章《》 所示。ffplay代码比较复杂,但是其核心代码和《》 是一样的。可以两个工程结合着学习。
ffplay代码简介资料:
ffplay使用说明:
ffplay已经移植到VC下的工程:(别人做的,质量很不错)
5. ffmpeg库的使用:编码
5.1 YUV编码为视频
ffmpeg编码我自己研究的不是很多,可以参考文章 :
6. ffmpeg源代码分析
通晓了ffmpeg库的使用以后,可以看一下ffmpeg的源代码。注意ffmpeg的源代码只有在linux下才能编译,在windows下可以使用MinGW进行编译。推荐使用Eclipse查看ffmpeg的源代码。
有一个很完整的ffmpeg源代码的分析文档:
ffmpeg源代码分析文章列表如下。
库函数分析:
ffmpeg.exe源代码分析:
7. ffmpeg相关工程的学习
学习完成ffmpeg,还可以了解一下基于ffmpeg的相关的多媒体开源工程,在这里推荐以下几个:
7.1 ffdshow
ffdshow是基于ffmpeg的解码器类库libavcodec的DirectShow Filter。广泛安装在PC上。
有关ffdshow的源代码分析文章(更新中):
7.2 LAV filters
LAV Filter是基于ffmpeg的解码器类库libavcodec,以及解封装器类库libavformat的DirectShow Filter。广泛安装在PC上。
有关LAV Filter的源代码分析文章:
7.3 Mplayer
Mplayer是Linux下使用最广泛的播放器,也有Windows版本的。其中使用了ffmpeg。
有关Mplayer的源代码分析文章:
7.4 Media Player Classic - HC
现在广为使用很多播放器都是构建于Media Player Classic - HC的基础之上的。
有关Media Player Classic - HC的源代码分析文章: