课程名称:音视频基础+ffmpeg原理 入门音视频技术开发
课程章节:【实战】音频采集
课程讲师:李超
课程内容
1. av_read_frame
ffmpeg 中的 av_read_frame() 的作用是读取码流中的音频若干帧或者视频一帧。例如,解码视频的时候,每解码一个视频帧,需要先调用 av_read_frame()获得一帧视频的压缩数据,然后才能对该数据进行解码。这个函数接收两个参数:
- AVFormatContext *s // 文件格式上下文,输入的AVFormatContext
- AVPacket *pkt // 这个值不能传NULL,必须是一个空间,输出的AVPacket,跟环境有关系,可以通过AVPacket做判断,到底是音频包、还是视频包。
- 函数的返回值非0,读取失败,为0,成功,可以拿个while循环,来判断数据有没有读取完毕。
2. AVPacket
AVPacket 结构体包括两个属性:
- data(音频的具体数据或视频的具体数据)
- size(大小值节)
3. 与AVPacket相关的API
- av_init_packet #就是对AVPacket初始化,就是对除了data和size外,其他的参数进行的初始化
- av_packet_unref #释放资源,减少一个引用计数,与上面的API,是一对。
- av_packet_alloc #分配空间,将分配的空间初始化,做了2件事,1.分配空间 2. 调用av_init_packet
- av_packet_free #将分配的客户释放掉,然后解应用。做了2件事,1.先调用av_packet_unref ,2. 对av_packet_alloc创建的空间进行释放。
init和unref 是成双出现的,alloc和free 是成双出现的。
4. 示例代码
#include <iostream>
using namespace std;
//包含ffmpeg头文件
extern "C"
{
#include "libavutil/avutil.h"
#include "libavdevice/avdevice.h"
#include "libavformat/avformat.h"
#include "libavcodec/avcodec.h"
}
#include <windows.h>
#include <vector>
#include <string>
#include <memory>
using std::vector;
using std::string;
using std::shared_ptr;
void capture_audio()
{
// windows api 获取音频设备列表(ffmpeg好像没有提供获取音频设备的api)
unsigned int nDeviceNum = waveInGetNumDevs();
vector<string> vecDeviceName;
for (unsigned int i = 0; i < nDeviceNum; i++){
WAVEINCAPS wic;
waveInGetDevCaps(i, &wic, sizeof (wic));
printf("\n音频输入设备:%s\n", wic.szPname);
//转成utf-8
int nSize = WideCharToMultiByte(CP_UTF8, 0, wic.szPname,
static_cast<int>(wcslen(wic.szPname)), nullptr, 0, nullptr, nullptr);
shared_ptr<char> spDeviceName(new char[nSize + 1]);
memset(spDeviceName.get(), 0, static_cast<size_t>(nSize + 1));
WideCharToMultiByte(CP_UTF8, 0, wic.szPname, static_cast<int>(wcslen(wic.szPname)),
spDeviceName.get(), nSize, nullptr, nullptr);
vecDeviceName.push_back(spDeviceName.get());
printf("audio input device:%s \n", spDeviceName.get());
}
if (vecDeviceName.size() <= 0){
printf("not find audio input device.\n");
return;
}
//使用第一个音频设备
string sDeviceName = "audio=" + vecDeviceName[0];
//ffmpeg
int ret = 0;
char errors[1024];
AVFormatContext *fmt_ctx = nullptr;
AVDictionary *options = nullptr;
//register audio device
avdevice_register_all();
//get format
const AVInputFormat *iformat = av_find_input_format("dshow");
if ((ret = avformat_open_input(&fmt_ctx, sDeviceName.data(),
iformat, &options)) < 0) {
av_strerror(ret, errors, 1024);
printf("Failed to open audio device, [%d]%s\n", ret, errors);
}
//read frame
int count = 0;
AVPacket pkt;
av_init_packet(&pkt);
while ((ret = av_read_frame(fmt_ctx, &pkt)) == 0 && count++ < 500) {
printf("pkt size is %d \n", pkt.size);
}
av_packet_unref(&pkt);
return;
}
int main()
{
capture_audio();
return 0;
}