手记

【金秋打卡】第12天 从音频设备中读取音频数据

课程名称音视频基础+ffmpeg原理 入门音视频技术开发
课程章节:【实战】音频采集
课程讲师李超

课程内容

1. av_read_frame

ffmpeg 中的 av_read_frame() 的作用是读取码流中的音频若干帧或者视频一帧。例如,解码视频的时候,每解码一个视频帧,需要先调用 av_read_frame()获得一帧视频的压缩数据,然后才能对该数据进行解码。这个函数接收两个参数:

  • AVFormatContext *s   // 文件格式上下文,输入的AVFormatContext
  • AVPacket *pkt   // 这个值不能传NULL,必须是一个空间,输出的AVPacket,跟环境有关系,可以通过AVPacket做判断,到底是音频包、还是视频包。
  • 函数的返回值非0,读取失败,为0,成功,可以拿个while循环,来判断数据有没有读取完毕。

2. AVPacket

AVPacket 结构体包括两个属性:

  • data(音频的具体数据或视频的具体数据)
  • size(大小值节)

3. 与AVPacket相关的API

  • av_init_packet #就是对AVPacket初始化,就是对除了data和size外,其他的参数进行的初始化
  • av_packet_unref #释放资源,减少一个引用计数,与上面的API,是一对。
  • av_packet_alloc #分配空间,将分配的空间初始化,做了2件事,1.分配空间 2. 调用av_init_packet
  • av_packet_free #将分配的客户释放掉,然后解应用。做了2件事,1.先调用av_packet_unref ,2. 对av_packet_alloc创建的空间进行释放。

init和unref 是成双出现的,alloc和free 是成双出现的。

4. 示例代码

#include <iostream>
using namespace std;

//包含ffmpeg头文件
extern "C"
{
#include "libavutil/avutil.h"
#include "libavdevice/avdevice.h"
#include "libavformat/avformat.h"
#include "libavcodec/avcodec.h"
}

#include <windows.h>
#include <vector>
#include <string>
#include <memory>

using std::vector;
using std::string;
using std::shared_ptr;

void capture_audio()
{
    // windows api 获取音频设备列表(ffmpeg好像没有提供获取音频设备的api)
    unsigned int nDeviceNum = waveInGetNumDevs();
    vector<string> vecDeviceName;

    for (unsigned int i = 0; i < nDeviceNum; i++){
        WAVEINCAPS wic;
        waveInGetDevCaps(i, &wic, sizeof (wic));
        printf("\n音频输入设备:%s\n", wic.szPname);

        //转成utf-8
        int nSize = WideCharToMultiByte(CP_UTF8, 0, wic.szPname,
                    static_cast<int>(wcslen(wic.szPname)), nullptr, 0, nullptr, nullptr);
        shared_ptr<char> spDeviceName(new char[nSize + 1]);
        memset(spDeviceName.get(), 0, static_cast<size_t>(nSize + 1));
        WideCharToMultiByte(CP_UTF8, 0, wic.szPname, static_cast<int>(wcslen(wic.szPname)),
                            spDeviceName.get(), nSize, nullptr, nullptr);
        vecDeviceName.push_back(spDeviceName.get());
        printf("audio input device:%s \n", spDeviceName.get());
    }

    if (vecDeviceName.size() <= 0){
        printf("not find audio input device.\n");
        return;
    }

    //使用第一个音频设备
    string sDeviceName = "audio=" + vecDeviceName[0];

    //ffmpeg
    int ret = 0;
    char errors[1024];
    AVFormatContext *fmt_ctx = nullptr;
    AVDictionary *options = nullptr;

    //register audio device
    avdevice_register_all();

    //get format
    const AVInputFormat *iformat = av_find_input_format("dshow");
    if ((ret = avformat_open_input(&fmt_ctx, sDeviceName.data(),
        iformat, &options)) < 0) {
        av_strerror(ret, errors, 1024);
        printf("Failed to open audio device, [%d]%s\n", ret, errors);
    }

    //read frame
    int count = 0;
    AVPacket pkt;
    av_init_packet(&pkt);
    while ((ret = av_read_frame(fmt_ctx, &pkt)) == 0 && count++ < 500) {
        printf("pkt size is %d \n", pkt.size);
    }
    av_packet_unref(&pkt);
    return;
}

int main()
{
    capture_audio();
    return 0;
}

0人推荐
随时随地看视频
慕课网APP