手记

【金秋打卡】第15天 音频无损压缩技术

课程名称音视频基础+ffmpeg原理 入门音视频技术开发
课程章节:音频编码原理
课程讲师李超

课程内容

1.无损编码

使用的熵编码进行无损编码,其基本原理是将用短的编码替代高频的词汇、句子,用长的句代表低频词。
熵编码常用的三种方法:

  • 哈夫曼编码,主要是使用一串二进制数代替一串特别长的字符。特点是:频率越高的编码越少,频率越低的编码越长。
  • 算术编码,即通过二进制小数进行编码。
  • 香农编码,与哈夫曼编码类似,也是一种常见的可变字长编码。香农编码的步骤如下:(1)将信源符号按其出现概率从大到小排序;(2)计算出各概率对应的码字长度;(3)计算累加概率;(4)把各个累加概率由十进制转化为二进制,取该二进制数的前Ni位作为对应信源符号的码字。

2.音频编码过程

采集到原始的音频数据,经过时域转频域变换,并且通过心理声学模型(滤除人听觉范围以外的频率),将这两个数据汇总之后进行量化编码(有损、无损编码),编码后的得到比特流的数据就可以用在网络的传输上。

  • 在时域转频域变换过程中,主要将各种频段的声音傅里叶转换成各种频段的数据,交予量化器。
  • 通过心理声学模型,主要是将人体不能感知的声音去掉,被遮蔽的一部分声音也去掉,交予量化器。
  • 在量化编码阶段,主要将需要传输的数据经过无损编码算法进行量化和编码。
0人推荐
随时随地看视频
慕课网APP