语音基础
语音基础
语音格式
听觉原理
发声机原理
1
1
1
1
1
语音基础知识介绍-发声机理
人的发声范围: 100 - 10kHz
男性的基音频率(Fo): 50 - 250 Hz
女性基音频率: 100 - 500 Hz
语音基础知识介绍-听觉原理
外耳: 声源定位(DOA)、放大器(AGC)
中耳:保护耳蜗
内耳:梅尔滤波器组
人声听声范围: 20 - 20kHz
语音基础知识介绍-音频示例及参数
格式: 无损/有损
无损: WAV/PCM/FLAC
有损: MP3/ogg/AAC
幅职: 多种表示方式
采样值: short(-32768~ + 32767)
标准化值:采样值的归一化
分贝: 10log[(x/xo)^2] = 20log|x/xo|
长度:音频持续时间,一般单位是s,精确到ms
采样率:每秒钟采样的个数8k,16k,22.05k,44.1k
通道: 单声道(mono),多声道(混音),立体声(stereo)
位宽: 分辨率
16bits: 幅值的范围用两个字节的short表示(-32768~32767)
32bits: 幅值的范围用四个字节的long short表示(-65537~65536)
发声机理。