已经解决了,,可以修改这个库函数参数列表为图片那样,也可以修改fft_windows=pad_center()参数的传递方式
16bit是16位的二进制数(2^16),32位是32位的二进制数(2^32)。对应的是数的范围。
老师,比较两段音频相似的算法是什么类型呢
啦啦啦
推荐两本书:
语音识别基本法,汤志远,清华大学
Kaldi语音识别实战,陈果果
你好,处理完了的数据集在课程的提供的百度网盘链接里面https://pan.baidu.com/s/1BCU9PLwR0qssbq7lLkl_SA 提取码:vcsl
这里面还包括一个预训练的模型。