在python中检测音频文件是否有语音

3回答

海绵宝宝撒

听起来像是一个笼统的问题。虽然有几种可能的解决方案：将其传递给语音以进行文本识别。如果你有文字，就会有语音。在更多的音频分析方法中，使用仅检查人声范围的频率滤波器。编辑：这里有一些用于处理音频的库librosa ( https://github.com/librosa/librosa ) - 有很多功能，但文档让初学者很难理解pydub ( https://github.com/jiaaro/pydub ) - 与 librosa 相比更易于使用，但只有很少的功能，并且与 librosa 不同地表示音频（不易与 librosa 集成）spleeter ( https://github.com/deezer/spleeter ) - 分离人声和其他乐器

0 0

哈士奇WWW

该speechmetrics软件包提供了两种绝对语音质量测量方法，即 MOSNet 和 SRMR。您可以将音频摘录传递给这些包，检查返回的静音/噪音/语音质量并相应地设置阈值。

0 0

肥皂起泡泡

这可以通过频率分析来完成吗？如果是这样，取决于您使用的是 mp3 还是 wav，这些是我知道的 2 个选项：https://docs.python.org/2/library/wave.htmlhttps://github.com/quodlibet/mutagen

0 0