在python中检测音频文件是否有语音

我对音频检测不太了解,我今天才开始学习它,遇到了 webrtcvad(这感觉记录不足 :'( ) 和 LibROSA。我要做的任务是给定一个音频文件,(它可以是空的或者它可以有噪音但没有语音),我必须检测它是否包含任何语音。知道我如何开始它吗?任何帮助将不胜感激。提前致谢。



守着一只汪
浏览 562回答 3
3回答

海绵宝宝撒

听起来像是一个笼统的问题。虽然有几种可能的解决方案:将其传递给语音以进行文本识别。如果你有文字,就会有语音。在更多的音频分析方法中,使用仅检查人声范围的频率滤波器。编辑:这里有一些用于处理音频的库librosa ( https://github.com/librosa/librosa ) - 有很多功能,但文档让初学者很难理解pydub ( https://github.com/jiaaro/pydub ) - 与 librosa 相比更易于使用,但只有很少的功能,并且与 librosa 不同地表示音频(不易与 librosa 集成)spleeter ( https://github.com/deezer/spleeter ) - 分离人声和其他乐器

哈士奇WWW

该speechmetrics软件包提供了两种绝对语音质量测量方法,即 MOSNet 和 SRMR。您可以将音频摘录传递给这些包,检查返回的静音/噪音/语音质量并相应地设置阈值。

肥皂起泡泡

这可以通过频率分析来完成吗?如果是这样,取决于您使用的是 mp3 还是 wav,这些是我知道的 2 个选项:https://docs.python.org/2/library/wave.htmlhttps://github.com/quodlibet/mutagen
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python