有什么方法可以通过算法确定.wav或.mp3文件的音频质量?
基本上,我的用户使用了多种录音设置(即,他们来自世界各地,我无法控制它们)将音频录音到mp3 / wav文件中。在这一点上,软件应确定其设置是否正确(可悲的是,由于某些原因,他们不能仅通过听自己的录音来做出确定,因此,有时由于以下原因,我们基本上无法理解录音:低音量或高噪音)。
我正在做一个音量检查,以确保麦克风的音量还可以。不幸的是,这错过了体积大但清晰度低的情况。我想知道是否可以进行某种标准扫描(最好在Python中),以检测何时存在大量背景噪音。
我意识到一种可能的解决方案是让他们录制完全静音,然后与语音录音进行比较,如果“静音”录音的音量与语音录音的音量太接近,则认为音频“不良”。但这取决于两次都从演讲者那里获得好的样本,这可能是我可能依赖的,也可能不是。
因此,我想知道是否只有一种方法可以扫描音频文件(大约10秒钟长),并识别声音文件是否“嘈杂”或清晰。
HUX布斯
狐的传说
相关分类