确定录音的音质？

确定录音的音质？

有什么方法可以通过算法确定.wav或.mp3文件的音频质量？

基本上，我的用户使用了多种录音设置（即，他们来自世界各地，我无法控制它们）将音频录音到mp3 / wav文件中。在这一点上，软件应确定其设置是否正确（可悲的是，由于某些原因，他们不能仅通过听自己的录音来做出确定，因此，有时由于以下原因，我们基本上无法理解录音：低音量或高噪音）。

我正在做一个音量检查，以确保麦克风的音量还可以。不幸的是，这错过了体积大但清晰度低的情况。我想知道是否可以进行某种标准扫描（最好在Python中），以检测何时存在大量背景噪音。

我意识到一种可能的解决方案是让他们录制完全静音，然后与语音录音进行比较，如果“静音”录音的音量与语音录音的音量太接近，则认为音频“不良”。但这取决于两次都从演讲者那里获得好的样本，这可能是我可能依赖的，也可能不是。

因此，我想知道是否只有一种方法可以扫描音频文件（大约10秒钟长），并识别声音文件是否“嘈杂”或清晰。

翻阅古今

浏览 265回答 3

3回答

HUX布斯

这完全取决于您的质量问题，问题尚不完全清楚，但这里有一些建议：在音量高而清晰度低的情况下，我猜问题是用户输入增益过高。录制后，您可以简单地检查是否失真。更好的是，您可以在录制过程中使用自动增益控制（AGC）来防止这种情况的发生。如果噪音太大，我假设问题是扬声器离麦克太远了。在这种情况下，史蒂夫（Steve）的建议可能有用，但要使其真正起作用，您需要做大量工作来比较样本记录和开发统计数据，以了解如何进行区分。在实践中，我认为这是太多的工作。我认为一个更简单且更可行的替代方法（尽管不一定保证）将是创建信号的包络，然后从中创建直方图，并查看直方图与现有的好坏录音之间的比较。如果我们仅谈论语音，则可以将信号分为三个频段（使用时域滤波器，再次，尽管如此，我将使用AGC在录制过程中进行录音，如果AGC发现需要将输入增益设置得过高，则可能是不好的录音。

0

0

狐的传说

不完全是我的专业领域，但我怀疑如果您获得了频谱（可能进行了傅立叶变换），并比较了“好”和“有噪声”的录音，您会发现噪声对交叉频谱的影响更大，而坏频谱的影响更大。录音比好。看一下SciPy中的信号处理部分-这可能会有所帮助。

0

0

随时随地看视频慕课网APP

相关分类

Python