深度学习算法的平均输出

我正在尝试对一些音频剪辑进行分类,为此,我必须将每 30 秒长的音频剪辑分成 1 秒的剪辑。然后我想将这个 1 秒音频片段放入分类器中,并对所有 30 个一秒音频文件的输出进行平均以获得最终响应。我想要每 30 个输入有 1 个输出。

我的问题是我不知道如何将它们输入到我的分类器中,我无法按照此处的建议使用多个输入,因为我有 30 个输入,而不仅仅是 2 个输入,这会很混乱。


四季花海
浏览 105回答 1
1回答

三国纷争

您提到的链接是关于拥有 2 个独立的输入管道,而不是 2 个输入音频剪辑。您需要将30 个一秒音频数据包装在一个Tensor(如果您使用的是 Tensorflow,如果没有,则使用您正在使用的框架的等效框架)然后可以将其Tensor输入到深度学习模型的一个输入管道中。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python