这是什么音频数据类型,如何将其转换为 wav/l16?

我正在 Web 浏览器中录制音频并将其发送到 Flask 后端。从那里,我想使用 Watson Speech to Text 转录音频。我无法弄清楚我正在接收音频的数据格式以及如何将其转换为适用于 watson 的格式。

我相信 watson 需要像 b'\x0c\xff\x0c\xffd 这样的字节串。我从浏览器收到的数据看起来像 [ -4 -27 -34 -9 1 -8 -1 2 10 -28],由于负值(使用 bytes() 给我),我不能直接转换为字节那个错误)。

我真的不知道我需要在这里进行什么样的转换。Watson 不会为我抛出的任何类型的数据返回任何错误,只是没有响应。


幕布斯6054654
浏览 129回答 1
1回答

守着星空守着你

这些值应该没问题,但是您必须在获取它们的字节表示之前定义您希望它们如何存储。您只想将这些值转换为有符号的 2 字节/16 位整数,然后获取这些值的字节表示。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python