猿问

将实时音频发送到 bing Speech API

我正在尝试使用 NAudio 接收实时语音并将它们以字节数组的形式发送到 bing 语音 API。


我使用事件处理程序接收音频并发送到 Bing Speech API。下面是我试过的代码。


private void Source_DataAvailable(object sender, WaveInEventArgs e)

    {   //convert the sound into a byte array


        writer.Write(e.Buffer, 0, e.BytesRecorded);

         memoryStream = new MemoryStream(e.Buffer);

        CallSpeechAPI(memoryStream);


    }

当我尝试执行时,我们最终得到了以下响应。


响应:OK {"RecognitionStatus":"InitialSilenceTimeout","Offset":5000000,"Duration":0} End Rec


当我尝试将现有的 .wav 文件转换为字节数组并将它们发送到工作正常的 API 时。但是对于实时音频,我们正面临这个问题。


有人可以请帮助是什么问题以及如何解决它。


另外,如果有任何选项可以将实时音频作为字节数组接收,请告诉我?


如果有任何示例代码,请与我们分享。


牛魔王的故事
浏览 166回答 2
2回答

慕容森

新的语音 SDK v0.4.0 中现在提供对音频输入流的支持:。您可以在此处找到示例。你只需要根据这里描述的接口实现你自己的 AudioInputStream::Read() 和 ::GetFormat() 。

ibeautiful

我们将很快通过字节数组或 io.stream 支持音频流。敬请期待。谢谢你的耐心。
随时随地看视频慕课网APP
我要回答