为什么cgo的性能这么慢？我的测试代码有问题吗？

3回答

繁星点点滴滴

正如您所发现的，通过 CGo 调用 C/C++ 代码的开销相当高。所以一般来说，你最好尽量减少 CGo 调用的次数。对于上面的示例，与其在循环中重复调用 CGo 函数，不如将循环向下移动到 C。Go 运行时如何设置其线程有很多方面可能会打破许多 C 代码片段的预期：Goroutines 运行在一个相对较小的堆栈上，通过分段堆栈（旧版本）或通过复制（新版本）处理堆栈增长。Go 运行时创建的线程可能无法与libpthread的线程本地存储实现正确交互。Go 运行时的 UNIX 信号处理程序可能会干扰传统的 C 或 C++ 代码。Go 重用 OS 线程来运行多个 Goroutine。如果 C 代码调用阻塞系统调用或以其他方式独占线程，则可能对其他 goroutine 有害。由于这些原因，CGo 选择了在使用传统堆栈设置的单独线程中运行 C 代码的安全方法。如果你来自像 Python 这样的语言，用 C 重写代码热点作为加速程序的一种方式并不少见，那么你会感到失望。但与此同时，等效的 C 和 Go 代码之间的性能差距要小得多。一般来说，我保留 CGo 用于与现有库的接口，可能使用小的 C 包装函数可以减少我需要从 Go 进行的调用次数。

0 0

慕的地6264312

更新 James 的回答：当前实现中似乎没有线程切换。在 golang-nuts 上看到这个线程：总会有一些开销。它比简单的函数调用更昂贵，但比上下文切换要便宜得多（agl 记得较早的实现； 我们在公开发布之前切断了线程切换）。现在的费用基本上只是需要做一个完整的寄存器集切换（没有内核参与）。我猜这相当于十个函数调用。另请参阅此链接“cgo is not Go”博客文章的答案。C 对 Go 的调用约定或可增长的堆栈一无所知，因此对 C 代码的调用必须记录 goroutine 堆栈的所有细节，切换到 C 堆栈，并运行不知道它是如何被调用的 C 代码，或负责程序的更大的 Go 运行时。因此， cgo 有开销，因为它执行堆栈切换，而不是线程切换。调用C函数时保存和恢复所有寄存器，调用Go函数或汇编函数时不需要。除此之外，cgo 的调用约定禁止将 Go 指针直接传递给 C 代码，常见的解决方法是使用C.malloc，从而引入额外的分配。有关详细信息，请参阅此问题。

0 0

回首忆惘然

从 Go 调用 C 函数有一点开销。这是无法改变的。

0 0