在 Numba 中，如何在面向 CUDA 时将数组复制到常量内存中？

您不会使用作为输入提供给内核的数组复制到常量数组。该类型的输入数组已在设备中，设备代码无法写入常量内存。常量内存只能从主机代码写入，并且常量语法期望数组是主机数组。这是一个例子：$ cat t32.pyimport numpy as npfrom numba import cuda, types, int32, int64a = np.ones(3,dtype=np.int32)@cuda.jitdef generate_mutants(b):    c_a = cuda.const.array_like(a)    b[0] = c_a[0]if __name__ == "__main__":    b = np.zeros(3,dtype=np.int32)    generate_mutants[1, 1](b)    print(b)$ python t32.py[1 0 0]$请注意，与 CUDA C/C++ 相比，Numba CUDA 中常量内存的实现有一些行为差异，这个问题突出了其中的一些差异。

在 Numba 中，如何在面向 CUDA 时将数组复制到常量内存中？

1回答