我的内存块可能很大(大于L2缓存),有时我必须将它们设置为全零。memset的串行代码很好,但是并行代码呢?如果有人从并发线程中调用memset确实可以加快大型数组的运行速度,是否有人经验?甚至使用简单的openmp并行for循环?
达令说
相关分类