数组可以明显慢于MATLAB中的显式循环。为什么？

考虑以下简单的速度测试arrayfun:

T = 4000;N = 500;x = randn(T, N);Func1 = @(a) (3*a^2 + 2*a - 1);ticSoln1 = ones(T, N);for t = 1:T
    for n = 1:N
        Soln1(t, n) = Func1(x(t, n));
    endendtocticSoln2 = arrayfun(Func1, x);toc

在我的机器上(LinuxMint 12上的Matlab2011B)，这个测试的输出是：

Elapsed time is 1.020689 seconds.Elapsed time is 9.248388 seconds.

什么？！？arrayfun虽然无可否认，这是一个更干净的解决方案，但速度却慢了好几个数量级。这里发生什么事情？

此外，我还做了类似的测试cellfun发现它比一个显式循环慢了大约3倍。同样，这个结果与我所期望的相反。

我的问题是：为什么arrayfun和cellfun这么慢？考虑到这一点，是否有充分的理由使用它们(除了使代码看起来很好)？

注：我说的是标准版本的arrayfun这里，不是来自并行处理工具箱的GPU版本。

编辑：我只想说清楚，我知道Func1如Oli所指出的，可以将上面的内容矢量化。我之所以选择它，只是因为为了实际问题的目的，它产生了一个简单的速度测试。

编辑：按照格伦盖塔的建议，我重新做了测试feature accel off..结果如下：

Elapsed time is 28.183422 seconds.Elapsed time is 23.525251 seconds.

换句话说，很大一部分区别在于JIT加速器在加速显式方面做得更好。for循环arrayfun..这对我来说很奇怪，因为arrayfun实际上提供了更多的信息，即它的使用揭示了调用的顺序Func1没关系。另外，我注意到无论JIT加速器是打开还是关闭，我的系统都只使用一个CPU.

慕侠2389804

浏览 790回答 2

2回答

慕娘9325324

因为！x = randn(T, N);不是gpuarray类型；你要做的就是x = randn(T, N,'gpuArray');

0 0

随时随地看视频慕课网APP