CUDA kernelの引数で渡せるデータのサイズは sizeof(void*)*16
が上限で、それを超えるとエラー701(Launch exceeded resources)が発生します。
回避するためには、値渡しをしているものをメモリオブジェクト経由で渡すようにするか、そもそもメモリオブジェクトを17個以上使っている場合は、デバイスアドレスのポインタの構造体を用意し、その構造体をメモリオブジェクト経由で渡すと良いようです。
一方、OpenCLにはkernel引数のサイズに制約がないので使い易いです。 OpenCLのkernelで気を付けるべき点としては、kernel引数をfloat3* で受けると、cpuデバイスでは動くものが、gpuデバイスの場合おかしな挙動をするようになったりするので、避けた方が良さそうです。
posted by
genki
on Mon 22 Mar 2010
at 16:13