#include "thread_index.h" #ifdef __INTELLISENSE__ #define CU_INVOKE(__func__) __func__ #define CU_INVOKE1(__func__, __grdSize__, __blkSize__) __func__ #else #define CU_INVOKE(__func__) __func__<<>> #define CU_INVOKE1(__func__, __grdSize__, __blkSize__) __func__<<<__grdSize__, __blkSize__>>> #endif inline uint ceilDiv(uint a, uint b) { return (uint)ceil(a / (float)b); }