4Manuals

  • PDF Cloud HOME

CUDA函数不执行内核,而其他函数执行 Download

    获取Hough线的交点OpenCV C ++ 如何将字符串“ text1”设置为包含项目text1,text2,test3的组合框的选定项目? 为什么System.Net.Mail.MailAddress构造函数在域部分中解析带有斜杠“ /”的电子邮件? Android 10,API29:在应用程序文件夹中使用C ++库编写文件会使应用程序崩溃 Unity-LineRenderer没有出现在版本(2D)上 按下按钮后,电话中未显示通知 ASP.net,使用WebConfig httpErrors重定向到区域内的控制器不起作用 获取会议室详细信息 我们如何将参数Line转换为Station? 网络核心:查找实体框架核心的主键和反射

我的代码Mmult和MmultV中有两个函数,它们都试图调用kernel。尽管MmultV成功调用并打印了所需的值,但Mmult却没有,并且没有打印任何内容。两种功能之间的主要区别是块的大小; (m, n)和(m, 1)。
问题出在哪里?

void Mmult(double* A, double* B)
{
    int m, n;
    double* d_A, * d_B;
    m = 3;
    n = 2;
    cudaMalloc(&d_A, 6 * sizeof(double));
    cudaMemcpy(d_A, A, 6 * sizeof(double), cudaMemcpyHostToDevice);
    cudaMalloc(&d_B, 6 * sizeof(double));
    cudaMemcpy(d_B, B, 6 * sizeof(double), cudaMemcpyHostToDevice);
    dim3 Block(m, n);
    kernel<<<1, Block>>>(d_A, d_B);
    cudaDeviceSynchronize();
    cudaFree(d_A);
    cudaFree(d_B);
}

void MmultV(double* A, double* B)
{
    int m;
    double* d_A, * d_B;
    m = 3;
    size = 6 * sizeof(double);
    cudaMalloc(&d_A, 6 * sizeof(double));
    cudaMemcpy(d_A, A, 6 * sizeof(double), cudaMemcpyHostToDevice);
    cudaMalloc(&d_B, 3 * sizeof(double));
    cudaMemcpy(d_B, B, 3 * sizeof(double), cudaMemcpyHostToDevice);
    dim3 Block(m, 1);
    kernel<<<1, Block>>>(d_A, d_B);
    cudaDeviceSynchronize();
    cudaFree(d_A);
    cudaFree(d_B);
}

__global__ void kernel(double* A, double* B)
{
    int r, c;
    r = threadIdx.x;
    c = threadIdx.y;
    printf("%i\n",r);
    printf("%i\n",c);
}

0 个答案:

没有答案



Similar searches
    我可以使用什么命令在.NET Core中删除项目? Docker,烧瓶,neo4j,graphql 一个EC2实例(AWS)下的多个WordPress Multisite 如何从“`QString“`转换为“`QString&“` 测试反应组件,模拟道具