cudaEventQuery(start); 是干嘛的

找到了第 1 篇资料：MindSpore:CUDA编程（五）Event - Skytier - 博客园

找到了第 2 篇资料：cuda编程学习——GPU加速/时间计时Clock 干货向（五） - 知乎

找到了第 3 篇资料：CUDA 的 Stream and Event - 知乎

找到了第 4 篇资料：CUDA编程-05：流和事件 - 知乎

找到了第 5 篇资料：CUDA stream 与 CUDA event 详解 - CSDN博客

一共找到 5 篇资料，正在阅读...

找到了 5 篇资料作为参考：

cudaEventQuery(start) 是CUDA API中的一个函数，它用于查询一个CUDA事件（cudaEvent_t类型）是否已经完成。这个函数是非阻塞的，意味着它不会等待事件完成，而是立即返回当前事件的状态。

函数的返回值可以是以下几种情况之一：

cudaSuccess：如果事件已经完成，函数返回这个值。
cudaErrorNotReady：如果事件尚未完成，函数返回这个值，表示事件还没有被记录或者还没有执行到记录事件的点。
其他错误代码：如果发生其他错误，函数会返回相应的错误代码。

这个函数通常用于检查事件是否已经完成，以便在进行后续操作之前确保所需的操作已经执行。例如，你可以在等待某个内核执行完成后，使用cudaEventQuery来检查是否需要继续执行其他依赖于该内核结果的操作。

使用cudaEventQuery的一个典型场景是在多流（multi-stream）编程中，你可能需要等待一个特定的流中的操作完成，然后再在另一个流中执行后续操作。通过查询事件，你可以在不阻塞主线程的情况下，灵活地控制程序的流程。

下面是一个简单的例子，展示了如何使用cudaEventQuery：

cudaEvent_t start, stop;
float elapsedTime;

// 创建事件
cudaEventCreate(&start);
cudaEventCreate(&stop);

// 记录开始事件
cudaEventRecord(start, 0); // 0表示默认流

// 执行CUDA操作（如内核启动）

// 记录结束事件
cudaEventRecord(stop, 0);

// 查询事件是否完成
cudaError_t status = cudaEventQuery(stop);
if (status == cudaSuccess) {
    // 如果事件已完成，计算时间差
    cudaEventElapsedTime(&elapsedTime, start, stop);
    printf("Elapsed time: %f ms\n", elapsedTime);
} else if (status == cudaErrorNotReady) {
    // 如果事件尚未完成，可以选择等待或进行其他操作
    printf("Event is not ready yet.\n");
} else {
    // 处理其他错误情况
    printf("Error querying event: %d\n", status);
}

在这个例子中，我们首先创建了两个事件，然后记录了开始和结束事件。之后，我们使用cudaEventQuery来检查结束事件是否已经完成。如果事件已完成，我们计算两个事件之间的时间差；如果事件尚未完成，我们可以选择等待或进行其他操作。