如何正确捕获子进程输出？从 Node.js到C工具的实践总结在开发过程中，我们经常需要通过子进程调用外部工具，并捕获其输

前言

在开发过程中，我们经常需要通过子进程调用外部工具，并捕获其输出进行处理。然而，实际操作中可能会遇到一些问题，比如子进程没有输出，或者输出无法被捕获。本文将结合一个实际案例，详细分析问题的原因，并提供解决方案。

问题背景

我们有一个用 C 编写的工具 input-activity-monitor.exe，用于监听键盘和鼠标事件，并持续输出时间戳。我们希望通过 Node.js 的 child_process.spawn 调用该工具，并捕获其输出。

在实现过程中，我们发现：

使用 stdio: 'inherit' 时，工具的输出可以直接显示在控制台。
使用 stdio: ['ignore', 'pipe', 'pipe'] 时，无法捕获到工具的输出。

问题分析

通过分析，我们发现问题的核心在于工具的输出方式：

1. 标准输出流（stdout）与控制台缓冲区

如果工具直接使用 Windows 的低级 API（如 WriteConsole）写入控制台缓冲区，而不是通过标准输出流（stdout），那么管道（pipe）无法捕获这些输出。
使用 stdio: 'inherit' 时，子进程的输出直接绑定到主进程的控制台，因此可以显示输出。

2. 输出缓冲问题

C 程序的标准输出流默认是缓冲的。如果没有刷新缓冲区（fflush(stdout)），输出可能会被延迟，甚至无法被捕获。

3. Node.js 的管道机制：

使用 pipe 时，Node.js 需要显式监听 stdout 和 stderr 事件来捕获输出。如果工具没有正确使用标准输出流，管道就无法捕获。

解决方案

1. 修改 C 工具的实现

为了确保工具的输出可以被管道捕获，我们需要修改工具的代码，确保其输出通过标准输出流（stdout）传递，并及时刷新缓冲区。

以下是修改后的 C 代码示例：

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <windows.h>

// 模拟键盘和鼠标事件的检测
void simulateInputActivity() {
    while (1) {
        // 获取当前时间戳
        time_t now = time(NULL);
        if (now == -1) {
            fprintf(stderr, "无法获取当前时间\n");
            exit(EXIT_FAILURE);
        }

        // 输出时间戳到标准输出
        printf("%ld\n", now);
        fflush(stdout); // 确保立即刷新输出缓冲区

        // 模拟延迟
        Sleep(1000); // 每秒输出一次
    }
}

int main() {
    printf("工具已启动，开始监听键盘和鼠标事件...\n");
    fflush(stdout); // 确保立即刷新输出缓冲区

    simulateInputActivity();

    return 0;
}

关键点：

使用 printf 输出数据到标准输出流。
在每次输出后调用 fflush(stdout)，确保缓冲区中的数据立即被刷新。

2. Node.js 捕获输出

在 Node.js 中，我们可以通过 child_process.spawn 调用工具，并使用 pipe 捕获其输出：

const { spawn } = require('child_process');
const path = require('path');

// 工具路径
const toolPath = 'F:\\xxx\\xxx\\xx-tools\\win\\x86_64\\input-activity-monitor.exe';

// 启动子进程
const child = spawn(toolPath, [], {
  stdio: ['ignore', 'pipe', 'pipe'], // 捕获 stdout 和 stderr
  cwd: path.dirname(toolPath), // 设置工作目录
  shell: true, // 在 shell 中执行命令
});

// 设置编码
child.stdout.setEncoding('utf8');

// 捕获 stdout 数据并显示
child.stdout.on('data', (data) => {
  console.log('stdout:', data); // 显示到控制台
});

// 捕获 stderr 数据并显示
child.stderr.on('data', (data) => {
  console.error('stderr:', data); // 显示到控制台
});

// 捕获错误
child.on('error', (error) => {
  console.error('子进程启动失败:', error);
});

// 捕获退出事件
child.on('exit', (code) => {
  console.log('子进程已退出，退出码:', code);
});

总结

通过这次实践，我们总结了以下经验：

标准输出流的重要性：工具的输出应通过标准输出流（stdout）或标准错误流（stderr）传递，而不是直接写入控制台缓冲区。
及时刷新缓冲区：在 C 程序中，使用 fflush(stdout) 确保输出立即生效，避免缓冲区延迟。
Node.js 的管道机制：使用 pipe 捕获子进程输出时，需要正确监听 stdout 和 stderr 事件。
stdio: 'inherit' 的作用：如果工具的输出无法通过管道捕获，可以使用 stdio: 'inherit' 将子进程的输出直接绑定到主进程的控制台。

希望这篇文章能帮助你更好地理解子进程输出的捕获机制。如果你在开发中遇到类似问题，不妨参考本文的解决方案！

🔥 关注我的公众号「哈希茶馆」一起交流更多开发技巧