如何在 Go 中实时监控并捕获 Python 子进程的输出

本文讲解如何解决 go 程序调用 python 脚本时因标准输出缓冲导致无法实时读取行数据的问题,重点介绍 python 端显式刷新缓冲区、go 端正确启动与扫描管道流的方法,并提供可直接运行的修复后代码。

在 Go 中通过 exec.Command 启动外部命令(如 Python 脚本)并实时读取其 stdout 是常见需求,但常因输出缓冲机制失败——尤其当 Python 进程运行在非交互模式(如被 Go 子进程调用)时,默认启用行缓冲或全缓冲,导致 print() 输出暂存于内存,bufio.Scanner 无法及时获取新行。

✅ 根本原因:Python 输出未刷新

Python 脚本 t.py 中的 print("%d" % i) 在子进程环境中不会自动刷新 stdout,除非:

  • 运行在终端(TTY)且满足行缓冲条件;
  • 显式调用 sys.stdout.flush();
  • 使用 -u 参数强制无缓冲(python -u t.py);
  • 设置环境变量 PYTHONUNBUFFERED=1。

最轻量、可控的修复方式是在每次 print 后手动刷新:

# t.py(修复版)
import time
import sys

i = 0
while True:
    print(i)
    sys.stdout.flush()  # ✅ 关键:强制刷新缓冲区
    time.sleep(1)
    i += 1

✅ Go 端需注意的关键点

原 test.go 存在两个隐患:

  1. 文件重复覆盖:每次循环都调用 os.Create("./temp.txt"),会清空之前内容;
  2. 缺少错误处理与进程等待:未检查 scanner.Err(),也未调用 cmd.Wait(),可能导致僵尸进程或漏读末尾输出。

以下是健壮、生产可用的 Go 实现:

// test.go(修复版)
package main

import (
    "bufio"
    "fmt"
    "os"
    "os/exec"
)

func main() {
    cmd := exec.Command("python", "t.py")

    stdout, err := cmd.StdoutPipe()
    if err != nil {
        fmt.Fprintf(os.Stderr, "无法创建 stdout 管道: %v\n", err)
        return
    }

    if err := cmd.Start(); err != nil {
        fmt.Fprintf(os.Stderr, "启动命令失败: %v\n", err)
        return
    }
    defer cmd.Wait() // 确保进程退出后清理

    f, err := os.OpenFile("./temp.txt", os.O_CREATE|os.O_WRONLY|os.O_APPEND, 0644)
    if err != nil {
        fmt.Fprintf(os.Stderr, "打开日志文件失败: %v\n", err)
        return
    }
    defer f.Close()

    scanner := bufio.NewScanner(stdout)
    for scanner.Scan() {
        line := scanner.Text()
        if _, writeErr := fmt.Fprintf(f, "then %s\n", line); writeErr != nil {
            fmt.Fprintf(os.Stderr, "写入文件失败: %v\n", writeErr)
            break
        }
        if flushErr := f.Sync(); flushErr != nil { // 可选:确保立即落盘
            fmt.Fprintf(os.Stderr, "同步文件失败: %v\n", flushErr)
        }
    }

    if err := scanner.Err(); err != nil {
        fmt.Fprintf(os.Stderr, "读取 stdout 出错: %v\n", err)
    }
}

? 额外建议(提升可靠性)

  • 超时控制:对长时间运行的子进程添加 cmd.Wait() 超时(如配合 context.WithTimeout);
  • stderr 重定向:若需捕获错误日志,可同时调用 cmd.StderrPipe();
  • 替代方案:如需更高性能或复杂交互,可考虑使用 os.Pipe() 自定义管道,或改用 golang.org/x/sys/unix 直接调用 fork/exec(仅限 Unix)。

✅ 总结:实时捕获子进程输出 = Python 主动刷新 + Go 正确启停 + 文件追加写入。忽略任一环节都可能导致数据丢失或程序阻塞。