如何在 Go 中实时监控并捕获 Python 子进程的持续输出

本文讲解如何在 go 程序中正确启动并实时读取长期运行的 python 脚本(如每秒打印一个数字)的标准输出,重点解决因 python 输出缓冲导致 go 无法及时获取数据的问题,并提供健壮、可落地的实现方案。

在 Go 中通过 os/exec 启动外部命令(如 Python 脚本)并实时读取其 stdout 是常见需求,但实践中常因输出缓冲机制失败——尤其当子进程使用行缓冲或全缓冲模式时,Go 的 bufio.Scanner 会一直阻塞,直到缓冲区满或进程退出,导致“看似无输出”。

以问题中的 t.py 为例:默认情况下,Python 在非交互式(如被子进程调用)环境中启用行缓冲(line buffering),但仅当输出以换行符结尾且 stdout 连接到终端时才自动刷新;而通过管道(pipe)连接时,Python 往往退化为全缓冲(full buffering),print() 不会立即写入管道,造成 Go 端 scanner 长时间等待。

✅ 正确做法是在 Python 端显式刷新标准输出:

# t.py(修正版)
import time
import sys

i = 0
while True:
    print(i)
    sys.stdout.flush()  # 关键:强制刷新缓冲区
    time.sleep(1)
    i += 1

⚠️ 注意:print(..., flush=True)(Python 3.3+)是更简洁的等效写法:

print(i, flush=True)

与此同时,Go 端代码也需优化:原示例中每次循环都 os.Create("./temp.txt") 会覆盖文件,且未检查错误、未等待进程结束、未关闭文件句柄,存在严重缺陷。以下是生产就绪的改进版本:

package main

import (
    "bufio"
    "fmt"
    "os"
    "os/exec"
    "time"
)

func main() {
    cmd := exec.Command("python", "t.py")
    stdout, err := cmd.StdoutPipe()
    if err != nil {
        fmt.Fprintf(os.Stderr, "failed to get stdout pipe: %v\n", err)
        return
    }

    // 使用追加模式打开文件,避免覆盖
    f, err := os.OpenFile("./temp.txt", os.O_CREATE|os.O_WRONLY|os.O_APPEND, 0644)
    if err != nil {
        fmt.Fprintf(os.Stderr, "failed to open file: %v\n", err)
        return
    }
    defer f.Close()

    scanner := bufio.NewScanner(stdout)
    if err := cmd.Start(); err != nil {
        fmt.Fprintf(os.Stderr, "failed to start command: %v\n", err)
        return
    }
    defer cmd.Wait() // 确保进程结束后再退出

    // 实时读取并写入
    for scanner.Scan() {
        line := scanner.Text()
        _, _ = fmt.Fprintf(f, "[%.2f] %s\n", time.Now().Sub(time.Unix(0, 0)).Seconds(), line)
        // 建议:添加 f.Sync() 确保落盘(尤其对日志关键场景)
        _ = f.Sync()
    }

    if err := scanner.Err(); err != nil {
        fmt.Fprintf(os.Stderr, "scanner error: %v\n", err)
    }
}

? 关键要点总结:

  • Python 端必须显式刷新:sys.stdout.flush() 或 print(..., flush=True),这是解决“无输出”问题的根本;
  • Go 端应使用 os.OpenFile 追加写入,而非反复 Create 覆盖;
  • 务必调用 cmd.Wait(),否则子进程可能成为僵尸进程;
  • 错误处理不可省略:所有 I/O 操作均需检查 err;
  • 如需强一致性,可在写入后调用 f.Sync() 强制刷盘;
  • 若需超时控制或信号中断,可结合 context.WithTimeout 和 cmd.Process.Kill() 实现。

通过以上组合调整,即可稳定、低延迟地将 Python 流式输出持久化到文件,适用于日志采集、状态监控、自动化运维等真实场景。