Google Cloud Pub/Sub 中消息重试与过期行为详解

在未启用死信主题时,pub/sub 的最大重试次数配置无效;若消息无法被确认,它将持续保留在订阅中直至被成功处理、手动删除或超出消息保留期限,期间“最老未确认消息年龄”将持续增长。

Google Cloud Pub/Sub 的消息生命周期管理依赖于三个关键配置:ACK 超时(Acknowledgement Deadline)最大重试次数(Max Delivery Attempts)死信主题(Dead Letter Topic)。但需特别注意:maxDeliveryAttempts 仅在同时配置了有效死信主题时才生效

在您的配置中:

  • ACK 超时设为 600 秒(10 分钟),表示订阅者必须在此时间内调用 ack(),否则 Pub/Sub 将视为处理失败并重新投递;
  • maxDeliveryAttempts = 10,但未启用死信主题 → 此设置实际不生效(API 不会报错,但后台忽略该参数);
  • 消息保留期(默认 7 天,可设为 1–7 天)仍正常生效。

✅ 正确行为解析:

  1. 消息不会因“达到 10 次重试”而被丢弃或删除:由于缺少死信主题,Pub/Sub 无法执行“转入死信”的动作,因此失败消息将无限循环重试(受限于保留期)——即:只要消息未被 ACK,且仍在保留期内,它将持续出现在拉取队列中。
  2. “最老未确认消息年龄”(Oldest unacked message age)将持续增长:该指标从消息首次发布开始计时(非首次投递时间),并在整个生命周期内单调递增。即使经历多次重试,只要未 ACK,其年龄就持续累加,直至超期自动删除或被成功处理。

⚠️ 关键注意事项:

  • 若误配 maxDeliveryAttempts 而未配死信主题,会导致隐形重试风暴:消息反复投递,可能引发重复处理、资源耗尽或下游积压。
  • 死信主题必须满足两个前提:
    ✅ 主

    题已存在且启用;
    ✅ 订阅服务账号对死信主题具有 pubsub.topics.publish 权限。
  • 验证配置是否生效的命令示例(gcloud):
    gcloud pubsub subscriptions describe YOUR_SUBSCRIPTION_NAME \
        --format="table(name,deadLetterPolicy.deadLetterTopic,maxDeliveryAttempts)"

    若 deadLetterPolicy.deadLetterTopic 为空,则 maxDeliveryAttempts 始终被忽略。

✅ 推荐实践:

  • 始终成对配置:启用死信主题 + 设置 maxDeliveryAttempts(建议 5–10),确保不可恢复错误的消息有明确归宿;
  • 监控核心指标:重点关注 subscription/oldest_unacked_message_age(告警阈值建议 ≤ 80% ACK 超时)和 subscription/pull_request_count 异常突增;
  • 订阅端健壮性设计:在消费者逻辑中实现幂等处理,并确保 ACK 调用不被异常吞没(例如在 try-finally 中显式 ACK)。

简言之:没有死信主题,就没有真正的“最大重试”;消息的生命终点只由 ACK 或保留期决定,而非重试计数。