C++如何实现一个简单的HTTP客户端?(Socket编程)

C++ HTTP客户端通过socket+connect建立TCP连接,用getaddrinfo解析域名,发送标准HTTP/1.1 GET请求(含Host头和双CRLF),recv循环接收并解析响应头与正文。

用C++写一个简单的HTTP客户端,核心是通过TCP Socket连接服务器、发送HTTP请求、接收响应。不需要第三方库,纯系统调用即可实现,但要注意协议细节和错误处理。

建立TCP连接(socket + connect)

HTTP/1.1 默认走 TCP,端口通常是 80(HTTP)或 443(HTTPS,需TLS,此处不涉及)。先创建 socket,再解析域名得到IP,最后 connect。

  • getaddrinfo() 解析域名(比过时的 gethostbyname() 更可靠,支持 IPv4/IPv6)
  • 遍历 addrinfo 链表,对每个地址尝试 socket() 和 connect(),直到成功
  • 连接超时建议设为 5–10 秒,可用 setsockopt() 配置 SO_RCVTIMEO / SO_SNDTIMEO

构造并发送HTTP GET请求

请求要符合 HTTP/1.1 格式:请求行 + 请求头 + 空行。Host 头必须有,否则服务器可能拒绝。

  • 示例请求:GET / HTTP/1.1\r\nHost: example.com\r\nConnection: close\r\n\r\n
  • 注意结尾是 \r\n\r\n(两个CRLF),不能少,也不能多
  • 用 send() 发送,检查返回值是否等于预期字节数,否则需重试或报错

接收并解析HTTP响应

响应分状态行、响应头、空行、响应体。简单客户端可只读到第一个 \r\n\r\n 后停止读头,再按 Content-Length 或 chunked 编码处理正文。

  • 用 recv() 循环读取,每次存入缓冲区,搜索 "\r\n\r\n" 分隔头/体
  • 若响应头含 Content-Length: N,则后续只读 N 字节;若含 Transfer-Encoding: chunked,需额外解析分块格式(简单场景可暂不支持)
  • 遇到连接关闭(recv 返回 0)或错误时及时退出

基础代码结构示意(关键片段)

不贴完整代码,但给出主干逻辑:

  • struct addrinfo *result; getaddrinfo("example.com", "80", &hints, &result);
  • for (p = result; p != NULL; p = p->ai_next) { sockfd = socket(...); if (connect(...) == 0) break; }
  • send(sockfd, "GET / HTTP/1.1\r\nHost: example.com\r\nConnection: close\r\n\r\n", ..., 0);
  • while ((n = recv(sockfd, buf, sizeof(buf)-1, 0)) > 0) { buf[n] = '\0'; /* 解析 */ }

基本上就这些。真正健壮的客户端还要加错误码检查、重定向处理、keep-alive 支持等,但作为入门,连通+收响应已足够验证流程。