str.strip() 只去除两端空白 vs str.lstrip()/rstrip() 的边界行为差异

str.strip()仅移除字符串首尾连续空白字符,不处理中间空格;

lstrip()/rstrip()同理,且按字符集合而非顺序或前缀匹配;误用如lstrip("https://")会导致意外删字符。

str.strip() 不会动中间的空格,只管开头和结尾

很多人误以为 strip() 会“清理所有空白”,其实它只作用于字符串首尾连续的空白字符(包括空格、\t\n\r\f\v),中间哪怕全是空格也原封不动。

比如:" a b c ".strip() 结果是 "a b c" —— 开头两个空格和结尾两个空格没了,但中间的两个空格还在。

  • 如果想删掉所有空白,得用 .replace(" ", "") 或正则 re.sub(r"\s+", "", s)
  • strip() 是惰性的:遇到第一个非目标字符就停,不会继续往里扫
  • 传入参数时(如 s.strip("x")),也是只处理两端连续出现的 "x",不是全局替换

str.lstrip() 和 str.rstrip() 的“单边性”容易被当成万能裁剪工具

lstrip() 只动左边,rstrip() 只动右边,这点看似简单,但实际出问题常是因为没意识到它们的“字符集合”逻辑:

例如:"...xxx...".lstrip(".") "xxx...";但 "..x.x..".lstrip(".") "x.x..",因为 lstrip() 一旦碰到非 "." 字符(这里是 "x")就立刻停止,后面哪怕还有 "." 也不再处理。

  • 它们不是按“前缀/后缀”匹配,而是按“字符集合”逐个吃掉左侧/右侧属于该集合的字符
  • "123abc456".lstrip("123")"abc456",但 "321abc456".lstrip("123") 同样 → "abc456"(顺序无关)
  • 如果误传了字符串如 s.lstrip("https://") ,它会把每个字符 'h','t','t','p',':'... 都当独立可删字符,可能导致意外删掉域名里的 "t""p"

常见误用场景:URL 清洗、缩进处理、数字前导零

这些场景下,边界函数行为和预期偏差最大:

  • 去 URL 协议头?别用 .lstrip("http://") —— 改用 .removeprefix("http://")(Python 3.9+)或 url.removeprefix("https://").removeprefix("http://")
  • 处理多行文本缩进?text.rstrip("\n") 只删末尾换行,但 text.rstrip() 会把末尾所有空白(包括空格、制表符)全干掉,可能破坏对齐
  • 删数字前导零?"00123".lstrip("0")"123" 没问题,但 "000".lstrip("0")"",需额外判断空字符串

性能与兼容性:strip 类方法在长字符串上很轻量,但别滥用

它们都是 C 实现,O(n) 时间复杂度,且只遍历一次首尾,不建新字符串直到真需要。但要注意:

  • 反复链式调用如 s.strip().lstrip("x").rstrip("y") 会创建多个中间字符串,不如一次性用正则或手动切片
  • 在 Python 2 中 unicode 对象也支持,但传入 Unicode 字符串时,某些控制字符(如 \u2028 行分隔符)可能不被默认空白集识别
  • Windows 换行 \r\n:所有 strip 方法都认 \r\n,所以 "\r\nhello\r\n".strip() 正确返回 "hello"

真正容易被忽略的是:这些方法对空字符串、None、不可变对象类型检查很严格,传错类型直接抛 AttributeError,而不是静默失败。