javascript正则表达式是什么_如何用正则匹配和替换文本【教程】

JavaScript正则表达式是RegExp对象与字符串方法协同工作的机制,非语法糖;字面量适合静态模式,new RegExp()适合动态拼接;match()返回数组或null,exec()可迭代且记录lastIndex;replace()中$符号有特殊含义,需注意转义。

JavaScript 正则表达式不是“特殊语法糖”,而是内置的 RegExp 对象和字符串方法协同工作的机制——它本身不执行匹配,真正干活的是 String.prototype.match()String.prototype.replace() 这些方法。

正则字面量 vs new RegExp():选哪个?

两者功能等价,但行为细节不同:

  • 字面量写法 /\d+/g 更简洁,适合静态模式;斜杠间的内容不经过字符串转义,所以写 /\\d/ 才能表示一个反斜杠加 d
  • new RegExp('\\d+', 'g') 适合动态拼接(比如从用户输入构造),但注意:传入的字符串参数会先被 JS 解析一次,再交给正则引擎,因此反斜杠必须双写 —— 想匹配数字要写 '\\d',而不是 '\d'
  • 若正则中含变量,又想用字面量,只能靠 eval()(不推荐)或改用 new RegExp()

match() 和 exec() 的关键区别

match() 是字符串方法,exec() 是正则对象方法,返回结构看似相似,但行为差异影响逻辑健壮性:

  • 全局标志 g 下,str.match(/a/g) 返回所有匹配项数组(无匹配时返回

    null);而 /a/g.exec(str) 只返回第一个匹配 + indexinput 等属性,且会记住上次位置(lastIndex),多次调用可迭代
  • 非全局时,match() 返回带 indexgroups 的数组;exec() 行为一致,但更可控——尤其做循环提取命名捕获组时,exec() 配合 while 更安全
  • 误用 match() 在非全局模式下取 [1] 捕获组,容易因返回 nullCannot read property '1' of null

replace() 中的替换字符串陷阱

replace() 第二个参数可以是字符串或函数,但字符串里的特殊符号会被解释,不是字面意思:

  • '$&' 表示整个匹配内容,'$1' 表示第一个捕获组 —— 如果你真想插入字面量 $1,得写成 '$$1'
  • 使用函数作为替换参数时,函数第一个参数是完整匹配,后续是各捕获组,最后两个是匹配索引和原字符串;此时不用操心 $ 转义,也便于做条件替换(比如把负数括号包起来)
  • 只传字符串且含 $ 符号却没对应捕获组?该 $ 序列会被静默丢弃 —— 比如 replace(/(\w+)/, '$2 $1') 中的 $2 不存在,结果只剩空格加 $1 对应内容

真正难的不是写出能跑的正则,而是预判边界情况:换行符是否在 . 范围内(需要 s 标志)、Unicode 字符是否被 \w 匹配(默认不包含)、贪婪匹配导致过度回溯拖慢性能……这些不在语法表面,却决定正则在真实数据里能不能稳住。