JavaScript中常用的正则表达式整理-白红宇

JavaScript中常用的正则表达式整理

阅读量：337 次

发布时间：2019-03-04

本文共 10904 字，大约阅读时间需要 36 分钟。

JavaScript中常用的正则表达式整理

匹配中文字符的正则表达式： [u4e00-u9fa5]

匹配双字节字符(包括汉字在内)：[^x00-xff]

匹配空白行的正则表达式：ns*r

匹配HTML标记的正则表达式：< (S*?)[^>]*>.*?|< .*? />

匹配首尾空白字符的正则表达式：^s*|s*$

匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

匹配网址URL的正则表达式：[a-zA-z]+://[^s]*

匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$

匹配国内电话号码：d{3}-d{8}|d{4}-d{7} //匹配形式如 0511-4405222 或 021-87888822

匹配腾讯QQ号：[1-9][0-9]{4,} //腾讯QQ号从10000开始

匹配中国邮政编码：[1-9]d{5}(?!d) // 中国邮政编码为6位数字

匹配身份证：d{15}|d{18} // 评注：中国的身份证为15位或18位

匹配ip地址：d+.d+.d+.d+

匹配特定数字：

^[1-9]d*$　　 //匹配正整数

^-[1-9]d*$ 　 //匹配负整数

^-?[1-9]d*$　　 //匹配整数

^[1-9]d*|0$　 //匹配非负整数（正整数 + 0）

^-[1-9]d*|0$　　 //匹配非正整数（负整数 + 0）

^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮点数

^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配负浮点数

^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　 //匹配浮点数

^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　　 //匹配非负浮点数（正浮点数 + 0）

^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　　//匹配非正浮点数（负浮点数 + 0）

匹配特定字符串：

^[A-Za-z]+$　　//匹配由26个英文字母组成的字符串^[A-Z]+$　　//匹配由26个英文字母的大写组成的字符串^[a-z]+$　　//匹配由26个英文字母的小写组成的字符串^[A-Za-z0-9]+$　　//匹配由数字和26个英文字母组成的字符串^w+$　　//匹配由数字、26个英文字母或者下划线组成的字符串

在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:

只能输入数字：^[0-9]*$

只能输入n位的数字：^d{n}$

只能输入至少n位数字：^d{n,}$

只能输入m-n位的数字：^d{m,n}$

只能输入零和非零开头的数字：^(0|[1-9][0-9]*)$

只能输入有两位小数的正实数：^[0-9]+(.[0-9]{2})?$

只能输入有1-3位小数的正实数：^[0-9]+(.[0-9]{1,3})?$

只能输入非零的正整数：^+?[1-9][0-9]*$

只能输入非零的负整数：^-[1-9][0-9]*$

只能输入长度为3的字符：^.{3}$

只能输入由26个英文字母组成的字符串：^[A-Za-z]+$

只能输入由26个大写英文字母组成的字符串：^[A-Z]+$

只能输入由26个小写英文字母组成的字符串：^[a-z]+$

只能输入由数字和26个英文字母组成的字符串：^[A-Za-z0-9]+$

只能输入由数字、26个英文字母或者下划线组成的字符串：^w+$

验证用户密码:^[a-zA-Z]w{5,17}$正确格式为：以字母开头，长度在6-18之间，

只能包含字符、数字和下划线。

验证是否含有^%&’,;=?

KaTeX parse error: Expected group after '^' at position 8: ”等字符：“[^̲%&',;=?

x22]+”

只能输入汉字：^[u4e00-u9fa5],{0,}$

验证Email地址：^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$

验证InternetURL：^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$

验证电话号码：^((d{3,4})|d{3,4}-)?d{7,8}$ // 正确格式为：“XXXX-XXXXXXX”，“XXXX-XXXXXXXX”，“XXX-XXXXXXX”，“XXX-XXXXXXXX”，“XXXXXXX”，“XXXXXXXX”。

验证身份证号（15位或18位数字）：^d{15}|d{}18$

验证一年的12个月：^(0?[1-9]|1[0-2])$ //正确格式为：“01”-“09”和“1”“12”

验证一个月的31天：^((0?[1-9])|((1|2)[0-9])|30|31)$ //正确格式为：“01”“09”和“1”“31”。

匹配中文字符的正则表达式： [u4e00-u9fa5]

匹配双字节字符(包括汉字在内)：[^x00-xff]

匹配空行的正则表达式：n[s| ]*r

匹配HTML标记的正则表达式：/< (.*)>.*|< (.*) />/

匹配首尾空格的正则表达式：(^s*)|(s*$)

匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

匹配网址URL的正则表达式：http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

(1)应用：计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

String.prototype.len=function(){return this.replace([^x00-xff]/g,”aa”).length;}

(2)应用：javascript中没有像vbscript那样的trim函数，我们就可以利用这个表达式来实现

String.prototype.trim = function() {	return this.replace(/(^s*)|(s*$)/g, “”);}

(3)应用：利用正则表达式分解和转换IP地址

function IP2V(ip) { //IP地址转换成对应数值	re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正则表达式	if(re.test(ip)) {		return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1	}	else {		throw new Error(”Not a valid IP address!”)	}}

(4)应用：从URL地址中提取文件名的javascript程序

s=”http://www.9499.net/page1.htm”;s=s.replace(/(.*/){0,}([^.]+).*/ig,”$2″) ; //Page1.htm

(5)应用：利用正则表达式限制网页表单里的文本框输入内容

用正则表达式限制只能输入中文：οnkeyup=”value=”/blog/value.replace(/["^u4E00-u9FA5]/g,”) ”

onbeforepaste=”clipboardData.setData('text',clipboardData.getData('text').replace(/[^u4E00-u9FA5]/g,”))”

用正则表达式限制只能输入全角字符： οnkeyup=”value=”/blog/value.replace(/["^uFF00-uFFFF]/g,”) ”

onbeforepaste=”clipboardData.setData(‘text’,clipboardData.getData(‘text’).replace(/[^uFF00-uFFFF]/g,”))”

用正则表达式限制只能输入数字：οnkeyup=”value=”/blog/value.replace(/["^d]/g,”) “onbeforepaste= “clipboardData.setData

(‘text’,clipboardData.getData(‘text’).replace(/[^d]/g,”))”

用正则表达式限制只能输入数字和英文：οnkeyup=”value=”/blog/value.replace(/[W]/g,””) “onbeforepaste=”clipboardData.setData

(‘text’,clipboardData.getData(‘text’).replace(/[^d]/g,”

中正则表达式，js去掉html标记，去掉字符，截取字符(2009-01-11 10:20:14)

2007-07-08 15:26

1，得到网页上的链接地址：

string matchString = @"<a[^{>]+href=\s*(?:’(?<href>[}’]+)’|""(?[^{""]+)""|(?<href>[}>\s]+))\s*[^>]*>";

2，得到网页的标题：

string matchString = @"(?<title>.*)";

3，去掉网页中的所有的html标记：

string temp = Regex.Replace(html, “<[^>]*>”, “”); //html是一个要去除html标记的文档

java 中去掉网页中的所有标签

str = str.replaceAll("<[^>]>", “”);
4, string matchString = @"([\S\s\t]?)";

5,js去掉所有html标记的函数：

function delHtmlTag(str) {	return str.replace(/<\/?.+?>/g,"");//去掉所有的html标记}

这个可能IE5会错，那用这个，梅花的：

function delHtmlTag(str) {	return str.replace(/<[^>]+>/g,"");//去掉所有的html标记}

校验登录名：只能输入5-20个以字母开头、可带数字、“_”、“.”的字串

function isRegisterUserName(s)  {  	var patrn=/^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$/;  	if (!patrn.exec(s)) 		return false	return true}

来源：正则匹配空格的问题

字符串内字符键有空格，但是空格的数量可能不一致，通过正则将空格的个数统一变为一个。

例如：蓝色理想

变成：蓝色理想

aobert的正则：

判断字符串是不是由数字组成

来源：有没有简单的方法判断字符串由数字组成？

这个正则比较简单，写了一个测试

电话号码正则

来源：想问一下关于电话号码的正则判断

：求一个验证电话号码的JS正则

/^\d{3,4}-\d{7,8}(-\d{3,4})?$/区号必填为3-4位的数字，区号之后用“-”与电话号码连接

^\d{3,4}-电话号码为7-8位的数字

\d{7,8}分机号码为3-4位的数字，非必填，但若填写则以“-”与电话号码相连接

(-\d{3,4})?手机号码正则表达式

正则验证手机号，忽略前面的0，支持130-139，150-159。忽略前面0之后判断它是11位的。

cloeft的正则：

/^0*(13|15)\d{9}$/ ^0*匹配掉开头任意数量的0。

由于手机号码是13任意数字9位，和15任意数字9位，所以可以用(13|15)\d{9}匹配。

测试代码如下：

function testReg(reg,str){ 	return reg.test(str); } var reg = /^0*(13|15)\d{9}$/; var str = '13889294444'; var str2 = '12889293333'; var str3 = '23445567'; document.write(testReg(reg,str)+'
'); document.write(testReg(reg,str2)+'
'); document.write(testReg(reg,str3)+'
');

使用正则表达式实现删除字符串中的空格：

代码以及测试代码如下：

测试的结果如下：

length:11

ltrim length:10

rtrim length:10

trim length:9 限制文本框只能输入数字和小数点等等

来源：文本框输入限制的问题？？？？

只能输入数字和小数点

var reg = /^\d*\.?\d{0,2}$/ 开头有若干个数字，中间有0个或者一个小数点，结尾有0到2个数字。

只能输入小写的英文字母和小数点，和冒号，正反斜杠(：./)

var reg = /[a-z./\:]+/; a-z包括了小写的英文字母，.是小数点，/和\分别是左右反斜线，最后是冒号。整个组成一个字符集和代码任一均可，最后在加上+，1或者多个。

替换小数点前内容为指定内容

来源：求一正则表达式！

请问怎么把这个字符串的小数点前面的字符替换为我自定义的字符串啊？

例如：infomarket.php?id=197 替换为 test.php?id=197

应该可以把第一个点“.”之前的所有单词字符替换为test就可以了。我写的正则如下：

只匹配中文的正则表达式

前两天看的《JavaScript开发王》里恰好有中文的unicode范围，正则如下：

/[\u4E00-\u9FA5\uf900-\ufa2d]/ 写了一个简单的测试，会把所有的中文替换成“哦”。

返回字符串的中文字符个数

来源：有没返回中文字符字节的函数！

先去掉非中文字符，再返回length属性。函数以及测试代码如下：

结果：

中文两个，数字三个，正确。

下面的测试也正确。

var str = “中文123tets@#!#%$#[][{}”;

document.write(str.length+’

’);

document.write(cLength(str));

正则表达式取得匹配IP地址前三段

来源：如何用正则取IP前3段

192.168.118.101，192.168.118.72, 192.168.118.1都替换成：192.168.118

只要匹配掉最后一段并且替换为空字符串就行了，正则如下：

/.\d{1,3}$/ 匹配结尾的.n,.nn或者.nnn。

测试代码如下：

function replaceReg(reg,str){ 	return str.replace(reg,'') }

var reg = /\.\d{1,3}$/; var str = '192.168.118.101'; var str2 = '192.168.118.72'; var str3 = '192.168.118.1'; document.write(replaceReg(reg,str)+'
'); document.write(replaceReg(reg,str2)+'
'); document.write(replaceReg(reg,str3)+'
');

相似的有，这个帖子里有一个验证IP地址的方法：求检验MAC地址的正则表达例子

匹配

与
- 之间的内容
  来源：请教个正则的小问题吧

safsf
- safsf
- safsf

用正则可以得到

起到下个
- 之间的内容。

正则如下：

[\s\S]+?
- /i 首先匹配两侧的ul标签，中间的[\s\S]+?可以匹配一个或者多个任意字符，一定要非贪婪，否则会匹配
  - safsf
    - safsf
    - 。

用正则表达式获得文件名

来源：C:\006.jpg

c:\images\tupian\006.jpg

可能是直接在盘符根目录下，也可能在好几层目录下，要求替换到只剩文件名。

xlez的正则如下：

/[^\/]*[\/]+/g 首先匹配非左右斜线字符0或多个，然后是左右斜线一个或者多个。形如“xxx/”或者“xxx\”或者“/”或者“\”

函数以及测试代码：

注意，\需要转义。

绝对路径变相对路径

来源：讨论一个正则

将转换为：。

其中网址可能改变，例如http://localhost等等。

cloudchen的正则：

/http://[^/]+/ 首先是http://，然后[^/]+找过1个或者多个非/字符，因为遇到第一个/表示已经到目录了，停止匹配。

测试代码如下：

用户名正则

用于用户名注册，，用户名只能用中文、英文、数字、下划线、4-16个字符。

hansir和解决方案弄成正则：

/^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/ 中文字符或者单词字符，4到16个。实现4到16结成到正则里的关键就是开始^和结束$，这就等于整个字符串只能有这些匹配的内容，不能有多余的。

函数和测试代码如下：

匹配英文地址

规则如下:

包含 “点”, “字母”,“空格”,“逗号”,“数字”，但开头和结尾不能是除字母外任何字符。

[.a-zA-Z\s,0-9]这个字符集就实现了字母，空格，逗号和数字。最终正则如下：

/^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/ 开头必须有字母，结束也必须是一个以上字母。测试代码如下：

正则匹配价格

价格的格式应该如下：

开头数字若干位，可能有一个小数点，小数点后面可以有两位数字。hansir给出的对应正则如下：

/^(\d*.\d{0,2}|\d+).*$/ hansir给出的测试代码如下：

无标题文档身份证号码的匹配来源：关于正则的,大家帮帮忙,急,在线等

身份证号码可以是15位或者是18位，其中最后一位可以是X。其它全是数字，正则如下：

/^(\d{14}|\d{17})(\d|[xX])$/ 开头是14位或者17位数字，结尾可以是数字或者是x或者是X。

测试代码如下：

要求文本有指定行数

匹配至少两行的字符串，每行都为非空字符。

只要匹配到[\n\r]就表示有换行了，再保证换行的两段都不是空字符就可以了。正则如下：

/\S+?[\n\r]\S+?/i 这个正则的应用应该是用在textarea里，如果是如下要求：可以支持所有字符，中间可带空格，可以包括英文、数字、中文、标点

这样的话，只要针对空格再改一下就行了。（按照非空的要求，上面有不能匹配“字符+空格+换行+字符”的字符串）。修改如下：

/\S+?\s*?[\n\r]\s*?\S+?/i 单词首字母大写

来源：求个正则，处理英文单词或词组的

每单词首字大写，其他小写。如blue idea转换为Blue Idea，BLUE IDEA也转换为Blue Idea

cloeft的正则：

/\b(\w)|\s(\w)/g 所谓“首字母”包括两种情况：第一种是边界(开头)的单词字符，一种是空格之后的新单词的第一个字母。测试代码如下：

正则验证日期格式

yyyy-mm-dd格式

正则如下：

/^\d{4}-\d{1,2}-\d{1,2}$/ 4位数字，横线，1或者2位数字，再横线，最后又是1或者2位数字。

测试代码如下：

第二种格式：来源：求一正则表达式

yyyy-mm-dd

或

yyyy/mm/dd

用“或”简单地修改一下就行了。

/^\d{4}(-|/)\d{1,2}(-|/)\d{1,2}$/ 去掉文件的后缀名

www.abc.com/dc/fda.asp变为www.abc.com/dc/fda

如果文件后缀已知的话这个问题就非常简单了，正则如下：

/.asp$/ 匹配最后的.asp而已，测试代码如下：

如果文件名未知的话就用这个正则：/.\w+$/，测试代码如下：

验证邮箱的正则表达式

fuchangxi的正则：

/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(.[a-zA-Z0-9_-])+/ 开始必须是一个或者多个单词字符或者是-，加上@，然后又是一个或者多个单词字符或者是-。然后是点“.”和单词字符和-的组合，可以有一个或者多个组合。

我不太了解邮箱的具体规则。感觉这个正则比较简单，EMAIL校验正则讨论求解里有比较详细的邮箱正则讨论。

匹配链接的文字

来源：求一正则?

代码：<a href="#>这里要保存，只保存链接的文本内容，标签信息删掉。

前面写过一个匹配链接的正则：

/<a\s(\s*\w*?=".+?")(\shref=".+?")(\s*\w*?=".+?")\s>[\s\S]?</a>/ 不过我们需要捕获的是文字内容，所以需要做一定的修改。第一步就是在所有的括号内都加上?:表示不捕获。第二步就是再多加一个括号放在[\s\S]?两侧，这样就可以捕获到链接的文字内容了。最后正则如下：

/<a\s(?:\s*\w*?\s*=\s*".+?")(?:\shref\s*=\s*".+?")(?:\s*\w*?\s*=\s*".+?")\s>([\s\S]*?)</a>/

测试代码如下：

正则判断是否为数字与字母的混合

来源：关于正则

不能小于12位，且必须为字母和数字的混合。

验证字符串包含数字简单，验证字符串包含字母也简单，验证字符串不包含其它字符也简单，可以用这三个正则分别检查一次字符串，逻辑运算出最终结果。

但是怎么能把这些功能写进一个正则表达式里呢？这个问题真有点伤脑筋。

下面是lexrus的正则：

/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig 思路非常的清晰啊：

[a-z]+(?=[0-9])

字母开头，后面必须紧跟着数字。

[0-9]+(?=[a-z]

数字开头，后面必须紧跟着字母。/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i

**`/<(script|head|%)[\s\S]*?\/\1>/ig` 用正则给文本分段****给属性添加双引号**给HTML标签中的属性添加双引号。改为：LeXRus的第一个正则如下：/(?!\<\w+)(\s+\w+)\=([^>\"\s]+)/ig 第一个括号没看明白，JS应该是不支持。所以我擅自给删掉了，剩下的正则如下：/(\s+\w+)\=([^>\"\s]+)/ig 第一个括号里的\s+\w+匹配的是属性名。然后是=，不用转义。第二个括号里的[^>\"\s]+匹配属性值。不匹配>”和空格。这里的引号不用转义。在意思不改变的情况下，稍微改了改，正则如下：/(\s+\w+)=([^>"\s]+)/ig 需要注意的是这个正则不匹配=两边有空格的属性，例如href = xxx。相匹配的话就改成：/(\s+\w+)\s*=\s*([^>"\s]+)/ig 代码：str=str.replace(/(?!\<\w+)(\s+\w+)\=([^>\"\s]+)/ig,'$1="$2"'); 其中'$1=”$2”'就实现了给属性值添加上双引号。不过ncs指出了这个正则替换的几个问题，一是上面的空格问题，二是如果非标签内部有等号，且前面又恰巧有空白字符的话，它将会被误识别为属性，例如： test=sd里面的test=sd也会被匹配。三是如果属性原来使用了单引号，会被再包上一层双引号……来看看LeXRus前辈的新正则替换方法：12str=str.replace(/(?!<\w+)(\s+\w+)\s*=\s*([^>\"\s]+)(?=[^>]*>)/ig,'$1="$2"').replace(/\"\'([^\'\"]+)\'\"/ig,'\"$1\"');先来看第一个正则：/ (\s+\w+)\s*=\s*([^>"\s]+)(?=[^>]*>)/ig 结尾新添的(?=[^>]*>)意在解决普通文本中有等号被误识别为属性的问题： test=sd就没问题了，但是 test=sd
    
     又一个标签
    中的test=sd
    
     又会被识别为属性。我觉得改成下面的正则就没问题了：/(\s+\w+)\s*=\s*([^<>"\s]+)(?=[^<>]*>)/ig 分别在第二个括号的字符集合和最后的反向预查的字符集合中添加了一个<。下面再来分析第二个正则，/\"\'([^\'\"]+)\'\"/ig 这个正则用于匹配双引号，单引号多层嵌套的情况，同样，不用转义，修改正则如下：/"'([^'"]*)'"/ig这样基本任务就完成了。测试代码如下：

```

原帖里LeXRus又提出了新问题：

hint=i am lexrus

这样的属性会有问题，不过我感觉不加引号的话，属性值里就不可能有空格，否则会被识别为多个属性了。不过看到最后ncs的回帖我就哭了：

οnclick=if(document.forms.length>0)

这样的属性怎么办？大于号会被识别为标签结束……还是分离行为与文档吧。补充一下，其实修补一下正则也可以解决，只要改成如下正则即可：

/(\s+\w+)\s*=\s*([^"\s]+)(?=[<>]*>)/ig 就是去掉第二个括号内字符集合里的<>。最后这个问题也解决。

正则替换特定单词

来源：正则表达式,拒绝几个单词的输入该怎样表达?

要求禁止输入某几个单词，如果拒绝red,yellow,white。这个帖子到时不难，但是让我弄清楚了好几个概念。

第一个，小心字符集合里的“或”

/[^red|yellow|white]/ 这个正则里的所有或都没有意义，等同于：