收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~)

jerry 正则 2016年03月06日 收藏

正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新,请持续关注本站。

匹配中文字符的正则表达式: [\u4e00-\u9fa5]

匹配双字节字符(包括汉字在内):[^\x00-\xff]

应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

  1. String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

匹配空行的正则表达式:\n[\s| ]*\r

匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/

匹配首尾空格的正则表达式:(^\s*)|(\s*$)

  1. String.prototype.trim = function()
  2. {
  3. return this.replace(/(^\s*)|(\s*$)/g, "");
  4. }

利用正则表达式分解和转换IP地址:

下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:

  1. function IP2V(ip)
  2. {
  3. re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式
  4. if(re.test(ip))
  5. {
  6. return RegExp.1Math.pow(255,3))+RegExp.2*Math.pow(255,2))+RegExp.3255+RegExp.4*1
  7. }
  8. else
  9. {
  10. throw new Error("Not a valid IP address!")
  11. }
  12. }

不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:

  1. var ip="10.100.20.168"
  2. ip=ip.split(".")
  3. alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见红色字体]

  1. var s="abacabefgeeii"
  2. var s1=s.replace(/(.).*\1/g,"$1")
  3. var re=new RegExp("["+s1+"]","g")
  4. var s2=s.replace(re,"")
  5. alert(s1+s2) //结果为:abcefgi

===============================

如果var s = "abacabefggeeii"

结果就不对了,结果为:abeicfgg

正则表达式的能力有限

我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。

得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1

  1. s="http://www.9499.net/page1.htm"
  2. s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
  3. alert(s)

利用正则表达式限制网页表单里的文本框输入内容:

用正则表达式限制只能输入中文:

  1. onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

用正则表达式限制只能输入全角字符:

  1. onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

用正则表达式限制只能输入数字:

  1. onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

用正则表达式限制只能输入数字和英文:

  1. onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:

  1. /**
  2. * 计算字符串长度,将非宽字符计算为半个字符
  3. *
  4. * @param str
  5. * @returns
  6. */
  7. function gbLength(str) {
  8. return typeof str === "string" ? str.length + str.replace(/[\x00-\x7f]/g, '').length + 1 >> 1 : 0;
  9. }
  10.  
  11. /**
  12. * 获取字符串的指定长度的子串,将非宽字符计算为半个字符
  13. *
  14. * @param str
  15. * @param length
  16. * @returns
  17. */
  18. function gbSubstr(str, length) {
  19. if (typeof str !== "string")
  20. return str;
  21. length += length;
  22. for ( var n = 0, L = str.length; n < L && length > 0; n++){
  23. length -= str.charCodeAt(n) > 127 ? 2 : 1;
  24. }
  25. return str.substr(0, n);
  26. }
  27. /**
  28. * 切割指定字符串的指定长度子串,如果长度超过指定长度,则丢弃末尾两个字符并附加...
  29. *
  30. * @param str
  31. * @param len
  32. * @returns
  33. */
  34. function fit_length(str, len){
  35. len = len || 16;
  36. if (typeof str !== "string" || str.length <= len || gbLength(str) <= len){
  37. return str;
  38. }
  39. var ret = gbSubstr(str, len - 2);
  40. return ret + '..';
  41. }
  42. var replaceCJK = /[^\x00-\xff]/g,
  43. testCJK = /[^\x00-\xff]/;
  44.  
  45. cjkLength: function(strValue){
  46. return strValue.replace(replaceCJK, "lv").length;
  47. },
  48. isCjk: function(strValue){
  49. return testCJK.test(strValue);
  50. },
  51. cutString: function(str,len,suffix,slen){
  52. suffix = suffix || '';
  53. slen = slen || suffix.length;
  54. if(str.length > len){
  55. str = str.substr(0,len - slen) + suffix;
  56. }
  57. return str;
  58. },
  59. cutCjkString: function(str,len,suffix,slen){
  60. suffix = suffix || '';
  61. slen = slen || suffix.length;
  62. len -= slen;
  63. if(this.cjkLength(str) <= len){
  64. return str;
  65. }
  66. var s = str.split(''),c = 0,tmpA = [];
  67. for(var i=0;i<s.length;i+=1){
  68. if(c < len){
  69. tmpA[tmpA.length] = s[i];
  70. }
  71. if(this.isCjk(s[i])){
  72. c += 2;
  73. }else{
  74. c += 1;
  75. }
  76. }
  77. return tmpA.join('') + suffix;
  78. }
  79. }

以上内容给大家分享我日常收集的一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~),希望大家喜欢。欲了解更多,请持续关注本站。