正则入门:匹配文本首和尾
2011-02-04 00:00
1086 查看
有的时候,我们想要匹配的字符串必须位于全部文本的首位,比如说 XML 文件的声明“<?xml version="1.0" encoding="UTF-8" ?>”;有的时候,需要匹配的字符串位于全部文本的末尾,比如</html>。对于这种匹配,上面介绍的单词边界匹配就无能为力了。
假设不存在“^”,进行一个正常匹配,将所有匹配的文本保存到匹配集合中;
在匹配集合中寻找位于 所搜索的文本 首位的匹配;
从匹配集合中删除其他匹配,仅保留该匹配。
正则如下:
我们进行文本边界匹配时,通常还需要添加对空字符的处理所以需要在字符串前加上\s*
按照之前说的,它的匹配过程是这样:
假设匹配模式是 nowamagic\d?\.net,对文本进行匹配。
一共找到 2 个符合模式的文本:第一行 和 第二行的 nowamagic.net, 及 nowamagic2.net
从所有匹配的文本中筛选出位于文本首位的匹配文本:即第一行的 nowamagic.net,删除所有其他匹配。
在正则表达式中,可以在 匹配模式 的最后一个字符后添加 “$”,以匹配 满足模式且位于全部文本之末的字符串。
它的匹配方式 与 匹配文本首“^”相似,这里就不再详细说明了,只给出一个例子:
正则如下:
回顾下之前介绍的,可以看出:“\b”和“\B”是对 匹配模式(表达式) 中某个字符出现的进行位置(单词首位还是末位)进行限制。“^”和“$” 是对 整个待搜索文本 的 匹配模式(表达式) 出现位置(文本首位还是文本末位)进行限制。它们的关系是一小一大。
匹配文本首
在正则表达式中,可以在 匹配模式 的第一个字符前添加 “^”,以匹配 满足模式且位于全部文本之首的字符串。可以将它的匹配方式理解成这样:假设不存在“^”,进行一个正常匹配,将所有匹配的文本保存到匹配集合中;
在匹配集合中寻找位于 所搜索的文本 首位的匹配;
从匹配集合中删除其他匹配,仅保留该匹配。
正则如下:
^(\s*nowamagic\d?\.net)
效果演示
nowamagic.net and nowamagic2.net are websites.本例代码
function reg_replace() { var test = document.getElementById("test"); var regex = /^(\s*nowamagic\d?\.net)/g; test.innerHTML = test.innerHTML.replace(regex,"<span style='background-color:orange'>$1</span>"); }
我们进行文本边界匹配时,通常还需要添加对空字符的处理所以需要在字符串前加上\s*
按照之前说的,它的匹配过程是这样:
假设匹配模式是 nowamagic\d?\.net,对文本进行匹配。
一共找到 2 个符合模式的文本:第一行 和 第二行的 nowamagic.net, 及 nowamagic2.net
从所有匹配的文本中筛选出位于文本首位的匹配文本:即第一行的 nowamagic.net,删除所有其他匹配。
匹配文本末
有匹配文本首的语法,自然有匹配文本末的语法。在正则表达式中,可以在 匹配模式 的最后一个字符后添加 “$”,以匹配 满足模式且位于全部文本之末的字符串。
它的匹配方式 与 匹配文本首“^”相似,这里就不再详细说明了,只给出一个例子:
正则如下:
(nowamagic\d?\.net\s*)$
效果演示
nowamagic.net and nowamagic2.net are both names nowamagic.net回顾下之前介绍的,可以看出:“\b”和“\B”是对 匹配模式(表达式) 中某个字符出现的进行位置(单词首位还是末位)进行限制。“^”和“$” 是对 整个待搜索文本 的 匹配模式(表达式) 出现位置(文本首位还是文本末位)进行限制。它们的关系是一小一大。
相关文章推荐
- android 入门学习笔记 正则匹配 电话号码 email
- PHP入门教程之正则表达式基本用法实例详解(正则匹配,搜索,分割等)
- 如何用正则匹配这段文本
- 正则 去除html文本和匹配邮箱
- 简单入门正则表达式 - 第五章 多字符的匹配
- nginx 正则表达式匹配入门篇 .
- 正则匹配:去除字符串中的空格,获取select下拉选项中的option的文本内容
- 正则入门:匹配区间内数目的字符
- php小功能定制:对txt文本里面的字符串用正则表达式匹配
- 正则入门:贪婪匹配
- java正则表达式 匹配文本中的网址
- 正则入门:惰性匹配
- 用正则匹配多行文本
- nginx 正则表达式匹配入门篇
- php将中文转换成相应匹配的正则表达式(要求原文本为utf-8编码)
- 匹配文本中的网址java正则表达式
- 正则表达式 入门 -- 简单字符匹配、元字符
- PHP正则匹配title标题文本
- Js 利用正则表达式和replace函数获取string中所有被匹配到的文本(推荐)
- 正则入门:匹配任意的单个字符