您的位置:首页 > 运维架构 > Linux

linux正则表达式处理文本

2014-01-18 15:36 381 查看
        Linux提供了许多用于文本处理的工具,像sed、awk、perl、python可以自动编辑多个文件,提供了广泛的文本处理能力。这些工具和其他工具能理解一种松散定义的模式语言。该语言以及模式本身被统称为正则表达式(regular expressions)。正则表达式优点类似文本通配,但包含了更多的特殊字符。

        正则表达式由排列文本字符串或模式定义。这些模式是由两种类型的字符组成:原义字符(纯文本)和元字符组成。

        如同shell中的通配符,正则表达式元字符在使用它们的工具环境中有特殊的含义。完整的元字符类表如下:







      注意不要将其与前面锚字符^字符混淆。



      在shell里也有*,但是那里是通配符,shell中 vi hello.*匹配.c、.o、.s等最后一个或几个字符不同的文件,而grep 'hello.*'  hello.c则是匹配hello后接任意0个或多个字符的字符表达式。

      如果把正则表达式比喻成语言,则原义字符就像语言里的单词或词组。元字符的用法就相当与语言的“语法”。当你构建正则表达式时,其实就是在使用元字符与原义字符来定义输入文本的3个基本概念:位置锚点,字符集合,数量修饰符。正则表达式主要应用于awk,sed,grep等处理文本的应用中。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  linux 正则表达式