您的位置:首页 > 编程语言 > C语言/C++

C语言字符串格式化处理(转)

2013-06-14 13:17 218 查看
一直以来对于C语言处理字符串有一种误解,总觉得很麻烦。对于习惯了java中string各种封装操作的我来说,要习惯C中处理

复杂的字符串还真不是一件易事。

最近开始喜欢上这个函数 sscanf.

int sscanf(constchar*buffer, constchar*format [, argument ] ... );

在stdlib中,scanf和printf有好多版本:

fscanf和fprintf是分别从流中格式化输入输出的。

scanf和fprintf是从标准设备中格式化输入输出的。

sscanf和sprintf则是向字符缓冲区中格式化输入输出的。

这些函数除了重定向的源和目的不同外,最为核心和强大的都是format的支持。

下面以sscanf为例,小结一下各个参数的强大功能。

一、常见格式说明符:
%d
十进制整数.
%o
八进制整数 0.


%x
十六进制整数 0x.


%D
一个十进制整数,如果以0开始,则为八进制,如果以0x开始,则为十六进制.
%f
浮点数.

%c
单个字符.
%s
一个字符串。如果[b]%s后面跟一个%d,则%s只会匹配所有非数字的字符. 如果后面跟一个%[],则%s会匹配所有的没有在%[]中出现的字符. 如果后面跟普通字符串text,则%s会匹配所有的字符,直到text的第一次出现.[/b]

%Ns
如上,匹配一个长度为N的字符串.
%[characters]
一个字符串包含任意characters列表中的字符.

一个减号可以用来表示范围。例如%[a-d]表示包含任意a、b、c的字符串(前闭后开的区间).

一个 ^ 符号表示否定、去除的意思。例如%[^abc]表示除了a,b,c的任意字符.

这些符号可以组合使用.

%{format%}
尽可能多地重复匹配这个格式,匹配结果是一个数组的数组。例如%{%d%} 匹配0个或多个整数.

%%
表示一个百分号%字符.类似于转义字符.


如果有星号(*)被放到了百分号%和格式说明符之间,如%*d, 则函数只会匹配这个格式说明符,会忽略第一个匹配说明符之前的字符。

sscanf函数返回成功匹配的字符占所有字符的百分比的一个整数(范围从0到100).

如果一个匹配不成功,那么sscanf会立即返回,没有成功匹配的参数值不会改变。

二、实例

1、网上流传很广的周星星(具体是谁,我也不知道,姑且这么称呼)的一段代码

#include <stdio.h>

int main()

{

const char* s = "iios/12DDWDFF@122";

char buf[20];

sscanf( s, "%*[^/]/%[^@]", buf );

printf( "%s\n", buf );

return 0;

}

结果为:12DDWDFF

其中

%*[^/],匹配了从开始到第一个'/'字符字符出现以前的字符串,由于有'*',则将这部分忽略掉。

/,匹配该反斜杠'/'

%[^@],匹配到第一个'@'之前的所有字符串,即12DDWDFF

2、最近正在做的一个类似编译后端的程序中的一个例子。

要解析诸如 mov A,R0之类的汇编指令序列
#include <stdio.h>

int main()

{

char* line ="MOV A,@R0\n";

char temp[2][10];

sscanf( line, "%*[^ ] %[^,]", temp[0] ); //操作数 A

sscanf( line, "%*[^,],%[^\n]", temp[1] ); //操作数 @R0
return 0;

}

本例中temp[0]匹配了A,temp[1]匹配了@R0

sscanf( line, "%*[^ ] %[^,]", temp[0] );

首先根据%*[^ ],可以忽略前面的"MOV",接着是一个空格,最后匹配到’,‘为止。

sscanf( line, "%*[^,],%[^\n]", temp[1] ); //操作数 @R0

首先根据%*[^,],匹配并忽略','之前的所以字符,然后再匹配直到行末尾。

Printf Type Field Characters
http://msdn.microsoft.com/en-us/library/hf4y5e3w%28VS.80%29.aspx
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: