您的位置:首页 > 编程语言 > C语言/C++

C语言字符串格式化处理(转)

2012-04-12 12:57 435 查看
C语言字符串格式化处理(转)

一直以来对于C语言处理字符串有一种误解,总觉得很麻烦。对于习惯了java中string各种封装操作的我来说,要习惯C中处理

复杂的字符串还真不是一件易事。
最近开始喜欢上这个函数 sscanf.
int sscanf(constchar*buffer, constchar*format [, argument ] ... );
在stdlib中,scanf和printf有好多版本:
fscanf和fprintf是分别从流中格式化输入输出的。
scanf和fprintf是从标准设备中格式化输入输出的。
sscanf和sprintf则是向字符缓冲区中格式化输入输出的。
这些函数除了重定向的源和目的不同外,最为核心和强大的都是format的支持。
下面以sscanf为例,小结一下各个参数的强大功能。
一、常见格式说明符:
%d
十进制整数.
%o
八进制整数 0.


%x
十六进制整数 0x.


%D
一个十进制整数,如果以0开始,则为八进制,如果以0x开始,则为十六进制.
%f
浮点数.

%[b]c[/b]
单个字符.
%s
一个字符串。如果[b]%s后面跟一个%d,则%s只会匹配所有非数字的字符. 如果后面跟一个%[],则%s会匹配所有的没有在%[]中出现的字符. 如果后面跟普通字符串text,则%s会匹配所有的字符,直到text的第一次出现.[/b]

%Ns
如上,匹配一个长度为N的字符串.
%[characters]
一个字符串包含任意characters列表中的字符.
一个减号可以用来表示范围。例如%[a-d]表示包含任意a、b、[b]c的字符串(前闭后开的区间).[/b]
一个 ^ 符号表示否定、去除的意思。例如%[^abc]表示除了a,b,[b]c的任意字符.[/b]
这些符号可以组合使用.

%{format%}
尽可能多地重复匹配这个格式,匹配结果是一个数组的数组。例如%{%d%} 匹配0个或多个整数.

%%
表示一个百分号%字符.类似于转义字符.


如果有星号(*)被放到了百分号%和格式说明符之间,如%*d, 则函数只会匹配这个格式说明符,会忽略第一个匹配说明符之前的字符。
sscanf函数返回成功匹配的字符占所有字符的百分比的一个整数(范围从0到100).
如果一个匹配不成功,那么sscanf会立即返回,没有成功匹配的参数值不会改变。
二、实例
1、网上流传很广的周星星(具体是谁,我也不知道,姑且这么称呼)的一段代码
#include <stdio.h>

int main()

{

const char* s = "iios/12DDWDFF@122";

char buf[20];

sscanf( s, "%*[^/]/%[^@]", buf );
printf( "%s\n", buf );

return 0;

}

结果为:12DDWDFF
其中
%*[^/],匹配了从开始到第一个'/'字符字符出现以前的字符串,由于有'*',则将这部分忽略掉。
/,匹配该反斜杠'/'
%[^@],匹配到第一个'@'之前的所有字符串,即12DDWDFF
2、最近正在做的一个类似编译后端的程序中的一个例子。
要解析诸如 mov A,R0之类的汇编指令序列
#include <stdio.h>

int main()

{
char* line ="MOV A,@R0\n";
char temp[2][10];
sscanf( line, "%*[^ ] %[^,]", temp[0] ); //操作数 A
sscanf( line, "%*[^,],%[^\n]", temp[1] ); //操作数 @R0
return 0;
}
本例中temp[0]匹配了A,temp[1]匹配了@R0
sscanf( line, "%*[^ ] %[^,]", temp[0] );
首先根据%*[^ ],可以忽略前面的"MOV",接着是一个空格,最后匹配到’,‘为止。
sscanf( line, "%*[^,],%[^\n]", temp[1] ); //操作数 @R0
首先根据%*[^,],匹配并忽略','之前的所以字符,然后再匹配直到行末尾。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: