您的位置:首页 > 编程语言 > C语言/C++

C语言 字符串处理技巧(sscanf、strstr等用法)

2016-03-01 15:22 609 查看
之前有项目需要对日志进行大量提取和分析操作,除正则表达式这一强大的工具外,若是来不及学习正则表达式,又迫切地需要提取字符串。可以利用C语言自带的几个字符串处理函数来搞定。但必须注意符号、空格和换行符的细节问题。

sscanf的用法
int sscanf(const char *buffer,const char *format,[argument ]...);

根据format定义的形式,截取符合该形式的值,格式化输出到之后的传入的参数中。
sscanf支持正则,功能丰富,但必须注意的是:匹配条件比较苛刻,一旦未获取到参数极易引起段错误。一定要注意传入的必须是地址。
错误例子:
char * test = "ABCDE10FG\n";
int num = 0;
sscanf(test,"ABCDEF%dFG",num);
printf("num is %d\n",num);
程序结果:
写入位置 0x00000000 时发生访问冲突
一定要注意sscanf传入的必须是地址。
正确用法:

char * test = "ABCDE10FG\n";
int num = 0;
sscanf(test,"ABCDEF%dFG",&num);
printf("num is %d\n",num);

sscanf截取字符串
除截取数字比较方便外,sscanf也可截图字符串中的字符,但用法上有需要注意:
简单的%s输出格式化字符串不好用。
举例:

char * test = "ABCDE10FG\n";
int num = 0;
char target[4];
sscanf(test,"ABCDEF%d%sG",%num,target);
printf("num is :%d,targetis :%s\n",num,target);
我们期待target的值是”F“,
但实际上的输出是:”FG\n“,因为sscanf遇到%s的时候,直接将后边的所有字符串赋给了char,不会截取其中的内容,而且除了截取的内容与期望不符外,

如果字符串赋值越界,则直接引起栈错误。
错误例子:

char * test = "ABCDE10FG\n";
int num = 0;
char target[1];
sscanf(test,"ABCDEF%d%sG",%num,target);
printf("num is :%d,target is :%s\n",num,target);
输出结果
Run-Time Check Failure #2 - Stack around the variable 'target' was corrupted.

因为%s的格式化输出为3个字符,赋值给字符数组造成越界。

必须指定字符串的数量才能用sscanf截取。
正确例子:

char * test = "ABCDE10FG\n";
int num = 0;
char target[1];
sscanf(test,"ABCDEF%d%1sG",%num,target);
printf("num is :%d,targetis :%s\n",num,target);

输出结果:

num is :10,targe0t is :F

这种指定数量才能格式化输出用起来比较不方便,比如截取序列号等位数不一定怎么办?

strstr的用法
char *strstr(const char
*str1, const char *str2);
搜索一个字符串在另一个字符串中的第一次出现。该函数返回字符串的其余部分.

举例:
const char *test = "ABC_DEF_EFG";
char *target = strstr(test,"_");
target中保存的字符串是”_DEF_EFG“
可用两次strstr截取关键字之间的字符串。
举例:
const char * test = "ABC_DEF_EFG";

char *flag_1 = NULL;
flag_1 = strstr(test,"_");//获取第一个下划线的地址
if ( NULL != flag_1 )
{
flag_2 =NULL;
flag_2 = strstr(flag_1+1,"_");//获取第二个下划线的地址
}
if(flag_2 == NULL)
return ;
char * target = (char *)malloc(flag_2 - flag_1 - 1);
strncpy(target , flag_1+1 , (flag_2-flag_1 -1))//获取下划线之间的内容
结果:target的内容为”DEF“

一个实现读取文本关键字的简单流程:
fopen->fseek->fgets->fclose

sprintf (buf_com, "%s\\manipulate.log\\iolog_iostat",LogPath);
fp = fopen(buf_com,"r");
if(fp == NULL)
{
return ERROR_NOT_OPEN_FILE;
}
fseek(fp,searchlen,SEEK_SET);
while(fgets(readbuf,1024,fp))
{
tmppoint = head;
dmpoint = strstr(readbuf,"dm-");
if(dmpoint)
{
int dm_num=0;
sscanf(dmpoint,"dm-%d",&dm_num);
printf("dm_num is %d",dm_num);

}
}

fclose(fp);

本人博客园文章搬运
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: