您的位置:首页 > 其它

关于str__相关操作源码,不定期更新

2015-07-06 15:08 288 查看

1.strcmp源码

在标准C中,这个函数可以被写成;

int strcmp(const char* s1, const char* s2)
{
while(*s1 && *s2 && *s1 == *s2)
s1++, s2++;
return *(unsigned char*)s1 - *(unsigned char*)s2;
}


其实原本的函数在进行安全检查的时候并没有在while()中加入对s2的检查,但是这种函数一般是比较底层的,我们在写的时候还是要加上相关的安全检查。

那么我们在返回s1和s2的比较结果的时候为什么要将其转换为unsigned char呢?

我们可以看一个ASCII码表:



我们可以观察到,在128-255这个过程中还是有相应的码的,譬如’<<’这个符号我们在表中可以查到是173,但是如果对应对char型的话,他的值-45,那么在对这个符号和’a’进行比较的时候,如果按照char型的解释方式,我们得到的值一定是负数的;

这样得到的结果一定是错误的。

那么有的人会问:为什么不直接将函数的形参的类型定成char型呢,我估计是因为char的时候频率太高了,没有必要因为一个函数而改变使用习惯吧。有其他原因欢迎讨论。

2.memset的相关函数代码及使用上的注意

当天写的东西就可以更新了,感觉不错,下面写一下memset的源代码

void* memset(void* s, int c, size_t n)
{
unsigned char* p = s;
while(n--)
*p++ = (unsigned char)c;
return s;
}


起始这个我觉得要是我自己,我会增加入输入安全检查,下面是我写更改了一下的代码:

void* memset(void* s, int c, size_t n)
{
if(s == NULL || n <= 0)
return NULL;
unsigned char* p = s;
while(n--)
*p++ = (unsigned char)c;
return s;
}


下面说关于这个函数中是要注意的几点:

a.因为该函数是将一段内存初始化,并且它是按照字节来复制的,所以你想将一个int数组中的元素都设置成5,这么做是很容易出错的:

int *a = new int[10];
memset(a, 5, 10 * sizeof(int));
for (int i = 0; i < 10; i++)
cout << a[i] << endl;
return 0;


这个程序会输出每个元素的值:84215045

为什么不是我们希望的5呢,因为是按照字节来复制的,那么84215045转换成2进制就是:00000101 00000101 00000101 00000101

大家一看这个估计就懂了,所以memset最好利用在结构体或者数组的初始化是很方便的。

b.函数中我们可以看到返回了指针s,这是为了链式使用,譬如:strlen(memset(s, c, n));

c.还有一点大家需要注意,就是我们在用数字c来初始化每个字节的时候必须要进行强制类型转换(unsigned char),这样才不会导致每个字节因为数字c而产生溢出;

d.为什么在函数内部采用unsigned char,经过思考我认为有以下的原因:其实CPU在处理数据的时候,都有二进制表示的,无论这个数字式char还是unsigned char,它都是那个数字,只是我们的解释不同;

例如:

int a = 128;
unsigned char tempUnsignedChar = a;
char tempChar = a;


对于这两个变量tempUnsignedChar 和tempChar 来说,其实CPU在计算时存在寄存器中的值都是10000000,只是因为他们的类型不同,所以对于相同的数字产生的解释也是不同的;

那么为什么利用unsigned char来表示字节的数呢,因为它不需要涉及到符号扩充等等,这样跟接近一个数字的本质。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: