您的位置：首页 > 其它

汉字统计

2016-01-08 20:35 253 查看

[align=left]Problem Description[/align]
统计给定文本文件中汉字的个数。

[align=left]Input[/align]
输入文件首先包含一个整数n，表示测试实例的个数，然后是n段文本。

[align=left]Output[/align]
对于每一段文本，输出其中的汉字的个数，每个测试实例的输出占一行。

[Hint:]从汉字机内码的特点考虑~

[align=left]Sample Input[/align]

2
WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!
马上就要期末考试了Are you ready?

[align=left]Sample Output[/align]

14
9

[align=left]Author[/align]
lcy
代码：

#include<stdio.h>
#include<string.h>
int main()
{
int n,i,len,k;
char a[100001];
scanf("%d",&n);
getchar();
while(n--)
{
k=0;
gets(a);
len=strlen(a);
for(i=0;i<len;i++)
{
if(a[i]<0)
k++;
}
printf("%d\n",k/2);
}
return 0;
}

思路：

汉字内码(机内码)

(1)概念：在计算机内部表示汉字的代码。

(2)特点：汉字内码采用两个字节，一个汉字占两个ASCII字符；汉字内码最高位为1，ASCII码最高位为0

(3)汉字内码与区位码的关系：

汉字内码高位字节=(区号)16+(A0)16

汉字内码低位字节=(位号)16+(A0)16

例3：汉字“啊”的区位码为1601，则其汉字内码为(B0A1)16。

所以，每个汉字都是小于0的。非汉字都是大于0的。而每个汉字占用两个字节，最后cont要除以二。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航