HDU 2030 汉字统计
2015-07-30 08:45
260 查看
Description
统计给定文本文件中汉字的个数。
Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。
Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~
Sample Input
Sample Output
ascii 字符占用一个字节(使用低7位),最高位为0,另外,汉字机内码在计算机的表达方式的描述是,使用二个字节,每个字节最高位一位为1。计算机中, 补码第一位是符号位, 1 表示为 负数, 所以 汉字机内码的每个字节表示的十进制数都是负数,结果要除以2,不要忘了。因为汉字占用两个字节。进行按位与运算后,是英文字符返回0,是中文汉字则返回128.还可以通过判断他的每一个字节是否小于零(因为最高位为符号位),小于0则是中文汉字,否则反。
统计给定文本文件中汉字的个数。
Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。
Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~
Sample Input
2 WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa! 马上就要期末考试了Are you ready?
Sample Output
14 9
#include <stdio.h> #define N 1000 char a ; int main() { int n; scanf("%d\n", &n); while (n--) { gets(a); int len = strlen(a), k = 0; for (int i = 0; i < len; i++) if (a[i] < 0) k++; printf("%d\n", k / 2); } return 0; }
ascii 字符占用一个字节(使用低7位),最高位为0,另外,汉字机内码在计算机的表达方式的描述是,使用二个字节,每个字节最高位一位为1。计算机中, 补码第一位是符号位, 1 表示为 负数, 所以 汉字机内码的每个字节表示的十进制数都是负数,结果要除以2,不要忘了。因为汉字占用两个字节。进行按位与运算后,是英文字符返回0,是中文汉字则返回128.还可以通过判断他的每一个字节是否小于零(因为最高位为符号位),小于0则是中文汉字,否则反。
相关文章推荐
- opencv中的SVM图像分类(二)
- Oracle语句优化规则汇总(10)
- 【转】嵌入式C语言那点事(一)几个重要关键字
- Python的迭代器和生成器
- 最小二乘在机器学习中的使用
- Java 泛型的详解
- springMVC的全流程使用和分析
- Mono源代码学习笔记:Console类(三)
- 谈谈为 Linux 内核写驱动的编码规范
- SQL基础大集合
- OpenSSL库的RSA使用(下)-rsa函数方式
- Mono源代码学习笔记:Console类(四)
- [转]oracle 实施方法论学习心得
- html编写的过程中,为什么font设置属性的时候,第二个属性不起作用
- yii rules使用 获取error信息
- Gulp挑战Grunt,背后的哲学
- Spring讲解-----------测试
- sphinx ---rotate 运行机制
- iOS UI01_UIView
- Windows 操作系统与 .NET Framework