asp.net中C#获取字符串中汉字的个数的具体实现方法
2014-02-26 00:00
931 查看
符串可以包括数字,字母,汉字或者其他的字符。使用Char类型的IsDigit静态方法可以判断字符串中的字符是否为数字,使用Char类型中的IsLetter静态方法可以判断字符串中是否为字母。我们来实现一种方法来实现判断字符串中是否为汉字,通过此方法可以计算字符串中汉字的个数,运行效果如图:
![](https://oscdn.geek-share.com/Uploads/Images/Content/2015/2015030193/9e35b273c8da571c2c1194f2e8a45403.jpg)
首先根据效果图设置好Form的界面和内容,Box1.Text为输入的字符串,我们对该字符串的处理,来计算汉字的个数,双击Buton控件,编辑其单击事件代码。
我们看下汉字的Unicode范围,普遍给出了0x4E00到0x9FA5,只要我们接受到的字符的16进制编码在此范围,我们就认为此字符为汉字(label4.Text显示汉字的个数)
后再再整理了一些函数 C#中使用正则表达式来从字符串中判断出汉字
代码说明:
1、Unicode字符的u4E00到u9FA5之间为汉字编码,所以使用它来表示汉字的正则匹配范围。
2、字符串可以直接进行索引,索引得到的值的数据类型为char,所以str[i].ToString()是为了把char再度转换为字符串。
3、使用Regex的IsMatch方法,可以判断字符串是否与给定的正则表达式匹配,如果匹配成功则返回True,否则为False。
例,获取一个字符串中的汉字的个数 C#获取字符串全角的个数
例,这个也是正常的
原理是:获得字符串中汉字的个数时,可以首先定义一个与汉字相匹配的正则表达式,然后使用CharEnumerator对象的MoveNext方法循环访问字符串中的每个字符,如果访问的字符与定义的正则表达式相匹配,则将其添加到一个数组中,最后获得该数组的项数即为字符串中汉字的个数。获得字符串中汉字个数
![](https://oscdn.geek-share.com/Uploads/Images/Content/2015/2015030193/9e35b273c8da571c2c1194f2e8a45403.jpg)
首先根据效果图设置好Form的界面和内容,Box1.Text为输入的字符串,我们对该字符串的处理,来计算汉字的个数,双击Buton控件,编辑其单击事件代码。
我们看下汉字的Unicode范围,普遍给出了0x4E00到0x9FA5,只要我们接受到的字符的16进制编码在此范围,我们就认为此字符为汉字(label4.Text显示汉字的个数)
string a=Box1.Text; int K = 0; for (int i = 0; i < a.Length;i++ ) { char j=a[i]; ushort s = j; if (s >= 0x4E00&&s<=0x9FA5) { K++; } label4.Text = “” + K;
后再再整理了一些函数 C#中使用正则表达式来从字符串中判断出汉字
//首先引用命名空间 using System.Text.RegularExpressions; //定义一个函数,返回字符串中的汉字个数 public static int GetHanNumFromString(string str) { int count = 0; Regex regex = new Regex(@"^[u4E00-u9FA5]{0,}$"); for (int i = 0; i < str.Length; i++) { if (regex.IsMatch(str[i].ToString())) { count++; } } return count; }
代码说明:
1、Unicode字符的u4E00到u9FA5之间为汉字编码,所以使用它来表示汉字的正则匹配范围。
2、字符串可以直接进行索引,索引得到的值的数据类型为char,所以str[i].ToString()是为了把char再度转换为字符串。
3、使用Regex的IsMatch方法,可以判断字符串是否与给定的正则表达式匹配,如果匹配成功则返回True,否则为False。
例,获取一个字符串中的汉字的个数 C#获取字符串全角的个数
static void Main(string[] args) { while (true) { Console.WriteLine("输入一串字符"); string str = Console.ReadLine();//定义一个变量str用来存储输入的字符串 int num= Encoding.Default.GetByteCount(str);//Encoding.Default.GetByteCount(str)在系统默认下计算对字符进行编码是所产生的字节数 int len = str.Length;//获取字符串的长度 Console.WriteLine("有{0}汉字",num-len);//num-len就是字符串中的汉字个数 } }
例,这个也是正常的
ArrayList itemList = new ArrayList(); CharEnumerator CEnumerator = textBox1.Text.GetEnumerator(); Regex regex = new Regex("^[/u4E00-/u9FA5]{0,}$"); while (CEnumerator.MoveNext()) { if(regex.IsMatch(CEnumerator.Current.ToString(),0)) itemList.Add(CEnumerator.Current.ToString()); textBox2.Text = itemList.Count.ToString(); }
原理是:获得字符串中汉字的个数时,可以首先定义一个与汉字相匹配的正则表达式,然后使用CharEnumerator对象的MoveNext方法循环访问字符串中的每个字符,如果访问的字符与定义的正则表达式相匹配,则将其添加到一个数组中,最后获得该数组的项数即为字符串中汉字的个数。获得字符串中汉字个数
相关文章推荐
- 在aspx页面引用html页的写法
- asp.net中实现页面间的参数传递
- asp.net命名规范
- Probably ResourceManager is not defined in the View【ASP.NET MVC4+EXT.NET配置常见错误】
- ASP.NET MVC 过滤器
- ASP.NET连接SQL Server数据库
- ASP.NET MVC Controllers and Actions
- ASP.NET MVC Filters 4种默认过滤器的使用【附示例】
- Raspberry Pi 资料汇集
- IIS与Asp.net
- asp.net中的<%%>的几种形式的用法
- ASP.NET高并发解决方案
- 解决asp.net 报错 无法获取所需的权限错误
- 压缩aspx页面删除多余空格的两种方法
- 8.4.2: Spring的AOP---使用AspectJ实现AOP
- 微信公众平台接口,asp.net实现
- asp.net读取excel文件的三种方法示例
- 使用asp.net MVC4中的Bundle遇到的问题及解决办法分享
- asp.net输出重写压缩页面文件实例代码
- asp.net web api 开发时应当注意的事项