关于词统计的一点闲碎备忘
2015-06-14 00:00
375 查看
摘要: 关于词统计的一点闲碎备忘
关于词统计的一点闲碎备忘
对于英语,一般用空格来区分单词,似乎很容易得到所谓的“词”。然,不尽然。
单词的大小写,名词的格,动词的时态语态等的影响是不能被忽略的。
a 126
A 43 大小写,专有名词等。
and 108
And 2 大小写
Area 1
areas 11 名词的格(复数)
assume 2
assumed 1 动词的时态和语态
对于汉语,没有像空格这样的区分,是不是更麻烦了些呢。
关于词统计的一点闲碎备忘
对于英语,一般用空格来区分单词,似乎很容易得到所谓的“词”。然,不尽然。
单词的大小写,名词的格,动词的时态语态等的影响是不能被忽略的。
a 126
A 43 大小写,专有名词等。
and 108
And 2 大小写
Area 1
areas 11 名词的格(复数)
assume 2
assumed 1 动词的时态和语态
对于汉语,没有像空格这样的区分,是不是更麻烦了些呢。
相关文章推荐
- 关于Mysql group_concat的应用(把相同ID的VAL用字符'/'连接起来)
- Kotlin教程学习-字符串拼接,数组,List
- RABC常用的一些方法
- Hibernate 单向的多对一关联
- Hibernate 单向的一对多关联映射
- Hibernate 双向的多对一关联映射
- Hibernate 双向的自身关联映射
- ToolStripSplitButton单选设置
- 计算机存储单位以及内存原理
- 二进制、八进制、十进制、十六进制之间转换
- mycncart1.0.2.0版 发布
- Python实现打印二叉树某一层的所有节点
- 黑马程序员------多线程创建的3种方式
- Linux运维 第三阶段 (七) nginx(1)
- 贵州四儿童事件记
- 【C++ Primer Plus 9.2】 存储持续性、作用域和链接性
- centos7 和 win7 双系统 分别装在两个不同的硬盘
- 有关11g新特性ENABLE_DDL_LOGGING 初始化参数
- Delphi XE8中Delphi和JAVA数据类型对应关系!
- SVN-Previous operation has not finished; run 'cleanup' if it was interrupted