Ansj添加停用词表
2015-11-26 15:39
423 查看
HashMap<String, String> strHashMap = new HashMap<String, String>(); String stopWordTable = "StopWordTable.txt"; File f = new File(stopWordTable); FileInputStream fileInputStream = new FileInputStream(f); //读入停用词文件 BufferedReader StopWordFileBr = new BufferedReader(new InputStreamReader(fileInputStream)); String stopWord = null; for(; (stopWord = StopWordFileBr.readLine()) != null;){ strHashMap.put(stopWord , "_stop"); } StopWordFileBr.close(); FilterModifWord.setUpdateDic(strHashMap);StopWordTable.txt为中文通用词列表,去网上可以搜索到。strHashMap为生成号的停用词词典。在调用
FilterModifWord.modifResult()方法就可以实现去掉停用词。
相关文章推荐
- c语言实现hashmap(转载)
- PHPAnalysis中文分词类详解
- 解析WeakHashMap与HashMap的区别详解
- 基于Java HashMap的死循环的启示详解
- Java中HashMap和Hashtable的区别浅析
- 重载toString实现JS HashMap分析
- Android中实现HashMap排序的方法
- 几款开源的中文分词系统
- 举例详解Java编程中HashMap的初始化以及遍历的方法
- 深入理解Java中的HashMap的实现机制
- 深入解析java HashMap实现原理
- java HashMap的keyset实例
- 浅析java中ArrayList与Vector的区别以及HashMap与Hashtable的区别
- java中Hashtable和HashMap的区别分析
- JAVA HashMap详细介绍和示例
- Java中HashMap和Hashtable及HashSet的区别
- 浅析Java中Map与HashMap,Hashtable,HashSet的区别
- Java中HashMap和TreeMap的区别深入理解
- JS自定义一个Map类
- JDK API阅读体会 2-哈希还是哈希