R实战:【统计分析】词频统计
2017-08-01 22:04
316 查看
R实战系列专栏
本文代码来自《R语言编程艺术》本文代码和使用的文本文件百度云下载
本文使用的文本文件为《雾都孤儿》英文版,其中文本文件中经过处理只有英文单词,大写也已经转换成小写。
源代码:
setwd("D:/R/") getwd() txt<-scan("OliverTwist.txt","") #read all words in file to txt wl<-list() for(i in 1:length(txt)) { wrd<-txt[i] wl[[wrd]]<-c(wl[[wrd]],i) # for every word create a list with location list } nms<-names(wl) sn<-sort(nms) #wl[sn] freqs<-sapply(wl,length) #for every element use length() ,and result is c([[i]] length) wlOrder<-wl[order(freqs)] index<-(length(wlOrder)-10):length(wlOrder) top10<-wlOrder[index] sapply(top10,length) barplot(sapply(top10,length))
相关文章推荐
- mapreduce实战:统计美国各个气象站30年来的平均气温项目分析
- 一个简单的词频分析统计程序
- hive统计分析窗口函数实战
- 用R进行文本挖掘与分析--软件分词统计词频
- Python数据分析之文本处理词频统计
- Spark 实战,第 3 部分: 使用 Spark SQL 对结构化数据进行统计分析
- 3-2词频统计_效能分析
- 数据统计分析中Treemap 应用实战(排序以及查找离指定key最近的key)
- 数据库优化之统计分析实战篇
- Spark 实战,第 3 部分: 使用 Spark SQL 对结构化数据进行统计分析
- 【LEFT JOIN 实战记录】统计查询-按主办处室区县查询纳入分析研判库
- 补交词频统计效能分析
- Kafka项目实战-用户日志上报实时统计之分析与设计
- R语言实战之基本统计分析
- 软件工程-关于词频统计程序设计实现分析
- awstats日志统计分析实战笔记
- python实战,中文自然语言处理,应用jieba库来统计文本词频
- 亿量级流量的数据统计分析以及挖掘技术实战(Spark And Storm)
- ArcGIS水文分析实战教程(9)雨量计算与流量统计
- 【实战】词频统计及词云图制作