Spark primer 之 统计csdn十大常用密码
2015-10-19 19:01
447 查看
受 http://blog.csdn.net/luyee2010/article/details/8620112文章启发
Notice:密码来源网络(top-10密码都为弱口令,没什么挖掘价值)
密码格式为 :账号 # 密码 # 邮箱 例如:Lqwert # 123456 # XXXXX@163.com
看代码
Object countPass {
def main(args :Array[String]){
val conf = new SparkConf().setAppName(“countpass”).setMaster(“local”)
val sc = new SparkContext(conf)
def fun(str:String):Array[String]{
val arr = str.split(“ # ”)
arr2 = Array(arr(2))
return arr2
}
sc.flatMap(fun(line)).map((,1)).reduceByKey(+_).map(e => (e._2,e._1)).sortByKey(false).collect.foreach(println)
}
}
结果
Notice:密码来源网络(top-10密码都为弱口令,没什么挖掘价值)
密码格式为 :账号 # 密码 # 邮箱 例如:Lqwert # 123456 # XXXXX@163.com
看代码
Object countPass {
def main(args :Array[String]){
val conf = new SparkConf().setAppName(“countpass”).setMaster(“local”)
val sc = new SparkContext(conf)
def fun(str:String):Array[String]{
val arr = str.split(“ # ”)
arr2 = Array(arr(2))
return arr2
}
sc.flatMap(fun(line)).map((,1)).reduceByKey(+_).map(e => (e._2,e._1)).sortByKey(false).collect.foreach(println)
}
}
结果
相关文章推荐
- Spark RDD API详解(一) Map和Reduce
- 使用spark和spark mllib进行股票预测
- Spark随谈——开发指南(译)
- Spark,一种快速数据分析替代方案
- eclipse 开发 spark Streaming wordCount
- Spark初探
- Spark Streaming初探
- 搭建hadoop/spark集群环境
- 整合Kafka到Spark Streaming——代码示例和挑战
- Spark 性能相关参数配置详解-任务调度篇
- 基于spark1.3.1的spark-sql实战-01
- 基于spark1.3.1的spark-sql实战-02
- 在 Databricks 可获得 Spark 1.5 预览版
- spark standalone模式 zeppelin安装
- Apache Spark 1.5.0正式发布
- Tachyon 0.7.1伪分布式集群安装与测试
- spark取得lzo压缩文件报错 java.lang.ClassNotFoundException
- tachyon与hdfs,以及spark整合
- hive on spark 编译
- 使用openfire,spark,fastpath webchat搭建在线咨询服务详细图文解说