Spark 逻辑回归
2017-02-16 11:03
162 查看
Logistic算法 LogisticRegressionWithLBFGS
先上代码,网上看到的自己整理了一下训练数据一共有7列 6个特征 最后一列是结果,具体特征都表示啥就不细说了。
def main(args: Array[String]): Unit = { var sc = init() val path = "path\\Qualitative_Bankruptcy.data.txt" var data = readText(sc, path) println("数据总量:"+data.count()) /*将训练数据转换成变量 *p,a,n分别是每个特征对应的评分 *对特征和结果用map做转换 */ var pardata = data.map{x=> val xp = x.split(",") xp.map { t => t match { case "P" => 3.0 case "A" => 2.0 case "N" => 1.0 case "NB" => 1.0 case "B" => 0.0 } } } printArray(pardata.collect(), 4); var pdata = pardata.map { line => LabeledPoint(line(6),Vectors.dense(line.slice(0, 6))) } val splitData = pdata.randomSplit(Array(0.6,0.4), seed=11L) val trainingData = splitData(0) val testData = splitData(1) println(trainingData.count() +" "+testData.count()) //使用逻辑回归进行训练 val model = new LogisticRegressionWithLBFGS().setNumClasses(2).run(trainingData); val res = testData.map { point => (point.label,model.predict(point.features)) } println(res.filter(x=> x._1!=x._2).count()/res.count().doubleValue()) } /** * 输出数组 */ def printArray(arr:Array[Array[Double]],num:Int): Unit = { arr.take(num).foreach { x => x.foreach { y => print(y+" ") } println() } } /** * 读取文本 */ def readText(sc:SparkContext,path:String): RDD[String] ={ sc.textFile(path) } /** * 初始化配置 */ def init():SparkContext = { Logger.getLogger("org.apache.spark").setLevel(Level.WARN) Logger.getLogger("org.eclipse.jetty.server").setLevel(Level.OFF) var conf = new SparkConf().setMaster("local[4]").setAppName("Logistic"); var sc = new SparkContext(conf); sc }
训练数据地址:
相关文章推荐
- spark学习逻辑回归
- spark 逻辑回归进行基于文本的分类预测
- 基于Spark的逻辑回归实验
- Spark LogisticRegression 逻辑回归之建模
- spark厦大----逻辑斯蒂回归分类器--spark.ml
- Spark的逻辑回归与P_R_F评估
- spark-ml 逻辑回归使用记录
- 基于spark构建逻辑回归
- spark中调用逻辑回归
- 使用spark建立逻辑回归(Logistic)模型帮Helen找男朋友
- Spark-mllib源码分析之逻辑回归(Logistic Regression)
- spark:逻辑回归
- Spark中组件Mllib的学习26之逻辑回归-简单数据集,带预测
- spark实现下的逻辑回归(logistic regression)
- spark2.0中逻辑回归模型
- tf-idf、逻辑回归和SVM on spark
- Spark中组件Mllib的学习27之逻辑回归-多元逻辑回归,较大数据集,带预测准确度计算
- Spark中组件Mllib的学习30之逻辑回归LogisticRegressionWithLBFGS
- lkl风控.逻辑回归分析模型测试代码spark1.6
- Spark 机器学习逻辑回归demo