您的位置:首页 > 编程语言

线性回归模板代码

2018-01-24 20:34 211 查看
程序如下:
package xyz.ixiaoban.bigdata.spark

import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.{LabeledPoint, LinearRegressionWithSGD}
import org.apache.spark.{SparkConf, SparkContext}

object LinearRegression {
val conf = new SparkConf().setMaster("local").setAppName("LinearRegression3 ")                                  //创建环境变
val sc = new SparkContext(conf)                                 //创建环境变量实例

def main(args: Array[String]) {
val data = sc.textFile("file:\\c:\\A.txt")       //获取数据集路径
val parsedData = data.map { line =>        //开始对数据集处理
val parts = line.split(',')          //根据逗号进行分区
LabeledPoint(parts(0).toDouble, Vectors.dense(parts(1).split(' ').map(_.toDouble)))
}.cache()                                                     //转化数据格式
val model = LinearRegressionWithSGD.train(parsedData, 100,0.1) //建立模型
val result = model.predict(Vectors.dense(4,5))     //通过模型预测模型
println(result)            //打印预测结果
}

}
测试数据格式如下:
建立txt文档
1,0 1
2,0 2
3,0 3
5,1 4
7,6 1
9,4 5
运行结果:

                                            
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  线性回归 scala