您的位置：首页 > 其它

logistic回归+梯度下降算法

2018-02-21 17:55 316 查看

logisitic回归

假设现在有一些数据点，我们利用一条直线对这些点进行拟合(该线称为最佳拟合直线)，这个拟合过程就称作为回归。我们希望接收所有的输出，然后预测出类别。在两个类别的情况下，输出0，1来代表，这种函数是单位阶跃函数。

sigmoid函数具有该性质:

sigmoid函数公式是：

sigmoid(z)=11+exp(−z)sigmoid(z)=11+exp(−z)

sigmoid函数的性质可以作为分类器，输入为z

z=w0∗x0+w1∗x1+...+wn∗xnz=w0∗x0+w1∗x1+...+wn∗xn

如果使用向量表示，输入向量均为列向量：输入z:

z=w⃗ T⋅x⃗ z=w→T⋅x→

n为特征个数。比如下面的例子中，只有两个特征，可以在二维平面上画出并分类。

梯度下降算法

要寻求某个某个函数的最小值，最好的方法是沿着梯度的反方向，即沿着下降速率最快的方向。在Andrew Ng的斯坦佛课堂上，有动态图的演示，方便理解。这种方法，可能会找到局部最优解（local optimum)，而不是全局最优解（global optimum）。

假设更新步长是alpha，那么根据梯度下降算法，回归系数可以由下面的式子进行更新：

w:=w−α∗∇f(w)w:=w−α∗∇f(w)

在上述更新参数的式子中，是对模型的预测值求梯度，实际上并不需要这样做。可以通过数学推导，可以变化成一种更方便操作的形式。

python实战代码

"""""
Author:
xinming
Modify：
2018/02/21
"""
import numpy as np
import matplotlib.pyplot as plt
def load_data_set():
fo = open('F:\pythonProject\MLIAcode\Ch05/testSet.txt')#注意\t变成了制表符。
data_mat=[] ;label_mat=[]
for line in fo.readlines():
list = line.strip().split()
data_mat.append([1,float(list[0]),float(list[1])])#w0*x0+w1*x1+w2*x2,x0设为1，w0设为常系数
label_mat.append(int(list[2])) #需要强制转换数据类型，否则为字符
return data_mat,label_mat
def sigmoid(x):
return 1.0/(1+np.exp(-x))
def logistic_reg_grad_descent(data_mat,label_mat):
data_matrix = np.mat(data_mat) #100行3列
label_matrix=np.mat(label_mat).transpose() #是行向量故要转置
m,n=np.shape(data_mat)  #n为特征个数，共有三个：x0,x1,x2
#print(m,n)
alpha = 0.001  #定义更新的步长
weights = np.ones((n,1))#初始化参数为1 3行1列
max_cycles = 500#书中直接把迭代次数赋值为500
for k in range(max_cycles):
h = sigmoid(data_matrix*weights)#hypothesis,预测值
error=h-label_matrix #m行1列，m组数据
weights=weights-alpha*data_matrix.transpose()*error #梯度下降的参数更新，可以由求导转化为这种乘积形式
return weights
def plot_best_fit():
data_mat,label_mat=load_data_set()
wei = logistic_reg_grad_descent(data_mat,label_mat) #<class 'numpy.matrixlib.defmatrix.matrix'>
print(type(wei))
weights = wei.getA()#<class 'numpy.ndarray'> getA()函数将numpy矩阵转换为数组
print(type(weights))
print(weights)
data_array = np.array(data_mat) #转换为numpy矩阵，方便操作
n ,m= np.shape(data_array) #矩阵的行数
x_cor1=[];y_cor1=[]
x_cor2=[];y_cor2=[]
for i in range(n):
if label_mat[i]==1:
x_cor1.append(data_array[i,1])
y_cor1.append(data_array[i,2])
else:
x_cor2.append(data_array[i,1])
y_cor2.append(data_array[i,2])
fig  = plt.figure()
ax=fig.add_subplot(111)#返回Axes类，并实例化为ax对象
ax.scatter(x_cor1,y_cor1,c='red',marker='s')#类别为1的设置为红色方块
ax.scatter(x_cor2,y_cor2,c='green')#类别为0的设置为绿色
x=np.arange(-3,3,0.1)
y=(-weights[0]-weights[1]*x)/weights[2]
ax.plot(x,y)
plt.show()

最后运行的效果如下：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航