您的位置：首页 > 理论基础 > 计算机网络

【Stanford机器学习笔记】6-Neural Networks: Representation

2016-05-01 17:20 453 查看

前面讲了线性回归模型和逻辑回归模型，这节主要将神经网络，神经网络是一种非线性分类器，对于特征数量较大的非线性分类问题更加适用。

1. Motivation

前面可知，逻辑回归模型可以解决非线性分类问题，但是对于某些非线性的分类问题，有时逻辑回归模型并不适用，例如对于复杂的非线性分类问题且原始特征数量较大时，利用逻辑回归模型就需要通过构建次数较高的多项式因子进行分类，但是当原始特征数量较大时，构建的多项式模型所包含的特征数量也就越大，使得机器学习模型更加复杂，同时可能还导致过拟合问题，所以针对这种问题，需要构建适用的非线性分类器解决当特征数量较大时的复杂非线性分类问题。神经网络就是其中一种方法。

2. Neurons and the Brain

神经网络算法是基于模拟大脑的工作模式产生的一种算法，上世纪80,90年代初兴起，90年代末开始衰落（主要原因是太复杂，运算速度慢），但是随着计算机技术的发展，包括软件和硬件的提升，运算速度加快，神经网络再次受到人工智能领域的应用。

3. Neural Networks: Representation

（1）神经网络一般包括三个部分：输入层、隐藏层、输出层，每一层都可以包含多个神经元，为了更好的理解，下面定义下需要用到的变量：

a(j)i表示第j层的第i个神经元

Θj表示第j层到第j+1层传输所需的系数矩阵（权重矩阵），它的维数为 sj+1∗（sj+1）

sj表示第j层的神经元个数

hΘ(x)表示激活函数

（2）前向传播神经网络（向量化）

前向传播是指从神经网络的输入层依次计算通过隐藏层，最后得到输出层结果，用向量化表示如下：

第一步:输入层到第一层隐藏层:z(2)=Θ(1)xa(2)=g(z(2))第二步:第一层隐藏层到第二层隐藏层z(3)=Θ(1)a(2)a(3)=g(z(3))第三步:第二层隐藏层到输出层z(4)=Θ(1)a(3)a(4)=g(z(4))