您的位置:首页 > Web前端

ubuntu16.04 显卡1060安装caffe

2017-02-22 21:10 429 查看
首先说明,我的机器是win10+ubuntu16.04 显卡是1060.

一、安装nvidia显卡驱动

1.进入ubuntu系统设置-软件与更新-ubuntu软件,使用的是中科大的源:http://mirrors.ustc.edu.cn/ubuntu,

2.更新Ubuntu16.04源

终端输入
cd /etc/apt/
sudo cp sources.list sources.list.bak
sudo vi sources.list
把下面的这些源添加到source.list中:
deb http://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiverse
deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-security main restricted universe multiverse
deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse
deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-proposed main restricted universe multiverse
deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse
deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiverse
deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-security main restricted universe multiverse
deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse
deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-proposed main restricted universe multiverse
deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse
最后更新源和更新已安装的包:
终端输入
sudo apt-get update
sudo apt-get upgrade

进入ubuntu系统设置-软件与更新-附加驱动中选择下图所示选项进行驱动安装,完成图片设置之后需要重启




3.驱动测试

在终端输入如下命令,显示如图所示则表示安装成功。请保证nvidia驱动安装成功,否则最终结果会受到影响。(注意:这里是针对使用GPU的,如果是CPU模式可以不装。但是搞深度学习,建议使用高性能的设备。)


nvidia-smi




二、cuda安装
前言:cuda的版本和nvidia的版本是想配合的,对应于nvidia的版本选择合适的cuda版本。下面开始后续步骤:
1.下载cuda_8.0.27_linux.run和cudnn-8.0-linux-x64-v5.1.tgz


我的百度网盘:https://pan.baidu.com/s/1i515khB#list/path=%2F

2. 安装cuda8.0

终端输入


cd 下载/
sh cuda_8.0.27_linux.run --override


启动安装程序,一直按空格到100%,输入accept接受条款
输入n不安装nvidia图像驱动,之前已经安装过了(如果之前nvidia驱动木有安装成功,也可以试着接受~)
输入y安装cuda 8.0工具
回车确认cuda默认安装路径:/usr/local/cuda-8.0
输入y用sudo权限运行安装,输入密码
输入y或者n安装或者不安装指向/usr/local/cuda的符号链接
输入y安装CUDA 8.0 Samples,以便后面测试
回车确认CUDA 8.0 Samples默认安装路径:/home/caijiao(记得修改你的名字哦~),该安装路径测试完可以删除

2. 安装cudnn v5.1

终端输入


cd 下载/
tar zxvf cudnn-8.0-linux-x64-v5.1.tgz


解压在下载目录下产生一个cuda目录


cd cuda/include/
sudo cp cudnn.h /usr/local/cuda/include/ 复制头文件
cd ../lib64 打开lib64目录
sudo cp lib* /usr/local/cuda/lib64/ 复制库文件
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*  给所有用户增加这些文件的读权限


3. 建立软链 终端输入


cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.5
sudo ln -s libcudnn.so.5.1.3 libcudnn.so.5
sudo ln -s libcudnn.so.5 libcudnn.so


4. 设置环境变量,终端输入


sudo gedit /etc/profile


在末尾加入


PATH=/usr/local/cuda/bin:$PATH
export PATH


保存后,创建链接文件(或用gedit命令)


sudo vim /etc/ld.so.conf.d/cuda.conf


按a进入插入模式,增加下面一行


/usr/local/cuda/lib64


按esc退出插入模式,按:wq保存退出
最后在终端输入 sudo ldconfig 使链接生效

5. cuda Samples测试

打开CUDA8.0Samples默认安装路径,终端输入


cd /home/caijiao/NVIDIA_CUDA-8.0_Samples
sudo make all -j4 (4核)


注意:如果出现“unsupported GNU version! gcc versions later than 5.3 are not supported!”的错误,这是由于GCC版本过高,在终端输入
cd /usr/local/cuda-7.5/include
sudo cp host_config.h host_config.h.bak
sudo gedit host_config.h
ctrl+f寻找有“5.3”的地方,只有一处,如下
# if __GNUC__ > 5 || (__GNUC__ == 5 && __GNUC_MINOR__ > 9)
#error -- unsupported GNU version! gcc versions later than 5.3 are not supported!
将两个5改成6,即
# if __GNUC__ > 6 || (__GNUC__ == 6 && __GNUC_MINOR__ > 9)
保存退出,继续在终端输入


cd /home/caijiao/NVIDIA_CUDA-8.0_Samples
sudo make all -j4
cd bin/x86_64/linux/release
./deviceQuery


完成之后出现如下图所示,表示成功安装cuda




注意啦:如果没有出现上述“unsupported GNU version! gcc versions later than 5.3 are not supported!”的错误,但是./deviceQuery显示安
4000
装成功,也可能需要修改你的host_config.h文件。具体情况视你的gcc版本定,如果是5.3以上,建议修改。不然后面会报告错误的哦~

三、依赖包安装


sudo apt-get install build-essential #必要的编译工具依赖

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler

sudo apt-get install --no-install-recommends libboost-all-dev

sudo apt-get install libatlas-base-dev

sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev


注意:上述第二个命令可能会报没有完全安装?建议apt-get update 或者 –fix missing , 请更新即执行update命令或独立安装没有安装成功的内容,该命令中涉及的有:protobuf,leveldb,snappy,opencv,hdf5

四、安装python的pip和easy_install,方便安装软件包

终端输入


cd
wget --no-check-certificate https://bootstrap.pypa.io/ez_setup.py sudo python ez_setup.py --insecure
wget https://bootstrap.pypa.io/get-pip.py sudo python get-pip.py


五、安装科学计算和python所需的部分库

终端输入


sudo apt-get install libblas-dev liblapack-dev libatlas-base-dev gfortran python-numpy


六、安装git,拉取源码

终端输入


sudo apt-get install git
git clone https://github.com/BVLC/caffe.git[/code] 
七、安装python依赖

终端输入


sudo apt-get install python-pip 安装pip
sudo su
for req in $(cat "requirements.txt"); do pip install -i https://pypi.tuna.tsinghua.edu.cn/simple $req; done
按Ctrl+D退出sudo su模式


注意:上述第三条命令可能会报木有requirements.txt文件的错误?那么就去caffe目录下面找到它执行啦~

八、编译caffe

终端输入


cd /home/caijiao/caffe
cp Makefile.config.example Makefile.config
gedit Makefile.config


①将USE_CUDNN := 1取消注释,即去掉前面的#号

②INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include 后面打上一个空格 然后添加/usr/include/hdf5/serial如果没有这一句可能会报一个找不到hdf5.h的错误

终端输入


make all -j4


1.过程中如果出现...未定义...的错误,那么可能是有一些东西入opencv木有安装好,请返回前面相应的步骤安装!
终端中输入make clean清除第一次编译结果
再次输入make all -j4重新编译
2. make过程中又出现找不到lhdf5_hl和lhdf5的错误,
解决方案:
在计算机中搜索libhdf5_serial.so.10.1.0,找到后右键点击打开项目位置
该目录下空白处右键点击在终端打开,打开新终端输入
或者用命令进入该文件所在目录:cd /usr/lib/x86_64-linux-gnu
在该目录下执行如下命令:


sudo ln libhdf5_serial.so.10.1.0 libhdf5.so
sudo ln libhdf5_serial_hl.so.10.0.2 libhdf5_hl.so


最后在终端输入sudo ldconfig使链接生效

原终端中再次输入make clean清除第一次编译结果
再次输入make all -j4重新编译

终端输入
make test -j4
make runtest -j4
make pycaffe -j4
make distribute 生成发布安装包

测试python,终端输入
cd /home/caijiao/caffe/python
python
import caffe
如果不报错就说明编译成功
if 随便在哪里开启一个终端 python后import caffe 显示木有caffe模块,那么需要简单设置一下:
source gedit /etc/profile
文件最后增加:PYTHONPATH=/home/caijiao/caffe/python:$PYTHONPATH
其中的/home/caijiao/caffe是我的caffe根目录,请修改成你自己的。
完成之后重启测试,应该可以在任意终端都import caffe 了。
九、mnist测试

下载mnist数据集,终端输入
cd /home/caijiao/caffe/data/mnist/
./get_mnist.sh 获取mnist数据集
在/home/caijiao/caffe/data/mnist/目录下会多出训练集图片、训练集标签、测试集图片和测试集标签等4个文件

mnist数据格式转换,终端输入


cd /home/caijiao/caffe/
./examples/mnist/create_mnist.sh


必须要在第一行之后运行第二行,即必须要在caffe根目录下运行create_mnist.sh
此时在/caffe/examples/mnist/目录下生成mnist_test_lmdb和mnist_train_lmdb两个LMDB格式的训练集和测试集

LeNet-5模型描述在/caffe/examples/mnist/lenet_train_test.prototxt

Solver配置文件在/caffe/examples/mnist/lenet_solver.prototxt

训练mnist,执行文件在/caffe/examples/mnist/train_lenet.sh
终端输入


cd /home/caijiao/caffe/
./examples/mnist/train_lenet.sh


测试结果如下,看到木有99.1%的准确率呢~接下来你就可以训练自己的模型和搭建自己的网络啦~


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  caffe