caffe mnist测试Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNA
2017-07-06 01:04
871 查看
在caffe runtest 均通过的情况下,测试mnist出现(copy他人的,记忆中一样一样的)
F0616 16:54:55.034394 3070141376 cudnn_conv_layer.cpp:53] Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNAL_ERROR
*** Check failure stack trace: ***
@ 0x112de40ce google::LogMessage::Fail()
@ 0x112de33ad google::LogMessage::SendToLog()
@ 0x112de3ab3 google::LogMessage::Flush()
@ 0x112de6d03 google::LogMessageFatal::~LogMessageFatal()
@ 0x112de43b7 google::LogMessageFatal::~LogMessageFatal()
@ 0x10fb4ee3f caffe::CuDNNConvolutionLayer<>::LayerSetUp()
@ 0x10fbc5267 caffe::Net<>::Init()
@ 0x10fbc3fce caffe::Net<>::Net()
@ 0x10fbdc2ca caffe::Solver<>::InitTrainNet()
@ 0x10fbdb6a1 caffe::Solver<>::Init()
@ 0x10fbdb3a5 caffe::Solver<>::Solver()
@ 0x10fbea496 caffe::SGDSolver<>::SGDSolver()
@ 0x10fbef8f2 caffe::Creator_SGDSolver<>()
@ 0x10fa8b5dd train()
@ 0x10fa8ddc1 main
@ 0x7fffae2c1255 start
@ 0x3 (unknown)
出现这种问题参考网上答案:
1. GPU计算力小于3,在运行caffe时应设置cudnn = OFF;
2. 内存溢出,GPU内存不够了,关掉不需要运行的软件;
3. Caffe Makefile.config设置的不对,根据自己情况设置后,在当前caffe目录下make clean,再重新编译;
4. 以上都不能解决我的问题(1080Ti内存11G,计算力6.1,跑mnist怎么可能溢出,Makefile.config也确定没有问题)
因为我经常会提示usr/bin 不在环境变量中,导致sudo等很多命令不能使用,因此我也修改了/etc/profile;在执行auto clean,upgrade后,重启后
首先出现循环登录问题,这个可能时由于系统更新也可能是由于profile文件修改不对(这个最后没改,系统也好用了,所以应该不是这个问题)
解决方法参考(看自己属于哪种情况,我的卸载显卡驱动重新安装就好了)
1. 重新安装显卡驱动(进入控制台--关闭图像显示--卸载NVIDIA显卡--打开图像显示--返回系统,可以登陆了,再重新安装NVIDIA驱动)
2 .修改回原来的profile点击打开链接
按照步骤1.进入后发现底边栏不见了,cd 命令不好使了,终端无法移动等等问题,总之窗口freeze
解决办法:重新安装unity,貌似系统更新时删除掉了unity,参考链接点击打开链接
这时发现最初mnist测试的bug不见了!!!
可能是
1.系统更新解决了bug
2.显卡驱动由384换成381.22
菜鸟好懵~
F0616 16:54:55.034394 3070141376 cudnn_conv_layer.cpp:53] Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNAL_ERROR
*** Check failure stack trace: ***
@ 0x112de40ce google::LogMessage::Fail()
@ 0x112de33ad google::LogMessage::SendToLog()
@ 0x112de3ab3 google::LogMessage::Flush()
@ 0x112de6d03 google::LogMessageFatal::~LogMessageFatal()
@ 0x112de43b7 google::LogMessageFatal::~LogMessageFatal()
@ 0x10fb4ee3f caffe::CuDNNConvolutionLayer<>::LayerSetUp()
@ 0x10fbc5267 caffe::Net<>::Init()
@ 0x10fbc3fce caffe::Net<>::Net()
@ 0x10fbdc2ca caffe::Solver<>::InitTrainNet()
@ 0x10fbdb6a1 caffe::Solver<>::Init()
@ 0x10fbdb3a5 caffe::Solver<>::Solver()
@ 0x10fbea496 caffe::SGDSolver<>::SGDSolver()
@ 0x10fbef8f2 caffe::Creator_SGDSolver<>()
@ 0x10fa8b5dd train()
@ 0x10fa8ddc1 main
@ 0x7fffae2c1255 start
@ 0x3 (unknown)
出现这种问题参考网上答案:
1. GPU计算力小于3,在运行caffe时应设置cudnn = OFF;
2. 内存溢出,GPU内存不够了,关掉不需要运行的软件;
3. Caffe Makefile.config设置的不对,根据自己情况设置后,在当前caffe目录下make clean,再重新编译;
4. 以上都不能解决我的问题(1080Ti内存11G,计算力6.1,跑mnist怎么可能溢出,Makefile.config也确定没有问题)
因为我经常会提示usr/bin 不在环境变量中,导致sudo等很多命令不能使用,因此我也修改了/etc/profile;在执行auto clean,upgrade后,重启后
首先出现循环登录问题,这个可能时由于系统更新也可能是由于profile文件修改不对(这个最后没改,系统也好用了,所以应该不是这个问题)
解决方法参考(看自己属于哪种情况,我的卸载显卡驱动重新安装就好了)
1. 重新安装显卡驱动(进入控制台--关闭图像显示--卸载NVIDIA显卡--打开图像显示--返回系统,可以登陆了,再重新安装NVIDIA驱动)
2 .修改回原来的profile点击打开链接
按照步骤1.进入后发现底边栏不见了,cd 命令不好使了,终端无法移动等等问题,总之窗口freeze
解决办法:重新安装unity,貌似系统更新时删除掉了unity,参考链接点击打开链接
这时发现最初mnist测试的bug不见了!!!
可能是
1.系统更新解决了bug
2.显卡驱动由384换成381.22
菜鸟好懵~
相关文章推荐
- 【caffe训练mobilenet】报错:Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNAL_ER
- digits训练时报错 CUDNN_STATUS_SUCCESS (4 vs. 0)
- caffe make runtest error(core dumped)Check failed: status == CUDNN_STATUS_SUCCESS (6 vs. 0)
- Check failed: status == CUDNN_STATUS_SUCCESS (3 vs. 0) CUDNN_STATUS_BAD_PARAM
- caffe make runtest error(core dumped)Check failed: status == CUDNN_STATUS_SUCCESS (6 vs. 0)
- 【Caffe】Check failed: status == CUDNN_STATUS_SUCCESS (3 vs. 0) CUDNN_STATUS_BAD_PARAM
- 【caffe】Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNAL_ERRO
- caffe:Check failed: status == CUDNN_STATUS_SUCCESS (3 vs. 0) CUDNN_STATUS_BAD_PARAM
- 运行caffe时报错:Check failed: status == CUDNN_STATUS_SUCCESS
- Windows下编译CAFFE+CUDA, 运行时提示status == CUDNN_STATUS_SUCCESS错误
- Windows下编译CAFFE,status == CUDNN_STATUS_SUCCESS,关闭CUDNN
- Check failed: status == CUBLAS_STATUS_SUCCESS (11 vs. 0) CUBLAS_STATUS_MAPPING_ERROR
- VS2013 + CUDA9.1 + CUDNN5.1 + Caffe配置过程
- CUDNN_STATUS_NOT_INITIALIZED 解决办法
- caffe cudnn出现错误: declaration is incompatible with "const char *cudnnGetErrorString(cudnnStatus_t)"
- tensorflow 1.4 could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR 错误的解决办法
- tensorflow 1.4 could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR 错误的解决办法
- could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
- mxnet CUDNN_STATUS_ALLOC_FAILED 错误 cudnn出错
- (原)torch使用caffe时,提示CUDNN_STATUS_EXECUTION_FAILED