GPU使用进程的查看和管理
2018-03-29 20:04
211 查看
在跑深度学习的时候出现问题
查看GPU使用情况
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 367.48 Driver Version: 367.48 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 106... Off | 0000:01:00.0 On | N/A |
| 32% 41C P2 27W / 120W | 1705MiB / 3012MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 990 C python 61MiB |
| 0 1257 G /usr/bin/X 155MiB |
| 0 27293 C ../../../build/tools/caffe 1273MiB |
| 0 28878 C ../../build/tools/caffe 105MiB |
| 0 29220 C ../../build/tools/caffe 105MiB |
+-----------------------------------------------------------------------------+可以看出当前有6个进程在占用GPU,运行下面的命令关闭相应的进程:kill -9 PID此处的PID为上图中PID列所对应的序列号。
注意:kill -9命令用来强制退出
Check failed: error == cudaSuccess (2 vs. 0) out of memory修改batch_size的大小错误依旧存在,最后发现是一些进程在占用GPU所导致。关闭这些进程,错误消失。
查看GPU使用情况
nvidia-smi显示如下:aicrobo@ubuntu:~$ nvidia-smiThu Mar 29 19:52:48 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 367.48 Driver Version: 367.48 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 106... Off | 0000:01:00.0 On | N/A |
| 32% 41C P2 27W / 120W | 1705MiB / 3012MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 990 C python 61MiB |
| 0 1257 G /usr/bin/X 155MiB |
| 0 27293 C ../../../build/tools/caffe 1273MiB |
| 0 28878 C ../../build/tools/caffe 105MiB |
| 0 29220 C ../../build/tools/caffe 105MiB |
+-----------------------------------------------------------------------------+可以看出当前有6个进程在占用GPU,运行下面的命令关闭相应的进程:kill -9 PID此处的PID为上图中PID列所对应的序列号。
注意:kill -9命令用来强制退出
相关文章推荐
- CentOS7下使用rmcli配置IP地址详解及网络连接状态查看工具和进程管理工具的使用
- 查看哪些服务在使用进程
- 在Windows Mobile和Wince(Windows Embedded CE)下如何使用.NET Compact Framework开发进程管理程序
- 查看进程的内存使用量
- 查看系统当前进程使用情况
- 弹出应用程序: 服务控制管理器 : 在系统启动时至少有一个服务或驱动程序产生错误。详细信息,请使用事件查看器查看事件日志
- Linux 进程和线程查看以及管理
- 【视频】配置信息管理 的 使用方法(三):查看和修改元数据、查看数据库的表视图存储过程等信息
- linux命令 — lsof 查看进程打开那些文件 或者 查看文件给那个进程使用
- 【视频】配置信息管理 的 使用方法(三):查看和修改元数据、查看数据库的表视图存储过程等信息
- 查看和管理进程(二)
- glance查看进程内存使用过大问题
- 使用Process类对进程进行管理
- 进程管理软件SysCheck使用指南
- 查看使用受管理 RAS 服务器的报表
- 查看系统中某个端口被什么进程使用
- linux下查看某进程内存使用(转)
- 查看进程使用的端口的批处理文件
- 【视频】配置信息管理 的 使用方法(三):查看和修改元数据、查看数据库的表视图存储过程等信息
- Solaris系统进程的查看和管理