nvidia-smi命令详解
nvidia-smi命令详解(https://blog.csdn.net/daydayup858/article/details/131633445)
nvidia-smi(NVIDIA System Management Interface)是一种命令行实用程序,用于监控和管理 NVIDIA GPU(图形处理器)的状态和性能。它提供了一种简单而强大的方式来获取有关 GPU 的实时信息,并且可以用于诊断、优化和管理 GPU 资源。
在大多数情况下,nvidia-smi
是与 NVIDIA GPU 驱动程序一起安装的,当安装 NVIDIA GPU 驱动程序时,nvidia-smi
工具通常会自动包含在驱动程序软件包中,并在安装过程中将其放置在适当的位置。
界面参数介绍
- GPU:本机中的GPU编号,从0开始,上图为0,1,2,3四块GPU
- Fan:风扇转速(0%-100%),N/A表示没有风扇
- Name:GPU名字/类型,上图四块均为NVIDIA GeForce RTX 3080
- Temp:GPU温度(GPU温度过高会导致GPU频率下降)
- Perf:性能状态,从P0(最大性能)到P12(最小性能),上图均为P2
- Pwr:Usager/Cap:GPU功耗,Usage表示用了多少,Cap表示总共多少
- Persistence-M:持续模式状态,持续模式耗能大,但在新的GPU应用启动时花费时间更少,上图均为On
- Bus-Id:GPU总线
- Disp.A:Display Active,表示GPU是否初始化
- Memory-Usage:显存使用率
- Volatile GPU-UTil:GPU使用率,与显存使用率的区别可参考显存与GPU
- Uncorr. ECC:是否开启错误检查和纠错技术,0/DISABLED,1/ENABLED,上图均为N/A
- Compute M:计算模式,0/DEFAULT,1/EXCLUSIVE_PROCESS,2/PROHIBITED,上图均为Default
- Processes:显示每个进程占用的显存使用率、进程号、占用的哪个GPU
nvidia-smi
常用选项
- -h 查看帮助手册:nvidia-smi -h
- 动态地观察 GPU 的状态:watch -n 0.5 nvidia-smi
- -i 查看指定GPU:nvidia-smi -i 0
- -L 查看GPU列表及其UUID:nvidia-smi -L
- -l 指定动态刷新时间,默认5秒刷新一次,通过Ctrl+C停止:nvidia-smi -l 5
- -q 查询GPU详细信息:nvidia-smi -q
- 只列出某一GPU的详细信息,可使用 -i 选项指定:nvidia-smi -q -i 0
- 在所有 GPU 上启用持久性模式:nvidia-smi -pm 1
- 指定开启某个显卡的持久模式:nvidia-smi -pm 1 -i 0
- 以 1 秒的更新间隔监控整体 GPU 使用情况:nvidia-smi dmon
- 以 1 秒的更新间隔监控每个进程的 GPU 使用情况:nvidia-smi pmon
发表评论