数据采集 采集源配置 nvidia_smi 指标采集
nvidia_smi 指标采集
简介
采集 nvidia_smi 指标数据并上报到 DataFlux 中
前置条件
- 已安装 NVIDIA 显卡和对应驱动,已安装 nvidia_smi
- 已安装 DataKit(DataKit 安装文档)
配置
通过查询 nvidia_smi
程序来获取 GPU 统计信息,包括显存和 GPU 使用情况、温度等。
可以在 linux 中使用 whereis nvidia_smi
命令查看 nvidia_smi
程序所在位置并检验是否安装成功。
进入 DataKit 安装目录下的 conf.d/nvidia
目录,参照其中的 nvidia_smi.conf.sample
编辑一个 nvidia_smi.conf
文件。示例如下:
# Pulls statistics from nvidia GPUs attached to the host
[[inputs.nvidia_smi]]
## Optional: path to nvidia-smi binary, defaults to $PATH via exec.LookPath
# bin_path = "/usr/bin/nvidia-smi"
## Optional: timeout for GPU polling
# timeout = "5s"
在 Windows 系统下,nvidia-smi
程序通常位于 C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe
,在 Windows10 系统可能位于 C:\Windows\System32\nvidia-smi.exe
。
需要使用反斜杠 \
来进行转义,例如:C:\\Program Files\\NVIDIA Corporation\\NVSMI\\nvidia-smi.exe
。
注意:如果对 GPU 进行超频可能会影响到数据的准确度。
采集指标
指标 | 描述 | 类型 |
---|---|---|
name | GPU 型号,例如 GeForce GTX 1070 Ti |
tags |
compute_mode | GPU 计算模式,默认 Default |
tags |
index | GPU 在主板插槽的索引,例如 1 |
tags |
pstate | 超频状态,例如 P0 |
tags |
uuid | GPU 唯一标识码,例如 GPU-f9ba66fc-a7f5-94c5-da19-019ef2f9c665 |
tags |
fan_speed | integer, percentage | fields |
fbc_stats_session_count | integer | fields |
fbc_stats_average_fps | integer | fields |
fbc_stats_average_latency | integer | fields |
memory_free | integer, MiB | fields |
memory_used | integer, MiB | fields |
memory_total | integer, MiB | fields |
power_draw | float, W | fields |
temperature_gpu | integer, degrees C | fields |
utilization_gpu | integer, percentage | fields |
utilization_memory | integer, percentage | fields |
utilization_encoder | integer, percentage | fields |
utilization_decoder | integer, percentage | fields |
pcie_link_gen_current | integer | fields |
pcie_link_width_current | integer | fields |
encoder_stats_session_count | integer | fields |
encoder_stats_average_fps | integer | fields |
encoder_stats_average_latency | integer | fields |
clocks_current_graphics | integer, MHz | fields |
clocks_current_sm | integer, MHz | fields |
clocks_current_memory | integer, MHz | fields |
clocks_current_video | integer, MHz | fields |
示例输出
nvidia_smi,compute_mode=Default,host=8218cf,index=0,name=GeForce\ GTX\ 1070,pstate=P2,uuid=GPU-823bc202-6279-6f2c-d729-868a30f14d96 fan_speed=100i,memory_free=7563i,memory_total=8112i,memory_used=549i,temperature_gpu=53i,utilization_gpu=100i,utilization_memory=90i 1523991122000000000
nvidia_smi,compute_mode=Default,host=8218cf,index=1,name=GeForce\ GTX\ 1080,pstate=P2,uuid=GPU-f9ba66fc-a7f5-94c5-da19-019ef2f9c665 fan_speed=100i,memory_free=7557i,memory_total=8114i,memory_used=557i,temperature_gpu=50i,utilization_gpu=100i,utilization_memory=85i 1523991122000000000
nvidia_smi,compute_mode=Default,host=8218cf,index=2,name=GeForce\ GTX\ 1080,pstate=P2,uuid=GPU-d4cfc28d-0481-8d07-b81a-ddfc63d74adf fan_speed=100i,memory_free=7557i,memory_total=8114i,memory_used=557i,temperature_gpu=58i,utilization_gpu=100i,utilization_memory=86i 1523991122000000000