search
数据采集 采集源配置 nvidia_smi 指标采集

nvidia_smi 指标采集

简介

采集 nvidia_smi 指标数据并上报到 DataFlux 中

前置条件

配置

通过查询 nvidia_smi 程序来获取 GPU 统计信息,包括显存和 GPU 使用情况、温度等。

可以在 linux 中使用 whereis nvidia_smi 命令查看 nvidia_smi 程序所在位置并检验是否安装成功。

进入 DataKit 安装目录下的 conf.d/nvidia 目录,参照其中的 nvidia_smi.conf.sample 编辑一个 nvidia_smi.conf 文件。示例如下:

# Pulls statistics from nvidia GPUs attached to the host
[[inputs.nvidia_smi]]
  ## Optional: path to nvidia-smi binary, defaults to $PATH via exec.LookPath
  # bin_path = "/usr/bin/nvidia-smi"

  ## Optional: timeout for GPU polling
  # timeout = "5s"

在 Windows 系统下,nvidia-smi 程序通常位于 C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe,在 Windows10 系统可能位于 C:\Windows\System32\nvidia-smi.exe

需要使用反斜杠 \ 来进行转义,例如:C:\\Program Files\\NVIDIA Corporation\\NVSMI\\nvidia-smi.exe

注意:如果对 GPU 进行超频可能会影响到数据的准确度。

采集指标

指标 描述 类型
name GPU 型号,例如 GeForce GTX 1070 Ti tags
compute_mode GPU 计算模式,默认 Default tags
index GPU 在主板插槽的索引,例如 1 tags
pstate 超频状态,例如 P0 tags
uuid GPU 唯一标识码,例如 GPU-f9ba66fc-a7f5-94c5-da19-019ef2f9c665 tags
fan_speed integer, percentage fields
fbc_stats_session_count integer fields
fbc_stats_average_fps integer fields
fbc_stats_average_latency integer fields
memory_free integer, MiB fields
memory_used integer, MiB fields
memory_total integer, MiB fields
power_draw float, W fields
temperature_gpu integer, degrees C fields
utilization_gpu integer, percentage fields
utilization_memory integer, percentage fields
utilization_encoder integer, percentage fields
utilization_decoder integer, percentage fields
pcie_link_gen_current integer fields
pcie_link_width_current integer fields
encoder_stats_session_count integer fields
encoder_stats_average_fps integer fields
encoder_stats_average_latency integer fields
clocks_current_graphics integer, MHz fields
clocks_current_sm integer, MHz fields
clocks_current_memory integer, MHz fields
clocks_current_video integer, MHz fields

示例输出

nvidia_smi,compute_mode=Default,host=8218cf,index=0,name=GeForce\ GTX\ 1070,pstate=P2,uuid=GPU-823bc202-6279-6f2c-d729-868a30f14d96 fan_speed=100i,memory_free=7563i,memory_total=8112i,memory_used=549i,temperature_gpu=53i,utilization_gpu=100i,utilization_memory=90i 1523991122000000000
nvidia_smi,compute_mode=Default,host=8218cf,index=1,name=GeForce\ GTX\ 1080,pstate=P2,uuid=GPU-f9ba66fc-a7f5-94c5-da19-019ef2f9c665 fan_speed=100i,memory_free=7557i,memory_total=8114i,memory_used=557i,temperature_gpu=50i,utilization_gpu=100i,utilization_memory=85i 1523991122000000000
nvidia_smi,compute_mode=Default,host=8218cf,index=2,name=GeForce\ GTX\ 1080,pstate=P2,uuid=GPU-d4cfc28d-0481-8d07-b81a-ddfc63d74adf fan_speed=100i,memory_free=7557i,memory_total=8114i,memory_used=557i,temperature_gpu=58i,utilization_gpu=100i,utilization_memory=86i 1523991122000000000