search
数据采集 采集源配置 Github 数据指标采集

Github 数据指标采集

简介

采集 Github 上项目相关的信息上报到 DataFlux 中

前置条件

配置

进入 DataKit 安装目录下的 conf.d/github 目录,复制 github.conf.sample 并命名为 github.conf。示例如下:

[[inputs.github]]
  ## List of repositories to monitor
  repositories = [
      "influxdata/telegraf",
      "influxdata/influxdb"
  ]

  ## Github API access token.  Unauthenticated requests are limited to 60 per hour.
  # access_token = ""

  ## Github API enterprise url. Github Enterprise accounts must specify their base url.
  # enterprise_base_url = ""

  ## Timeout for HTTP requests.
  # http_timeout = "5s"

配置好后,重启 DataKit 即可生效

采集指标

指标集:github_repository

标签

标签名 描述
name 仓库名
owner 仓库拥有者
language 主要开发语言
license 授权

指标

指标 描述 类型 单位
forks forks次数 int
open_issues open issue 个数 -
networks - int -
size - int -
subscribers 订阅者个数 int
stars Star 个数 int
watchers Watcher 格式 int

指标集:internal_github

需开启了 internal 配置。进入 DataKit 安装目录下的 conf.d/internal 目录,复制 internal.conf.sample 并命名为 internal.conf。示例如下:

[[inputs.internal]]
collect_memstats = true

标签

标签名 描述
access_token -
version -

指标

指标 描述 类型 单位
rate_limit_limit 每小时请求限制次数 int 次/小时
rate_limit_remaining 每小时剩余请求次数 int 次/小时
rate_limit_blocks 因限流拒绝的请求次数 int