search
快速入门 2.数据采集

数据采集

DataKit 简介

DataKit 是 DataFlux 官方发布的数据采集应用,支持上百种数据的采集。DataKit 采集数据后需发送到 DataWay 数据网关。DataKit 需部署到用户自己的 IT 环境中,支持多个操作系统。

本文档介绍 DataFlux 用户和 DataFlux Pro 用户如何通过安装和配置 DataKit 采集数据;以及如何通过 DataMock 数据模拟器生成模拟数据,DataMock生成模拟数据可用于构建和验证数据洞察场景。

安装 DataKit

DataFlux 用户可登录云端 DataFlux Studio 控制台后,进入「管理」-「数据网关」,在“部署采集器”中选择 DataWay 地址、安装系统、系统类型,复制 DataKit 安装指令,然后在服务器中执行。

DataFlux Pro 用户可登录 DataFlux Studio 控制台后,进入「集成」页面,找到 DataKit 并打开,然后按照 DataKit 帮助文档进行配置。

配置 DataKit

DataKit 安装后,可进入 DataKit 安装目录进行配置。

  • Linux/Mac 默认安装目录为 /usr/local/cloudcare/dataflux/datakit
  • Windows 32 位默认安装目录为 C:\Program Files (x86)\dataflux\datakit
  • Windows 64 位默认安装目录为 C:\Program Files\dataflux\datakit

采集源配置文件夹为 conf.d,找到你需要配置的采集源配置目录,即可进行数据采集配置。

DataKit 支持黑白名单配置,更多详情参考 DataKit 帮助文档中的“配置采集器“。

通过 DataMock 数据模拟器生成模拟数据

登录 DataFlux 后,进入「集成」,找到 DataMock 数据模拟器,点击进入 DataMock 模拟器帮助文档。

目前 DataMock 支持 Windows、Linux、Mac OS 三种操作系统,可根据你的操作系统下载对应的程序包,然后按照帮助文档进行配置即可。

注意:在进行 DataMock 配置时需将 DataWay 地址配置为之前获取的 DataWay 地址