数据采集 采集源配置 CSV/Excel 采集器
CSV/Excel 采集器
简介
读取CSV/EXCEL文件,并转换成行协议数据并上报到 DataFlux 中。
前置条件
- 已安装 DataKit (DataKit 安装文档)
- 已安装 Python3(Python3 各个平台版本下载)
- 已安装 Python依赖包,进入DataKit 安装目录
externals/csv
,执行pip install -r requirement.txt
配置
进入 DataKit 安装目录下的 conf.d/csvmetric
目录,复制 csvmetric.conf.sample
并命名为 csvmetric.conf
。示例如下:
设置:
#[[inputs.csvmetric]]
# pythonEnv = "python3" # Python环境路径,选填,若不填默认使用python3
# file = "/path/your/csvfile.csv" # 待采集csv/excel路径及文件名,必填
# startRows = 0 # 文件表头行号(从0开始编号),选填,默认为0
# interval = "60s" # 采集周期
# metric = "metric-name" # 指标集名,必填
# tags = ["column-name1","column-name2"] # tag列名,选填
# [inputs.csvmetric.timestamp] # 时间戳所在列名,选填,若不填取当前时间
# column = "column" # 时间戳列名,必填
# timeFormat = "15/08/27 10:20:06" # 时间戳格式,timeFormat与precision选填一个
# precision = "ns" # 时间单位(秒:s,毫秒:ms,微秒:us,纳秒:ns),timeFormat与precision选填一个
#
# [[inputs.csvmetric.field]] # field配置,可配置多项,选填,若不填除去上述所有配置列外均为field
# column = "column-name3" # field列名
# nullOp = "ignore" # 为空值时采取动作(忽略:ignore,丢弃:drop,终止:abort,填充:fill),选填,默认为ignore
# nullFill = "default-value" # 为空时填充值,仅当nullOp="fill"时有效
# type = "int" # 列类型(整型:int,浮点型:float,布尔型:bool,字符串型:str),选填,默认为str
# [[inputs.csvmetric.field]] # 同上
# column = "column-name4"
# nullOp = "drop"
# nullFill = "default-value"
# type = "str"
配置好后,重启 DataKit 即可生效。
采集数据
采集数据的格式由用户配置决定
关键事件
该数据源无关键事件数据
日志
该数据源无日志