欢迎光临
我们一直在努力

(空想场景)使用 Prometheus 监控特定日志行数

感谢 @云原生小白 提供线索

在系统的监控过程中,有时我们只是想要知道一些特定内容的出现数量或者频度,并不关心他的具体内容,而且也不想特意部署一个 Loki 或者 Elasticsearch,这时就可以使用 Fluentd 花里胡哨的插件功能来完成任务了。

Fluentd 有一个 Prometheus 插件,能够提供 Prometheus 接口提供采集数据,插件需要用 fluent-gem 进行安装,如果在 Docker 中的话,可以使用下列 Dockerfile:

FROM fluentd:v1.9.1-1.0
USER root
RUN fluent-gem install fluent-plugin-prometheus
USER fluent

这个插件的基本配置方式是,提供一个 promethues 的类型,包含一个 元素用于对指标结构进行定义。例如文档中使用的:

  @type prometheus
  
    name fluentd_input_status_num_records_total
    type counter
    desc The total number of incoming records
    
      tag ${tag}
      hostname ${hostname}
    

这种指标放在 用于指示输入数量,而放在 中则可以监控输出数量。

这里定义了一个名为 fluentd_input_status_num_records_total 的指标,其类型为 counter

定义指标之后,还要将其暴露给 Prometheus:


  @type prometheus
  bind 0.0.0.0
  port 24231
  metrics_path /metrics

这段配置定义了一个监听 24231 端口的 Prometheus 端点,路径为 /metrics

举个栗子

接下来用一个完整场景来展示这个例子,假设我们要监控 /logs/input.txt 中的 warning 数量,会采用文末的完整配置,分段解释如下:

  1. 段定义采集文件名称
  2. 第一个 中使用 @type promethues 来监控输入数量,生成指标 fluentd_input_status_num_records_total,类型为 counter
  3. 第二个 @type grep 的正则表达式插件对输入进行过滤
  4. 节中使用 @type copy 对输出进行分流
  5. 第一个 输出 fluentd_output_status_num_records_total 的 Promethues 指标,对过滤出来的文本进行计数
  6. 第二个 将输出内容展示在 stdout

配置结束之后启动采集过程,可以使用类似如下脚本:

#!/bin/sh
docker run -it --rm 
        -v $(pwd)/etc:/etc/fluentd 
        -v $(pwd)/log:/data 
        -p 12345:12345 
        fluentd:prom 
        fluentd -c /etc/fluentd/fluentd.conf

启动之后,我们向日志中输出内容,例如 echo "warn" >> input.txt,会看到 fluentd 日志输出了类似 2021-08-14 07:06:55.688191458 +0000 custom.log: {"message":"warn"} 的内容,如果使用 curl 访问开放出来的 :12345/metrics,会看到输出中的如下内容:

fluentd_input_status_num_records_total{tag="custom.log",hostname="757214c8a91a"} 2.0      │➜  log  vim fluentd.conf
fluentd_output_status_num_records_total{tag="custom.log",hostname="757214c8a91a"} 1.0

这是很常见的指标格式,如果在 Kubernetes 中,对 Pod 进行注解,纳入采集范围,就可以像其它监控指标一样使用了。

fluentd.conf


  @type tail
  path /data/input.txt
  pos_file /data/input.pos
  tag custom.log
  
    @type none
  
  @type prometheus
  
    name fluentd_input_status_num_records_total
    type counter
    desc The total number of incoming records
    
      tag ${tag}
      hostname ${hostname}
    
  @type grep
  
    key message
    pattern /warn/
  
  @type copy
  
    @type prometheus
    
      name fluentd_output_status_num_records_total
      type counter
      desc The total number of outgoing records
      
        tag ${tag}
        hostname ${hostname}
      
    @type stdout

  @type prometheus
  bind 0.0.0.0
  port 12345
  metrics_path /metrics

  @type prometheus_output_monitor
  interval 10
  
    hostname ${hostname}
  

文章来源于互联网:(空想场景)使用 Prometheus 监控特定日志行数

赞(0)
未经允许不得转载:莱卡云 » (空想场景)使用 Prometheus 监控特定日志行数