logstash配置文件(mySql==mongoDB)

1,120 阅读2分钟
input {
  stdin {
  }
  jdbc {
  # 源Mysql数据库地址
  jdbc_connection_string => "jdbc:mysql://rm-m5e7b16r75f9f94r3yo.mysql.rds.aliyuncs.com/mall-pf?autoReconnect=true&useSSL=false"
  #源Mysql的用户名和密码
  jdbc_user => "root"
  jdbc_password => "rot123"

  #true代表记录最后存储的关联列值
  record_last_run => "true"
  use_column_value => "true"
  tracking_column => "id"
  #存储位置
  last_run_metadata_path => "/usr/caeser/logstash-6.1.2/data"
  clean_run => "false"

  #jdbc路径地址
  jdbc_driver_library => "/usr/caeser/mysql_connector/mysql-connector-java-5.1.44-bin.jar"
  # the name of the driver class for mysql
  jdbc_driver_class => "com.mysql.jdbc.Driver"
  jdbc_paging_enabled => "true"
  jdbc_page_size => "50000"
  #以下对应着要执行的sql的绝对路径。
  statement_filepath => "/usr/caeser/logstash"
  #定时字段 各字段含义(由左至右)分、时、天、月、年,全部为*默认含义为每分钟都更新
schedule => "* * * * *"
  }
}

filter {
json {
  source => "message"
  remove_field => ["message"]
  }
}

’#输出mongodb的配置
output {
  stdout { codec => rubydebug }
  mongodb {
#对应mongodb的输出集合
  collection => "goodsDetails"
#对应mongodb的输出数据库名称
  database => "dy_mall_test"
  uri => "mongodb://110.0.12.45:27017"
  }
}

//是否记录上次执行结果, 如果为真,将会把上次执行到的 tracking_column 字段的值记录下来,保存到 last_run_metadata_path 指定的文件中
record_last_run => true

//是否需要记录某个column 的值,如果 record_last_run 为真,可以自定义我们需要 track 的 column 名称,此时该参数就要为 true. 否则默认 track 的是 timestamp 的值.
use_column_value => true

//如果 use_column_value 为真,需配置此参数. track 的数据库 column 名,该 column 必须是递增的.比如:ID.
tracking_column => MY_ID

//指定文件,来记录上次执行到的 tracking_column 字段的值
//比如上次数据库有 10000 条记录,查询完后该文件中就会有数字 10000 这样的记录,下次执行 SQL 查询可以从 10001 条处开始.
//我们只需要在 SQL 语句中 WHERE MY_ID > :last_sql_value 即可. 其中 :last_sql_value 取得就是该文件中的值(10000).
last_run_metadata_path => "/etc/logstash/run_metadata.d/my_info"

//是否清除 last_run_metadata_path 的记录,如果为真那么每次都相当于从头开始查询所有的数据库记录
clean_run => false

//是否将 column 名称转小写
lowercase_column_names => false

//存放需要执行的 SQL 语句的文件位置
statement_filepath => "/etc/logstash/statement_file.d/my_info.sql"