ATD文档中心 logo ATD文档中心

概述

1、在部署完系统之后,您需要进行日志配置操作,以便ATD可以解析您的日志,进而进行威胁分析。

2、系统支持智能解析手动解析两种方式

智能解析只需要提供原始日志,系统会自动根据日志格式进行自动化匹配出符合条件的多条结果,根据匹配度自上而下排列,选择最准确的一条结果作为解析方式即可。智能解析适用于系统日志的自动化解析,目前支持的日志类型列表在此

手动解析需要提供原始日志,然后根据日志类型选择合适的规则进行递归式解析,直到解析出需要的结果为止。 说明:由于手动解析牵涉较多,下面将重点介绍手动解析方式的流程方式。下图即是两种解析方式,默认是智能解析,只需要把原始日志填入,然后点击解析即可。

3、日志对接分为三步:

(1)日志格式配置,即根据原始日志进行日志类型匹配和字段映射设置,以便系统可以成功解析您的日志;

(2)日志对接配置,即配置TopicName、Zookeeper地址等,以便系统知道从哪里可以获取到您推送的日志;

(3)推日志,在完成日志配置后,您需要将日志推送到Kafka相应的TopicName中。【注意】请勿将不同格式的域名日志推到同一个TopicName下,否则系统将无法完成日志解析且不能进行威胁分析。

智能解析

步骤一:手动解析日志配置

目前,系统支持四种日志类型:

1、logformat

2、JSON

3、正则表达式

4、分隔符

请根据您实际的日志类型,添加相应的日志格式,不同日志类型的配置如下:

1、logformat

(1)日志样例

124.239.189.15 - [2016-07-16T15:56:04+08:00] 2ab80c0cf.yunlian.io "GET /adf/ad.php?abc=select+*+from+information_schema+where+1&testlogintest=test HTTP/1.1" 0.011 401 173 201 "-" "curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.15.3 zlib/1.2.3 libidn/1.18 libssh2/1.4.2" "-"

(2)log_format字段

对于纯文本类型的日志,只需要填写一条原始日志及相应的log_format即可,ATD规定的log_format字段名称如下表所示:

字段名 解释 默认值
*remote_addr 客户端IP地址 -
*request_uri 请求的uri -
*http_host 请求地址(域名) 必填
http_x_forwarded_for 反向客户端IP地址 -
time_local 通用日志格式下的本地时间 -
status 请求返回的状态码 200
hostname 日志来源 -
remote_user 客户端用户名称 -
method http请求方法 GET
body_bytes_sent 发送给客户端的字节数,不包括响应头的大小 0
bytes_sent 发送给客户端的总字节数 -
http_referer 记录从哪个页面链接访问过来的 -
http_user_agent 记录客户端浏览器相关信息 chrome
request_length 请求的长度(包括请求行,请求头和请求正文) 0
request_time 请求处理时间,单位为秒,精度毫秒 0
upstream_status upstream返回的状态码信息 -
upstream_addr 后端upstream地址,真正提供服务的主机地址 -
upstream_response_time upstream响应时间 0

(3)log_format格式要求

  • 如果您的日志是文本格式,请务必使用ATD指定的字段名称定义log_format,否则ATD将无法完成日志解析;
  • 字段名以$为前缀,例如:$remote_addr
  • 含有“*”字符的字段必须指定的字段;
  • 如果您的日志中没有http_host,您可以在配置页面上设置http_host的默认值;
  • log_format中的字段必须按顺序与原始日志中的字段一一对应,如果您的日志中包含上述字段之外的字段,可自定义名称,如:field1

(4)配置示例

原始日志:

124.239.189.15 - [2016-07-16T15:56:04+08:00] 2ab80c0cf.yunlian.io "GET /adf/ad.php?abc=select+*+from+information_schema+where+1&testlogintest=test HTTP/1.1" 0.011 401 173 201 "-" "curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.15.3 zlib/1.2.3 libidn/1.18 libssh2/1.4.2" "-"

log_format:

$remote_addr $remote_user [$time_local] $http_host "$method $request_uri $http" $request_time $status $body_bytes_sent $request_length "$http_referer" "$http_user_agent" "$http_x_forwarded_for"

logformat解析

2、 JSON

(1)日志样例

{"remote_addr":"124.239.189.115","time_local":"2017-06-29T15:25:59+08:00","scheme":"http","http_host":"yunlian.io","method":"GET","request_uri":"/adf/logining/ad.php?abc=test","request_time":"1.187","status":"200","upstream_addr":"192.168.11.207","upstream_status":"200","upstream_response_time":"1.187","request_length":"2054","body_bytes_sent":"1181","http_referer":"http://2ab80c0cf.yunlian.io/123456.html","http_user_agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36","http_x_forwarded_for":"124.239.189.115","hostname":"node001131"}

(2)配置示例

如果您的日志如上样例所示,您只需上传一条原始日志,并在界面中设置映射关系即可。

(3)注意事项

如果是JSON格式数据,请不要格式化数据,也即是原始日志是一行完整的JSON格式数据,而不是多行格式化的数据。

json解析

3、正则表达式

(1)日志样例

Jan 31 15:39:54 xm11-112 sshd[4187]: Received disconnect from 172.18.14.184 port 62750:11: disconnected by user

(2)配置示例

(?<date>\w{3}\s+\d{1,2}\s\d\d:\d\d:\d\d)\s(?<dst>\S+)\s+(?<pid>[^:]*):\s+(?<message>.*)

正则解析

4、分隔符

(1)日志样例

18:21:02 [pid:123] [MOC]ip=1.1.1.1,host=bjp123,message=loginsuccess

(2)配置示例

分隔符解析方式首先进行字段分割,字段分割分为:”,”、”|”、”:”、”&”、”;”、”自定义”方式,采用分隔符解析字段分隔符必选。其次根据实际情况是否对字段分隔符解析进行K-V形式解析,K-V形式解析包括:”=”、”:”、”自定义”。无论是分隔符或K-V都可以多段并行解析,也即是可以同时存在多个字段分隔符或K-V分隔符。 针对上述日志样例,字段分隔符采用”,”,K-V分隔符采用”=”,如下图所示: 分隔符解析

步骤二:日志对接配置

在成功完成日志格式配置后,您可以对某个日志格式进行对接配置,选择使用系统的Kafka或是您私有的Kafka,在选择了您私有的Kafka后,您需要设置TopicName、Zookeeper地址或Kafka地址。

步骤三:推日志

1、在完成日志配置后,您需要将日志推送到Kafka相应的TopicName中。 【注意】请勿将不同格式的域名日志推到同一个TopicName下,否则ATD将无法完成日志解析且不能进行威胁分析。 2、在进行推日志操作时,您可以根据每个日志格式后对应的文档说明来进行推日志操作。

四种推日志方式介绍

系统支持多种给Kafka推送日志的方式,每种方式有推荐使用场景,以下是几种推送方式优缺点介绍:

1、优先推荐Kafkacat推送方式

优势:

由C语言开发,资源消耗少。

劣势:

(1)推送日志文件的名称固定,有做日志切割的日志文件在切割完成后必须保持文件名不变,如nginx_access.log。 (2)不支持修改日志中的字段,只支持简单的过滤操作。

2、Rsyslog推送方式

优势:

由C语言开发,资源消耗少,支持通配符及新产生文件内容的推送,如/data0/logs/*.log。

劣势:

(1)需要升级rsyslog以及安装rsyslog-kafka插件进行推送,可能需要下载依赖包。 (2)不支持修改日志中的字段,只支持简单的过滤操作

3、Filebeat推送方式

优势:

由GO语言开发,相比于Java语言开发的logstash资源消耗少一些,可以过滤及简单的修改日志中的字段,支持通配符及新产生文件内容的推送,依赖包较少。

劣势:

(1)相比于C语言开发的工具如rsyslog、kafkacat资源消耗更多一些。 (2)不能精确修改日志中的字段。

4、Logstash推送方式

优势:

由Java语言开发,可精确修改日志中的字段,支持通配符及新产生文件内容的推送,依赖包较少。

劣势:

资源消耗比另外几种推送工具高。