一、ELK 是什么?

ELK = Elasticsearch + Logstash + Kibana

  • Elasticsearch:后台分布式存储以及全文检索。
  • Logstash: 数据导入导出的工具。
  • Kibana:数据可视化展示界面。

ELK架构为数据分布式存储、可视化查询和日志解析创建了一个功能强大的管理链。 三者相互配合,取长补短,共同完成分布式大数据处理工作。

注意: ELK技术栈有 version check,软件大版本号需要一致,本文以 6.4.0 版本为例。

二、Elasticsearch

源码下载地址:https://www.elastic.co/cn/downloads/past-releases#elasticsearch

2.1、下载 Elasticsearch 源码

1
2
mkdir -p /usr/local/elk/es1; cd /usr/local/elk/es1
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.4.0.tar.gz

2.2、创建 es 用户

1
useradd es

2.3、解压源码并修改其所有者

1
2
tar zxvf elasticsearch-6.4.0.tar.gz 
chown -R es:es elasticsearch-6.4.0

2.4、设置新的 Elasticsearch 的数据存储路径

创建目录并设置目录的所属用户:

1
2
mkdir -p /data/elasticsearch/es1/data
chown -R es:es /data/elasticsearch/es1/data

2.5、修改 Elasticsearch 的配置文件

修改Elasticsearch的配置文件:/usr/local/elk/es1/elasticsearch-6.4.0/config/elasticsearch.yml

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
cluster.name: elasticsearch 

node.name: es-1

path.data: /data/elasticsearch/es1/data

bootstrap.memory_lock: true

network.host: 192.168.167.205

http.port: 9200

transport.tcp.port: 9300

discovery.zen.ping.unicast.hosts: ["node205.data:9300","node205.data:9301","node205.data:9302"]

discovery.zen.minimum_master_nodes: 2

gateway.recover_after_nodes: 1

action.destructive_requires_name: true

2.6、后台启动 Elasticsearch

Elasticsearch 不能以 root 用户启动,所以改用 es 用户启动。

1
2
3
su - es
cd /usr/local/elk/es1/elasticsearch-6.4.0
./bin/elasticsearch –d

可根据 logs/elasticsearch.log 文件来监测 Elasticsearch 服务运行状况。

注意:如果Elasticsearch服务启动失败,可参考 第五章 FAQ 处理问题。

2.7、停止Elasticsearch

根据 Elasticsearch 的端口号来停止该服务:

1
netstat -ntlp | grep 9200 | awk '{print $7}' | awk -F '/' '{print $1}' | xargs kill -9

三、Logstash

Logstash 是开源的服务器端数据处理管道,能够同时 从多个来源采集数据、转换数据,然后将数据发送到您最喜欢的 “存储库” 中。logstash收集日志基本流程为:

Input –> filter –> output

源码下载地址:https://www.elastic.co/cn/downloads/logstash

1.1、下载Logstash源码

1
2
cd /usr/local/elk 
wget https://artifacts.elastic.co/downloads/logstash/logstash-6.4.2.tar.gz

1.2、创建 es 用户(如已创建,请略过该步骤)

1
useradd es

1.3、解压源码并修改其所有者

1
2
tar zxvf logstash-6.4.0.tar.gz 
chown -R es:es logstash-6.4.0

1.4、示例:将mysql表数据导入到Elasticsearch

1.4.1、创建配置文件
1
2
su - es
cp -r config/logstash-sample.conf config/face.conf

修改 face.conf 配置文件如下所示:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
# Sample Logstash configuration for creating a simple
# Beats -> Logstash -> Elasticsearch pipeline.

input {
jdbc{
jdbc_connection_string => "jdbc:mysql://192.168.167.204:3316/db0?useUnicode=true&characterEncoding=utf8&useSSL=false&serverTimezone=Asia/Shanghai&tinyInt1isBit=false"
jdbc_user => "mycat"
jdbc_password => "mycat123"
jdbc_driver_library => "/usr/local/mysql-connector-java-5.1.46.jar"
jdbc_driver_class => "com.mysql.jdbc.Driver"
jdbc_paging_enabled => "true"
jdbc_page_size => "50000"
jdbc_default_timezone =>"Asia/Shanghai"
statement_filepath => "./sql/face.sql"
schedule => "* * * * *"
# type => "mycat"
# 是否记录上次执行结果, 如果为真,将会把上次执行到的 tracking_column 字段的值记录下来,保存到 last_run_metadata_path 指定的文件中
record_last_run => true
# 是否需要记录某个column 的值,如果record_last_run为真,可以自定义我们需要 track 的 column 名称,此时该参数就要为 true. 否则默认 track 的是 timestamp 的值.
use_column_value => true
# 如果 use_column_value 为真,需配置此参数. track 的数据库 column 名,该 column 必须是递增的. 一般是mysql主键
tracking_column => "id"
tracking_column_type => "numeric"
last_run_metadata_path => "./face_last_id"
lowercase_column_names => false
}
}

filter {
if [sex] == 1 {
mutate {
add_field => { "tags" => "男"}
}
}
if [sex] == 2 {
mutate {
add_field => { "tags" => "女"}
}
}
if [sex] == 0 {
mutate {
add_field => { "tags" => "未知"}
}
}
}

output {
elasticsearch {
hosts => ["http://192.168.167.205:9200"]
#index => "%{[@metadata][beat]}-%{[@metadata][version]}-%{+YYYY.MM.dd}"
index => "face_card"
document_id => "%{id}"
#user => "elastic"
#password => "changeme"
}
stdout {
codec => json_lines
}
}
1.4.2、添加 sql 文件

创建 face.sql 文件

1
2
3
su - es
mkdir sql
touch face.sql

修改 face.sql 文件内容如下所示

1
select * from face_card where id > :sql_last_value order by id limit 1000
1.4.3、创建索引

打开postman,执行PUT请求来创建Elasticsearch索引,索引名称为face_card,指定分片数为5,副本数为2:

1
2
3
4
5
6
7
8
9
10
11
12
13
PUT http://192.168.167.205:9200/face_card

{

"settings": {

"number_of_shards": 5,

"number_of_replicas": 2

}

}
1.4.4、执行导数程序
1
2
3
su - es
cd /usr/local/elk/logstash-6.4.0
./bin/logstash -f ./config/face.conf
1.4.5、查询索引内容

使用postman工具,执行GET请求来查看索引内容:

1
GET /face_card/_search

返回示例如下图所示:

四、Kibana

源码下载地址:https://www.elastic.co/cn/downloads/past-releases#kibana

4.1、下载 Kibana 源码

1
2
cd /usr/local/elk 
wget https://artifacts.elastic.co/downloads/kibana/kibana-6.4.0-linux-x86_64.tar.gz

4.2、创建 es 用户(如已创建,请略过该步骤)

1
useradd es

4.3、解压源码并修改其所有者

1
2
tar zxvf kibana-6.4.0-linux-x86_64.tar.gz 
chown -R es:es kibana-6.4.0-linux-x86_64

4.4、修改kibana.yml配置文件

修改Kibana配置:config/kibana.yml

1
2
3
4
server.port: 5601 
server.host: "node205.data"
elasticsearch.url: "http://node205.data:9200"
logging.dest: /usr/local/elk/kibana-6.4.0-linux-x86_64/logs/kibana.log

4.5、后台启动Kibana

用es用户后台启动Kibana

1
2
3
su - es
cd /usr/local/elk/kibana-6.4.0-linux-x86_64
nohup ./bin/kibana > /dev/null 2>&1 &

可根据 logs/kibana.log 文件来监测Kibana服务运行状况。

五、FAQ

5.1、max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]

修改 /etc/security/limits.conf 文件,增加配置,来改变用户 es 每个进程最大同时打开文件数的大小:

1
2
es soft nofile 65535 
es hard nofile 65537

可切换到es用户下,然后通过下面2个命令查看当前数量:

  • ulimit -Hn
  • ulimit -Sn

注意:用户退出重新登录后配置才会刷新生效。

1.2. max number of threads [3818] for user [es] is too low, increase to at least [4096]

最大线程个数太低。修改配置文件 /etc/security/limits.conf ,增加配置:

1
2
3
4
es - nproc 4096 
# 或者
es soft nproc 4096
es hard nproc 4096

可切换到es用户下,然后通过下面2个命令查看当前最大线程数:

  • ulimit -Hu
  • ulimit –Su

注意:用户退出重新登录后配置才会刷新生效。

1.3. max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]

修改 /etc/sysctl.conf 文件,在文末增加配置

1
vm.max_map_count=262144

执行命令sysctl -p生效。

1.4. memory locking requested for elasticsearch process but memory is not locked

修改 /etc/security/limits.conf 文件,增加配置:

1
2
* soft memlock unlimited 
* hard memlock unlimited

1.5. 启动Elasticsearch服务,显示被killed

可能Elasticsearch所在的机器内存不足。

修改 bin/elasticsearch 文件,将 ES_JAVA_OPTS 修改为:ES_JAVA_OPTS="-Xms1g -Xmx1g",如下图所示:

1.6. 服务启动后,在浏览器访问不了9200端口

关闭防火墙:

1
systemctl stop firewalld