一、为什么要了解时钟同步?
时钟同步在大数据方向,用到的地方很多。举个例子来说吧,像Zookeeper、RegionServer服务都是需要实时和各节点进行通信的。假如各节点差超过30s,那么RegionServer会由于Zookeeper会话超时而停止服务。所以时钟同步在大数据里被广泛应用且必不可少的一步。
二、了解时间
在Linux系统中,时间分为两部分:系统时间和硬件时间。默认情况下,系统时间和硬件时间会以异步的方式进行,互不干扰。系统时间使用CPU tick维持,硬件时间使用Bios维持。在系统开机的时候,会自动从Bios中获取硬件时间,并设置为系统时间。
三、了解时区
在Linux系统中,/usr/share/zoneinfo
目录下存在很多时区,其中Asia/Shanghai
代表中国时区,如果需要更改时区,仅需做个软链接到/etc
目录,软链名字为localtime
。
四、了解NTP
NTP(Network Time Protocol,网络时间协议)是由RFC 1305定义的时间同步协议,用来在分布式时间服务器和客户端之间进行时间同步。NTP基于UDP报文进行传输,使用的UDP端口号为123。
使用NTP的目的是对网络内所有具有时钟的设备进行时钟同步,使网络内所有设备的时钟保持一致,从而使设备能够提供基于统一时间的多种应用。
对于运行NTP的本地系统,既可以接收来自其他时钟源的同步,又可以作为时钟源同步其他的时钟,并且可以和其他设备互相同步。
五、NTP时间同步方案选择
NTP同步方式在linux下一般两种:使用ntpdate命令直接同步和使用NTPD服务平滑同步。有什么区别呢,简单说下,免得时间长了,概念又模糊。
现有一台设备,系统时间是 13:00 , 真实的当前时间(在空中,也许卫星上,这里假设是在准备同步的上级目标NTP服务器)是: 12:30 。如果我们使用ntpdate同步(ntpdate -u 目标NTP服务器IP),操作系统的时间立即更新为12:30,假如,我们的系统有一个定时应用,是在每天12:40运行,那么实际今天这个的任务已经运行过了(当前时间是13:00嘛),现在被ntpdate修改为12:30,那么意味作10分钟后,又会执行一次任务,这就糟糕了,这个任务只能执行一次的嘛!!我想你已经懂了ntpdate时间同步的隐患,当然这个例子有些极端,但的确是有风险的,生产环境我不打算这么干,还是稳妥点好。所以解决该问题的办法就是时间平滑更改,不会让一个时间点在一天内经历两次,这就是ntpd服务方式平滑同步时间,它每次同步时间的偏移量不会太陡,是慢慢来的(问:怎么来,没有细究,只晓得一次一点的同步,完全同步好需要较长时间,所以一般开启ntpd服务同步前先用ntpdate先手动同步一次)。
六、时间同步方案说明
上面介绍了那么多,需要如何做呢?假设有三台主机搭建的集群,使用ntp服务进行时钟同步,主节点作为时钟源:
- 设置上海时区(各节点)
- yum安装ntp服务,并设置为ntpd开机自启动,修改ntp配置文件,开启ntp服务(各节点)
- 硬件时间以系统时间为标准进行同步(各节点)
- 从节点使用ntpdate -u命令进行时钟同步,并开启ntpd服务
主从节点配置文件修改说明:
主节点修改:
1 2 3 4 5 6 7 8
| # 将下列字段注释: # server 0.centos.pool.ntp.org iburst # server 1.centos.pool.ntp.org iburst # server 2.centos.pool.ntp.org iburst # server 3.centos.pool.ntp.org iburst # 添加: server 127.127.1.0 # 表示NTP主服务器是与自身的系统时钟同步 fudge 127.127.1.0 stratum 10 # 指定阶层编号为10,降低其优先度
|
从节点修改:
1 2 3 4 5 6 7 8 9 10
| # 将下列字段注释: # server 0.centos.pool.ntp.org iburst # server 1.centos.pool.ntp.org iburst # server 2.centos.pool.ntp.org iburst # server 3.centos.pool.ntp.org iburst # 添加: server 127.127.1.0 # 表示NTP主服务器是与自身的系统时钟同步 fudge 127.127.1.0 stratum 10 # 指定阶层编号为10,降低其优先度 server liuyzh1.xdata # 配置时间服务器为本地的时间服务器 restrict liuyzh1.xdata nomodify notrap noquery # 允许上层时间服务器主动修改本机时间
|
配置参数和命令简单说明请参考:点击访问
总结:
上面采取的是ntpdate + ntpd的同步方案。先使用ntpdate命令实现时间同步,然后再开启ntpd服务进行平滑式的逐渐时间调整。
修改主节点配置文件,使NTP主服务器与自身系统时钟同步,也就是说主节点为时间服务器。
修改从节点配置文件,配置主节点为本地的时间服务器,允许主节点主动修改本机时间。
七、具体的脚本命令
可以新建文件,里面存放集群内所有需要时钟同步的节点
1 2 3 4
| 192.168.162.41 192.168.162.42 192.168.162.43 # 将上面节点ip保存到 ~/nodeslist下
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91
| #!/usr/bin/env bash bin=`dirname $0` bin=`cd "$bin"; pwd` cd $bin host_list=$(cat ~/nodeslist) master_hostip=$(sed -n 1p ~/nodeslist) ips_no_host=$(sed -n '2,$p' ~/nodeslist) # 判断当前系统版本,方便用户单独执行 os_version=`sh checkOSVersion.sh` # 遍历所有节点 # 操作:1.修改时区为上海时区 2.设置开机自启动 3.修改配置文件ntp.cnf for host in $host_list do # 设置时区 ssh $host ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime # 开机自启动 flag=`ssh $host grep -c \"service ntpd restart\" /etc/rc.d/rc.local` if [ $flag -eq '0' ]; then ssh $host "echo service ntpd restart >> /etc/rc.d/rc.local" echo "service ntpd restart in /etc/rc.d/rc.local add successfully!" else echo "service ntpd restart in /etc/rc.d/rc.local already exist, not need to add." fi flag=`ssh $host grep -c \"hwclock --systohc\" /etc/rc.d/rc.local` if [ $flag -eq '0' ]; then ssh $host "echo "hwclock --systohc" >> /etc/rc.d/rc.local" echo "hwclock --systohc in /etc/rc.d/rc.local add successfully!" else echo "hwclock --systohc in /etc/rc.d/rc.local already exist, not need to add." fi ssh $host "chmod +x /etc/rc.d/rc.local" # 安装ntp服务 ssh $host yum install -y -q ntp if [[ $os_version = "centos6" ]];then ssh $host "sed -i -e '22 s/^/# /' -i -e '23 s/^/# /' -i -e '24 s/^/# /' -i -e '25 s/^/# /' /etc/ntp.conf" else ssh $host "sed -i -e '21 s/^/# /' -i -e '22 s/^/# /' -i -e '23 s/^/# /' -i -e '24 s/^/# /' /etc/ntp.conf" fi flag=`ssh $host grep -c \"server 127.127.1.0\" /etc/ntp.conf` if [ $flag -eq '0' ]; then ssh $host "echo server 127.127.1.0 >> /etc/ntp.conf" echo "server 127.127.1.0 in /etc/ntp.conf add successfully!" else echo "server 127.127.1.0 in /etc/ntp.conf already exist,not need to add." fi flag=`ssh $host grep -c \"fudge 127.127.1.0 stratum 10\" /etc/ntp.conf` if [ $flag -eq '0' ]; then ssh $host "echo fudge 127.127.1.0 stratum 10 >> /etc/ntp.conf" echo "fudge 127.127.1.0 stratum 10 in /etc/ntp.conf add successfully!" else echo "fudge 127.127.1.0 stratum 10 in /etc/ntp.conf already exist,not need to add." fi done # 主节点操作 # 1.重启ntpd 2.硬件时间以系统时间为标准进行同步 3.打印主节点当前系统时间 service ntpd restart hwclock --systohc echo -e "\e[0;32;1m==== "$master_hostip"当前系统时间为: ====\e[0m" date echo -e "\e[0;32;1m==== "$master_hostip"当前硬件时间为: ====\e[0m" hwclock # 从节点操作,开启ntp服务,使用ntpdate命令进行时钟同步 for slave in $ips_no_host do echo -e "\e[0;33;1m==== 开始对"$slave"进行时钟同步配置 ====\e[0m" # 将 server 主节点 写入配置文件/etc/ntp.conf中 flag=`ssh $slave grep -c \"server $master_hostip\" /etc/ntp.conf` if [ $flag -eq '0' ]; then ssh $slave "echo server $master_hostip >> /etc/ntp.conf" echo "server $master_hostip in /etc/ntp.conf add successfully!" else echo "server $master_hostip in /etc/ntp.conf already exist,not need to add." fi # 将 restrict 主节点 nomodify notrap noquery 写入配置文件/etc/ntp.conf中 flag=`ssh $slave grep -c \"restrict $master_hostip nomodify notrap noquery\" /etc/ntp.conf` if [ $flag -eq '0' ]; then ssh $slave "echo restrict $master_hostip nomodify notrap noquery >> /etc/ntp.conf" echo "restrict $master_hostip nomodify notrap noquery in /etc/ntp.conf add successfully!" else echo "restrict $master_hostip nomodify notrap noquery in /etc/ntp.conf already exist,not need to add." fi ssh $slave service ntpd restart ssh $slave "ntpdate -u $master_hostip" echo -e "\e[0;32;1m==== "$slave"当前系统时间为: ====\e[0m" ssh $slave "date" ssh $slave "hwclock --systohc" echo -e "\e[0;32;1m==== "$slave"当前硬件时间为: ====\e[0m" ssh $slave "hwclock" echo -e "\e[0;33;1m==== 完成对"$slave"的时钟同步配置 ====\e[0m" done echo -e "\e[0;32;1m==== 时钟同步配置流程结束 ====\e[0m"
|