HBase 版本:1.2.0-cdh5.7.0

一、客户端的长短连接

java 远程连接 HBase 客户端,大体分为两种方式。一种是长连接,一种是短连接。

短链接,顾名思义,就是客户端执行完某个操作之后,就关闭连接的这种方式,就是短链接。

而长连接就是有且连接一次,后续的所有操作都是基于这次连接做的操作,操作完成后,不关闭连接。长连接适用于频繁交互的场景,今天我们就来着重说一下它。

二、使用单例模式来初始化 HBase 客户端

以 HBase 为例,如果使用长连接,那就得需要确保 connection 唯一,所有的操作都使用这一个 connection 。 实现方法有很多,比如双重校验,加锁等方法。

但我们也可以使用静态内部类的形式实现上述场景。 静态内部类也是实现单例模式的一种,保证只加载一次,懒加载并且线程安全。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
/**
* HBase客户端操作(长连接)
*/
public class HBaseUtil {

private static final Logger log = LoggerFactory.getLogger(HBaseUtil.class);

private Connection connection;
private static Configuration configuration;

/**
* 私有构造器
* 初始化 HBase Connection
*/
private HBaseUtil() {
configuration = initHBaseEnv();
try {
connection = ConnectionFactory.createConnection(configuration);
} catch (IOException e) {
log.error("HBase Client connect abnormal: ", e);
System.exit(-1);
}
}

/**
* 静态内部类
*/
private static class InstanceHolder {
// 不会在外部类初始化时就直接加载,只有当调用了getInstance方法时才会静态加载,线程安全。
private static final HBaseUtil instance = new HBaseUtil();
}

/**
* 单例模式,获取HBase实例
*/
public static HBaseUtil getInstance() {
return InstanceHolder.instance;
}

/**
* 初始化 HBase 配置
*/
public static Configuration initHBaseEnv() {

try {
configuration = HBaseConfiguration.create();
configuration.set("hbase.zookeeper.quorum", "cdh-worker-1,cdh-worker-2,cdh-worker-3");
configuration.set("hbase.zookeeper.property.clientPort", 2181);
configuration.set("zookeeper.znode.parent", "/hbase");
} catch (Exception e) {
log.error("HBase Client Configuration Initialization exception: ", e);
}
return configuration;
}

/**
* 获取namespace中所有的表名
*
* @param namespace
*/
public List<String> listTables(String namespace) throws IOException {
List<String> tableNameList = new ArrayList<>();
// 获取namespace中所有的表名
TableName[] tbs = connection.getAdmin().listTableNamesByNamespace(namespace);

for (TableName tableName : tbs) {
tableNameList.add(tableName.toString());
}
return tableNameList;
}
}

上述代码,只有当触发 getInstance() 方法时,才会初始化 connection ,且 connection 只会被加载一次。

比如我们要执行 HBase 客户端操作的话,可以执行:HBaseUtil.getInstance().listTables(“xxx”) 。

三、总结

1、为什么这样实现就是单例的?

因为 HBaseUtil.java 的实例化是靠静态内部类的静态常量 instance 实例化的。instance 是常量,因此只能赋值一次;它还是静态的,因此随着内部类一起加载。

2、这样实现有什么好处?

我记得以前接触的懒汉式的代码好像有线程安全问题,需要加同步锁才能解决。采用静态内部类实现的代码也是懒加载的,只有触发静态内部类的静态常量 instance 的时候才加载;同时也不会有线程安全问题。

3、不只是 HBase 可以这样初始化客户端,Elasticsearch 等等的长连接也都可以,这样,你学会了吗?