1.问题背景
代码通过jarLoader的方式,实现了一个数据库多个客户端版本兼容的情况,一个客户端使用一个jarLoader,实现jar的隔离。
同时,jarLoader使用weekhashmap做缓存。
hive做批量查询表的元数据时,引入了线程池。
2.现象
程序卡住,接收不到任何请求
3.dump日志
dump三次日志,三次有间隔时间。
发现相同名称的线程出现了n次,原则上仅能出现一次。
4. 分析原因
三次dump日志中,线程都没有回收,说明有强引用
weekHashmap的value是弱引用,在gc时会回收该对象。实际上并不是回收该对象,而是置该对象为null
源码如下:
queue存放gc后被清除的弱引用实体。
通过queue来清除table中已被回收的对象。
将e=null帮助gc回收
/**
* Reference queue for cleared WeakEntries
*/
private final ReferenceQueue<Object> queue = new ReferenceQueue<>();
private void expungeStaleEntries() {
for (Object x; (x = queue.poll()) != null; ) {
synchronized (queue) {
@SuppressWarnings("unchecked")
Entry<K,V> e = (Entry<K,V>) x;
int i = indexFor(e.hash, table.length);
Entry<K,V> prev = table[i];
Entry<K,V> p = prev;
while (p != null) {
Entry<K,V> next = p.next;
if (p == e) {
if (prev == e)
table[i] = next;
else
prev.next = next;
// Must not null out e.next;
// stale entries may be in use by a HashIterator
e.value = null; // Help GC
size--;
break;
}
prev = p;
p = next;
}
}
}
}
当value被置为null后,缓存中找不到classLoader,会重新创建一个classLoader,新的classLoader又创建了线程,这时候就出现了同名线程有多个的情况。
线程为什么不被回收?
因为线程池定义中,
private static ExecutorService executorPool = new ThreadPoolExecutor(
10, 10, 60L, TimeUnit.SECONDS,
new LinkedBlockingQueue<Runnable>(5000), new ThreadFactoryBuilder().setNameFormat("HiveServer2Executor-%d").build());
超过 keepAliveTime 时间的闲置线程会被回收掉。回收的是非核心线程,核心线程一般是不会回收的。
如果设置 allowCoreThreadTimeOut(true),则核心线程在闲置 keepAliveTime 时间后也会被回收。
由此定位到线程数剧增的情况。
同时服务运行时间很长时,整个服务创建不了任何线程,导致服务假死现象。
5.结论
代码中找不到该对象了,但是实际还是占用着内存,浪费堆空间。
由此说明,weekhashmap在有强引用的情况下,不是一个很好的缓存。