hbase 集成 phoenix 实现 sql 化

news2026/2/12 3:22:36

1. 依赖

hbase => hbase 集群搭建

2. 下载安装包

点击下载

ps：该网页在内网可能打不开，遇到该情况有条件的可以打开 VPN 在下载

3. 上传解压

使用工具将安装包上传的服务器上

笔者这里选择上传到 /opt/software 目录，解压到 /opt/module 这两个目录可以随意选择

tar -zxvf phoenix-hbase-2.4-5.1.3-bin.tar.gz -C /opt/module
cd /opt/module
mv phoenix-hbase-2.4-5.1.3-bin phoenix

4. 安装服务器

phoenix 是依赖于 hbse 集群的，可以说只是 hbase 的皮肤

安装只需要将服务包放到 hbase 的 lib 依赖库里即可，注意一台集群都需要拷贝到位，可以先拷贝一台，借助分发脚本分发

cd /opt/module/phoenix
cp phoenix-server-hbase-2.4-5.1.3.jar /opt/module/hbase/lib/
xsync.sh /opt/module/hbase/lib

PS：拷贝完成后一定要重启 hbase 集群

5. 客户端连接

# 第一次启动需要较长的时间，请耐心等待，这里的参数是 zookeepeer 集群连接 
cd /opt/module/phoenix
./bin/sqlline.py mitchell-101,mitchell-102,mitchell-103:2181

# 测试命令，查看所有表，如果安装成功，我们应该能看到很多系统表
!table

6. JDBC 连接

6.1. 客户端依赖

下方的依赖包目前在公共的中央仓库是不存在的，只有一些低版本的依赖，我们无法使用

这里我们只能将安装包解压出来的客户端安装到我们的 maven 中，如果有仓库的可以上传仓库

笔者这边选择安装到本地仓库

1，将解压后目录中的客户端下载到本地（如下图）

2，使用 maven 命令安装

mvn install:install-file -DgroupId=org.apache.phoenix -DartifactId=phoenix-client -Dversion=2.4-5.1.3 -Dpackaging=jar -D file=phoenix-client-hbase-2.4-5.1.3.jar

3，在项目中使用

<!-- phoenix 客户端依赖 -->
<dependency>
    <groupId>org.apache.phoenix</groupId>
    <artifactId>phoenix-client</artifactId>
    <version>2.4-5.1.3</version>
</dependency>

6.2. 简单示例

package com.mitchell.mus.tests.main;

import java.sql.*;
import java.util.Properties;

public class PhoneixTests {

    public static void main(String[] args) throws SQLException {
        
        // 声明地址和参数配置
        String jdbcUrl = "jdbc:phoenix:mitchell-101,mitchell-102,mitchell-103:2181";
        Properties properties = new Properties();

        // 获取连接
        Connection conn = DriverManager.getConnection(jdbcUrl, properties);

        // 获取操作对象
        Statement statement = conn.createStatement();

        // 执行语句并获取返回结果
        ResultSet resultSet = statement.executeQuery("select * from system.catalog");

        // 打印返回的结果
        while (resultSet.next()) {
            String tableName = resultSet.getString("TABLE_NAME");
            String columnName = resultSet.getString("COLUMN_NAME");

            System.out.println(tableName + "." + columnName);
        }

        // 关闭连接
        resultSet.close();
        statement.close();
        conn.close();
    }
    
}

7. 启用二级索引

7.1. 修改配置

cd /opt/module/hbase/conf/
vim hbase-site.xml

添加下方配置

<!-- 设置编解码器，通过在 WAL 日志中添加索引信息，是 phoenix 二级索引的前置配置 -->
<property>
    <name>hbase.regionserver.wal.codec</name>
    <value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value>
</property>

PS：记得分发到所有集群节点，然后重启集群

7.2. 全局索引

-- 创建表，必须要主键，支持联合主键
CREATE TABLE IF NOT EXISTS HB_USER (
    ID   INTEGER PRIMARY KEY,
    NAME VARCHAR,
    AGE  INTEGER
);

-- 新增/修改
UPSERT INTO HB_USER (ID, NAME, AGE) VALUES (1, '张三', 30);
UPSERT INTO HB_USER (ID, NAME, AGE) VALUES (2, '李四', 40);

-- 创建全局索引
CREATE INDEX IX_USER ON HB_USER(AGE);

-- 通过查看执行计划确定索引是否生效
EXPLAIN SELECT ID, AGE FROM HB_USER WHERE AGE = 30;
EXPLAIN SELECT ID, NAME, AGE FROM HB_USER WHERE AGE = 30;

全局索引会创建一张表，专门记录索引字段与主键的映射信息，查询的时候先查询索引表获取主键，在通过主键去取数据，从而提高查询效率，其比较适用于读多写少的应用场景。

但在查询时存在很大弊端：即想查询的字段如果不是索引字段的话，索引不会生效，比如例子中 id 主键，age 是索引，只查这两个字段索引可以生效，但是如果同时查询 name 的话索引就不生效了，如下图

7.3. 包含索引

为了解决全局索引的弊端，我们可以采取包含索引的方式，包含索引也是全局索引的一种，如果要使用全局索引建议使用包含索引

-- 删除索引
DROP INDEX IX_USER ON HB_USER;

-- 创建包含索引，本质上就是将想要和该索引字段一起查询的字段 INCLUDE 进去
CREATE INDEX IX_USER ON HB_USER(AGE) INCLUDE (NAME);

-- 查看执行计划
EXPLAIN SELECT ID, NAME, AGE FROM HB_USER WHERE AGE = 30;

但是包含索引会让索引表的数据量变得很大

7.4. 本地索引（推荐）

本地索引不会创建表，数据都写在同一张表且是同一个 region 中，所以特别适合写操作频繁的表

-- 删除索引
DROP INDEX IX_USER ON HB_USER;

-- 创建本地索引
CREATE LOCAL INDEX IX_USER ON HB_USER(AGE);

-- 查看执行计划
EXPLAIN SELECT ID, NAME, AGE FROM HB_USER WHERE AGE = 30;