目录
- 表
- 索引
- MVPrimaryIndex
- MVDelegateIndex
- MVSecondaryIndex
- 索引更新
表
h2使用类MVTable表示数据库表,h2的表数据是基于主键排列的,这种表也叫做主键索引表。这也就意味着表必须有主键,如果没有主键,h2会自动生成一个主键_ROWID_
,字段类型为long型。另外,如果定义表的时候主键设置为了非数字类型或者主键设置了多个字段,h2也是自动生成主键_ROWID_
。当有了字段_ROWID_
之后,表的数据便是根据_ROWID_
组织,也就是说代表表的B+树上的key是_ROWID_
,value是行记录。
当向表中插入数据时,h2使用如下代码设置B+树上的key:
//mainIndexColumn表示主键字段在表中的位置,这个是按照定义表时字段顺序来的,
//如果定义表时第一个字段是主键,那么mainIndexColumn为1
//当主键是非数字类型或者有多个字段,mainIndexColumn =SearchRow.ROWID_INDEX
if (mainIndexColumn == SearchRow.ROWID_INDEX) {
if (row.getKey() == 0) {
//lastKey类型为AtomicLong,lastKey初始值为0
row.setKey(lastKey.incrementAndGet());
}
} else {
long c = row.getValue(mainIndexColumn).getLong();
row.setKey(c);
}
假设新建表USER_INF_1:
CREATE TABLE USER_INF_1(
name VARCHAR(100) not null primary key,
sex VARCHAR(2)
)
向该表中插入如下记录:
INSERT INTO USER_INF_1 VALUES('Tom', '男');
插入记录后,USER_INF_1的B+树结构为:
假设新建表USER_INF_2:
CREATE TABLE USER_INF_2(
id INTEGER not null primary key,
name VARCHAR(100) not null,
sex VARCHAR(2)
)
向该表中插入如下记录:
INSERT INTO USER_INF_2 VALUES(10,'Tom', '男');
插入记录后,USER_INF_2的B+树结构为:
索引
索引一般分为主键索引和二级索引,二级索引也叫作辅助索引或者非主键索引。
在h2中,二级索引使用类MVSecondaryIndex表示。主键索引比较复杂:
- 如果定义了主键为数字类型且只有一个字段,那么h2会创建两个索引:MVPrimaryIndex和MVDelegateIndex;
- 除了第一种情况外,定义表之后h2会创建MVPrimaryIndex,如果还定义了主键,h2再创建一个MVSecondaryIndex表示主键索引。
下面分别介绍这三个类的关系。
MVPrimaryIndex
大家都知道h2的表数据是根据主键组织的,所以h2定义了MVPrimaryIndex类用来表示主键索引。虽说MVTable对象表示数据库表,但是表数据都是存储在MVPrimaryIndex里面,表数据都是由MVPrimaryIndex来管理和维护的。MVPrimaryIndex底层使用B+树将数据存储在磁盘上。
h2的每个数据库对象都有一个名字,MVPrimaryIndex对象叫做“TABLE_NAME_DATA”,表示这是某个表的数据。
上面表USER_INF_1和USER_INF_2的数据存储结构图其实就是MVPrimaryIndex。
MVDelegateIndex
MVDelegateIndex从名字上可以看出这是一个代理索引。它的使用场景比较简单,如果表定义了主键索引,索引中字段只有一个,并且是数字类型的,那么h2会再创建一个MVDelegateIndex对象,该对象有一个属性mainIndex指向了MVPrimaryIndex对象。调用MVDelegateIndex的方法,其实都是调用MVPrimaryIndex的方法,比如MVDelegateIndex的下面两个方法:
@Override
public long getRowCount(SessionLocal session) {
return mainIndex.getRowCount(session);
}
@Override
public long getRowCountApproximation(SessionLocal session) {
return mainIndex.getRowCountApproximation(session);
}
不过,像向表里面插入数据这种操作,MVDelegateIndex的方法是空的,因为MVPrimaryIndex已经插入过了:
@Override
public void add(SessionLocal session, Row row) {
// nothing to do
}
MVSecondaryIndex
二级索引使用MVSecondaryIndex表示。如果表的主键索引有多个字段或者不是数字类型的,那么尽管定义了主键索引,h2也是把它当做二级索引使用,因此也是创建一个MVSecondaryIndex对象,只不过这种MVSecondaryIndex对象的名字叫做“PRIMARY_KEY_X”(最后的X表示序号),表示这是某个表的主键索引。如果是二级索引,MVSecondaryIndex对象的名字就是我们定义的索引名字。
假设定义了USER_INF_3表:
CREATE TABLE USER_INF_3(
id INTEGER not null,
name VARCHAR(100) not null,
sex VARCHAR(2)
);
alter table USER_INF_3 add primary key(id,name);
CREATE index idx_name on USER_INF_3(name);
执行上述语句后,可以看到USER_INF_3有三个索引对象:
上图的三个索引分别是存储表数据的MVPrimaryIndex对象,主键索引MVSecondaryIndex对象,二级索引idx_name MVSecondaryIndex对象。
假设对USER_INF_3表执行了下面的SQL语句:
INSERT INTO USER_INF_3 VALUES(10,'Tom', '男');
那么三个索引的B+树结构为:
索引更新
当表数据发生增删改时,索引也要跟着变化。
在MVTable对象中有一个属性indexes:
private final ArrayList<Index> indexes = Utils.newSmallArrayList();
属性indexes保存了该表的所有索引,也就是前三个小节介绍的三个类的索引对象。
每当发生增删改时,MVTable都会遍历属性indexes,调用索引对象的update方法和add方法,其中update方法用于处理数据的删改,add方法用于处理数据的增加。