PostgreSQL事务
事务是数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成。数据库事务通常包含一个序列对数据库的读和写操作,主要是包含以下两个目的:
- 为数据库操作序列提供一个从失败中恢复到正常状态的方法,同时提供了数据库即使在异常状态下保持数据一致性的方法。
- 多个应用程序并发访问数据库时,可以在这些应用程序之间提供一个隔离方法,保证彼此之间操作的操作互不影响。
当事务提交给数据库管理系统,则数据库管理系统需要确保该事务中的所有操作都成功,并且操作会结果被永久保存在数据库中;如果事务中有部分操作失败,则事务中的所有操作都需要回滚,回到事务执行前的状态;同时,该事务对数据库或者其他事务互不影响,所有的事务都是独立运行。
1、事务的属性
- 原子性:一个事务中的所有操作要么全部完成,要么一个都不做,不会在中间某个环节结束。
- 一致性:事务应确保数据库的状态从一个一致状态转变为另一个一致状态,事务执行结束后数据库的完整性没有破坏。
- 隔离性:数据库允许多个并发事物对数据库中的数据进行读写操作,隔离性可以防止多个事务并发执行时导致的数据不一致性。事务根据隔离等级可以分为4级:读未提交、读已提交、可重复度和串行化。
- 持久性:事务执行完成后,对数据的修改是永久的
3、事务的使用
在psql中默认开启自动提交事务的功能,每提交一条SQL语句,都会被自动提交。可以通过设置AUTOCOMMIT
参数来关闭自动提交功能。
postgres=# \dt # 当前存在一张test表
List of relations
Schema | Name | Type | Owner
--------+------+-------+----------
public | test | table | postgres
(1 row)
postgres=# \set AUTOCOMMIT off # 设置AUTOCOMMIT参数关闭
postgres=# \echo :AUTOCOMMIT
off
postgres=# drop table test; # 删除test表
DROP TABLE
postgres=*# \dt # 查看是否存在表
Did not find any relations.
postgres=*# rollback ; # 手动回滚事务
ROLLBACK
postgres=# \dt # test表恢复到初始状态
List of relations
Schema | Name | Type | Owner
--------+------+-------+----------
public | test | table | postgres
(1 row)
postgres=#
此外还可以通过begin
关键字开启事务,通过commit
提交事务,还可以通过rollback
进行回滚。
这里引入两个关键字begin
和start transaction
,两者作用是一样的,但是在使用过程中begin
可能会成为关键字的时候,采用start transaction
可以避免这种情况发生。
postgres=# begin; # 启动一个事务
BEGIN
postgres=*# insert into test values(1,now()); # 插入一条数据
INSERT 0 1
postgres=*# select count(*) from test; # 查询数据条目
count
-------
201
(1 row)
postgres=*# rollback ; # 进行事务回滚
ROLLBACK
postgres=# select count(*) from test; # 查询数据条目
count
-------
200
(1 row)
PostgreSQL支持保存点的功能,在一个大的事务中,可以把操作过程分为几个部分,每个部分执行成功后可以建一个保存点,若后边的部分执行失败,则会回滚到次保存点,无需回滚整个事务。
postgres=# select * from test; # 初始表数据条数为空
id
----
(0 rows)
postgres=# begin ; # 开启事务
BEGIN
postgres=*# insert into test values(1); # 插入一条数据
INSERT 0 1
postgres=*# savepoint test_point_1; # 建立一个保存点test_point_1
SAVEPOINT
postgres=*# insert into test values(2);
INSERT 0 1
postgres=*# insert into test values(1); # 由于唯一约束导致插入数据失败
2024-05-18 20:17:47.991 CST [3161] ERROR: duplicate key value violates unique constraint "test_pkey"
2024-05-18 20:17:47.991 CST [3161] DETAIL: Key (id)=(1) already exists.
2024-05-18 20:17:47.991 CST [3161] STATEMENT: insert into test values(1);
ERROR: duplicate key value violates unique constraint "test_pkey"
DETAIL: Key (id)=(1) already exists.
postgres=!# rollback to savepoint test_point_1; # 将事务回滚到test_point_1
ROLLBACK
postgres=*# commit ;
COMMIT
postgres=# select * from test; # 此时回滚到保存点test_point_1处,数据条目为一条
id
----
1
(1 row)
4、事务的隔离级别
隔离级别 | 描述 |
---|---|
读未提交 | 允许事务读取其他事务没有提交的数据,脏读、不可重复读和幻读都会出现 |
读已提交 | 只允许事务读取其他事务已经提交的数据,可以避免脏读,但是不可重复读和幻读都会出现 |
可重复读 | 可以保证从一个字段中读取相同的数据,可以任务事务开启时会自动对现有数据进行快照,其他事务修改不管是否提交,当前事务读取的时候快照数据,可以避免脏读和不可重复读,但是幻读问题会出现。 |
串行化 | 确保事务是串行执行,可以避免所有的并发问题,但是并发效率低,一般不推荐使用 |
读已提交是PostgreSQL中默认隔离级别。当一个事务处于这个隔离级别是,查询语句只能看到查询开始之前已经提交的数据,无法看到未提交或者查询执行期间其他事务已提交的数据。不过select
可以查询自身所在事务中前面尚未提交的操作结果,实际上,select
查询看到的时在查询开始运行瞬间的一个快照。
postgres=# begin;
BEGIN
postgres=*# insert into test values(2);
INSERT 0 1
postgres=*# select * from test; # 查询到当前事务未提交的数据
id
----
1
2
(2 rows)
postgres=*# rollback ;
ROLLBACK
5、两阶段提交
PostgreSQl数据库支持两阶段提交协议。在分布式系统中,事务包含多台数据库操作,虽然单台数据库可以保证原子性,但是多台数据库之间需要通过两阶段提交来实现。二阶段提交,通过引入一个事务的协调者来管理各个数据库事务的提交和回滚,就是将事务提交分为准备和提交阶段。
具体流程如下:
- 准备阶段:协调者会给各个参与者发送准备命令。等待所有资源响应之后进入第二阶段。
- 提交阶段:若第一阶段所有参与者都返回准备成功后, 协调者再次向所有参与者发送提交事务的命令,然后等待所有事务都提交成功后,返回事务执行成功。
postgres=# select * from test; # 查询当前表数据条目
id
----
1
2
(2 rows)
postgres=# begin; # 开启事务
BEGIN
postgres=*# insert into test values(3); # 插入数据
INSERT 0 1
postgres=*# prepare transaction 'test_transaction'; # 使用prepare transaction提交事务(第一阶段)
PREPARE TRANSACTION
postgres=# select * from test; # 查询当前表数据条目
id
----
1
2
(2 rows)
postgres=# \q
[postgres@pg14 pgdata]$ pg_ctl -D /opt/pgdata restart # 重启数据库
waiting for server to shut down....2024-05-18 21:03:12.231 CST [4000] LOG: received fast shutdown request
2024-05-18 21:03:12.234 CST [4000] LOG: aborting any active transactions
2024-05-18 21:03:12.236 CST [4000] LOG: background worker "logical replication launcher" (PID 4008) exited with exit code 1
2024-05-18 21:03:12.237 CST [4002] LOG: shutting down
2024-05-18 21:03:12.791 CST [4000] LOG: database system is shut down
done
server stopped
waiting for server to start....2024-05-18 21:03:12.867 CST [4026] LOG: starting PostgreSQL 14.6 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-44), 64-bit
2024-05-18 21:03:12.868 CST [4026] LOG: listening on IPv6 address "::1", port 5432
2024-05-18 21:03:12.868 CST [4026] LOG: listening on IPv4 address "127.0.0.1", port 5432
2024-05-18 21:03:12.873 CST [4026] LOG: listening on Unix socket "/tmp/.s.PGSQL.5432"
2024-05-18 21:03:12.884 CST [4027] LOG: database system was shut down at 2024-05-18 21:03:12 CST
2024-05-18 21:03:12.888 CST [4027] LOG: recovering prepared transaction 869 from shared memory
2024-05-18 21:03:12.893 CST [4026] LOG: database system is ready to accept connections
done
server started
[postgres@pg14 pgdata]$ psql
psql (14.6)
Type "help" for help.
postgres=# select * from test; # 查询当前表数据条目
id
----
1
2
(2 rows)
postgres=# commit prepared 'test_transaction'; # 提交二阶段事务
COMMIT PREPARED
postgres=# select * from test; # 查询当前表数据条目,事务被提交,可以查询到插入数据
id
----
1
2
3
(3 rows)
test_transaction
是作为两阶段提交中全局事务ID,由事务协调器生成,一旦执行一阶段提交事务,则会把事务持久化,即使数据库重启也不会影响事务的回滚。
两阶段提交是一种尽量保证强一致性的分布式事务,因此它是同步阻塞的,而同步阻塞就导致长久的资源锁定问题,总体而言效率低,并且存在单点故障问题,在极端条件下会存在数据不一致的风险。