OceanBase 表分组和复制表特性简介
OceanBase 表分组简介
表分组(TABLE GROUP
)是 OceanBase 作为分布式数据库的一个特色功能。 表分组是表的属性,会影响多个表的分区在 OceanBase 机器上的分布特征。
不同表的分区有可能分布在不同的节点上,当两个表做表连接查询时,OceanBase 会跨节点请求数据,执行时间就跟节点间请求延时有关。在 SQL 调优时,OceanBase 建议对业务上关系密切的表,设置相同的表分组。OceanBase 对于同一个表分组中的表的同号分区会管理为一个分区组。同一个分区组中的分区,OceanBase 会尽可能的分配到同一个节点内部,这样就可以规避跨节点的请求。
创建表分组
创建表分组时,首先要规划好表分组的用途。如果是用于普通表的属性,表分组就不用分区;如果是用于分区表的属性,表分组就要指定分区策略,并且要跟分区表的分区策略保持一致。
示例:创建表分组和查看表分组。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | create tablegroup tpcc_group partition by hash partitions 6 ; MySQL [test]> show tablegroups; +-----------------+------------+---------------+ | Tablegroup_name | Table_name | Database_name | +-----------------+------------+---------------+ | oceanbase | NULL | NULL | | tpcc_group | NULL | NULL | +-----------------+------------+---------------+ 2 rows in set (0.004 sec) MySQL [test]> show create tablegroup tpcc_group; +------------+-------------------------------------------------------------------------------------------------+ | Tablegroup | Create Tablegroup | +------------+-------------------------------------------------------------------------------------------------+ | tpcc_group | CREATE TABLEGROUP IF NOT EXISTS `tpcc_group` BINDING = FALSE partition by hash partitions 6 | +------------+-------------------------------------------------------------------------------------------------+ 1 row in set (0.001 sec) |
查看表分组下的表的语句是:show tablegroups ;
。
有了表分组后,在建表时就可以指定表分组。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 | create table ordr ( o_w_id int , o_d_id int , o_id int , o_c_id int , o_carrier_id int , o_ol_cnt int , o_all_local int , o_entry_d date , index iordr(o_w_id, o_d_id, o_c_id, o_id) local , primary key ( o_w_id, o_d_id, o_id ) )tablegroup tpcc_group partition by hash(o_w_id) partitions 6; create table ordl ( ol_w_id int , ol_d_id int , ol_o_id int , ol_number int , ol_delivery_d date , ol_amount decimal(6, 2) , ol_i_id int , ol_supply_w_id int , ol_quantity int , ol_dist_info char(24) , primary key (ol_w_id, ol_d_id, ol_o_id, ol_number ) )tablegroup tpcc_group partition by hash(ol_w_id) partitions 6; MySQL [test]> show tablegroups; +-----------------+------------+---------------+ | Tablegroup_name | Table_name | Database_name | +-----------------+------------+---------------+ | oceanbase | NULL | NULL | | tpcc_group | ordl | test | | tpcc_group | ordr | test | +-----------------+------------+---------------+ 3 rows in set (0.004 sec) |
也可以后期将一个表加入到表分组,使用语句:alter tablegroup ... add
。 将表从表分组中移出时,使用语句:alter table ... tablegroup = '';
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 | MySQL [test]> alter table ordl tablegroup = ''; Query OK, 0 rows affected (0.148 sec) MySQL [test]> alter table ordr tablegroup = ''; Query OK, 0 rows affected (0.018 sec) MySQL [test]> show tablegroups; +-----------------+------------+---------------+ | Tablegroup_name | Table_name | Database_name | +-----------------+------------+---------------+ | oceanbase | NULL | NULL | | tpcc_group | NULL | NULL | +-----------------+------------+---------------+ 2 rows in set (0.004 sec) MySQL [test]> alter tablegroup tpcc_group add ordl , ordr ; Query OK, 0 rows affected (0.016 sec) MySQL [test]> show tablegroups; +-----------------+------------+---------------+ | Tablegroup_name | Table_name | Database_name | +-----------------+------------+---------------+ | oceanbase | NULL | NULL | | tpcc_group | ordl | test | | tpcc_group | ordr | test | +-----------------+------------+---------------+ 3 rows in set (0.004 sec) |
OceanBase 复制表 简介
复制表原理
复制表指的是一种特殊的表。 普通的表在生产环境,默认有三副本,其中一个主副本和两个备副本。备副本通过同步主副本的事务日志 clog
保持同步,同步协议是 Paxos 协议,主副本的事务日志只有在多数成员里确认落盘后,事务修改才会生效。 通常,默认情况下,读写都是在主副本上,备副本是不提供读写服务。应用如果开启会话或语句级别的弱一致性读后,备副本可能会提供只读服务。风险就是备副本的读会有些许延迟。 普通表可以变为复制表,然后主副本和所有备副本之间使用全同步协议,主副本的事务日志只有在所有副本成员里确认落盘后,事务修改才会生效。所以主副本跟所有备副本的数据理论上都是强一致的。
复制表场景
传统普通的表,主副本可能会成为读写瓶颈,业务可能会使用读写分离技术,将只读查询分离出去。运维将只读查询路由到备副本。这个风险是备副本理论上有一定延时。如果表是复制表,则备副本没有延迟问题。这是一种使用场景,前提是开启弱一致性读。
复制表最有用的场景是业务数据库做了水平拆分后,有部分业务表不适合拆分。前者的数据主副本有可能在所有机器上,后者的主副本只会在某台机器上。OceanBase 里一个事务的 SQL 都会跟随到事务开始时那条 SQL 的路由,如果某个 SQL 被路由到的节点不是该 SQL 访问的分区的主副本节点,这个 SQL 就是个远程 SQL 。如果这个分区所在的表是复制表,则这条 SQL 就会在本机执行,从而提升性能。
复制表使用的前提是表的修改频率不能太高,每个事务的平均延时会比普通的表的事务延时要大。
复制表语法
可以在创建表的时候就指定复制表属性 DUPLICATE_SCOPE
。这个属性有下面几个值:
NONE
: 这个是默认值,表示是普通的表。CLUSTER
:表的备副本分布在租户资源池所在的所有机器上。
示例:
1 2 | mysql> create table t1(id bigint not null auto_increment , c1 varchar(50), c2 timestamp not null default current_timestamp) duplicate_scope='cluster' ; Query OK, 0 rows affected (0.12 sec) |
也可以在表创建好后修改这个属性。
示例:
1 2 3 4 5 | mysql> alter table t1 duplicate_scope = 'NONE'; Query OK, 0 rows affected (0.05 sec) mysql> alter table t1 duplicate_scope = 'CLUSTER'; Query OK, 0 rows affected (0.04 sec) |