http://t.csdnimg.cn/AtW6Q
第三种办法:
同时结合ID取模分表和ID范围分表的方案,我们可以先用ID范围去分表,然后在某个ID范围内引入取模的功能。比如以前0到500万是user_0表,现在可以在这个范围里再分成多个表,比如引入user0_0,user0_1,在这两个表里进行取模操作。
eg:ID=304
根据id范围分表到user_0表,再进行取模得到最终属于user0_0表。
如果在多个数据库里做分表,也就是所谓的分库分表。如果我们将不同的库部署到不同的机器上,就能充分利用各个机器的性能。
不管是单库分表还是分库分表,都需要通过一个中间层逻辑做路由。我们把这部分逻辑封装起来,放在数据库和业务代码之间。这样对于业务代码来说,只需要读写表,对于数据库来说,只是有几个名字比较像的小表。
中间层的实现方式就更灵活了,可以加第三方库,但这样就需要根据不同语言实现不同的代码库,比较繁琐,也可以都选择在MYSQL和业务代码之间加个服务去做这个中间层分表路由逻辑。
读扩散问题:对于数据分表已经知道水平分表和数值分表,但是对于水平分表来说,常用的取模分表和范围分表都很难应对一种情况,比如如果我们想查询的数据并非主键id而是名字,公司,那这样的情况ID取模分表和ID范围分表都无法解决,这样我们的sql语句会并发查询所有的表,这就是读扩散问题。
解决方案:
如果业务需要查询名字且频率很高,那我们拿出名字作为分片键,通过名字查找id,再到原分片表中根据id查询所有信息
缺点:一次性需要更新维护两个表,开发比较复杂。