解决硬盘冗余错误解决方法数据冗余可能导致的问题 _数据

一，为什么要冗余数据
互联网数据量很大的业务场景，往往数据库需要进行水平切分来降低单库数据量。
水平切分会有一个patition key ，通过patition key的查询能够直接定位到库，但是非patition key上的查询可能就需要扫描多个库了。
此时常见的架构设计方案，是使用数据冗余这种反范式设计来满足分库后不同维度的查询需求。
例如：订单业务，对用户和商家都有订单查询需求：
Order(oid, info_detail);
T(buyer_id, seller_id, oid);
如果用buyer_id来分库， seller_id的查询就需要扫描多库。
如果用seller_id来分库， buyer_id的查询就需要扫描多库。
此时可以使用数据冗余来分别满足buyer_id和seller_id上的查询需求：
T1(buyer_id, seller_id, oid)
T2(seller_id, buyer_id, oid)
同一个数据，冗余两份，一份以buyer_id来分库，满足买家的查询需求；一份以seller_id来分库，满足卖家的查询需求。
如何实施数据的冗余，是今天将要讨论的内容。
二，服务同步双写
顾名思义，由服务层同步写冗余数据，如上图1-4流程：
业务方调用服务，新增数据服务先插入T1数据服务再插入T2数据服务返回业务方新增数据成功优点：
不复杂，服务层由单次写，变两次写数据一致性相对较高（因为双写成功才返回）缺点：
请求的处理时间增加（要插入两次，时间加倍）数据仍可能不一致，例如第二步写入T1完成后服务重启，则数据不会写入T2如果系统对处理时间比较敏感，引出常用的第二种方案。
三，服务异步双写
【解决硬盘冗余错误解决方法数据冗余可能导致的问题】数据的双写并不再由服务来完成，服务层异步发出一个消息，通过消息总线发送给一个专门的数据复制服务来写入冗余数据，如上图1-6流程：
业务方调用服务，新增数据服务先插入T1数据服务向消息总线发送一个异步消息（发出即可，不用等返回，通常很快就能完成）服务返回业务方新增数据成功消息总线将消息投递给数据同步中心数据同步中心插入T2数据优点：
请求处理时间短（只插入1次）缺点：
系统的复杂性增加了，多引入了一个组件（消息总线）和一个服务（专用的数据复制服务）因为返回业务线数据插入成功时，数据还不一定插入到T2中，因此数据有一个不一致时间窗口（这个窗口很短，最终是一致的）在消息总线丢失消息时，冗余表数据会不一致不管是服务同步双写，还是服务异步双写，服务都需要关注“冗余数据”带来的复杂性。如果想解除“数据冗余”对系统的耦合，引出常用的第三种方案。

解决硬盘冗余错误解决方法数据冗余可能导致的问题

推荐阅读

大闸蟹小龙虾怎么煮好吃又简单窍门大闸蟹小龙虾怎么煮好吃又简单

值得玩的角色手游有哪些

2020杭州西湖区喜柿牛腩煲特价活动

名称-清面六角锅，白沙溪黑茶

鹅掌木怎么修剪方法

面膜保存方法

30+可以美得不一样！39岁宋慧乔优雅知性风，35岁杨幂俏皮少女风

火柴如何扔比较安全火柴的安全扔法分享

胡辣汤做法胡辣汤如何做

苦丁茶有什么功效苦丁茶的作用

天空之外歌词（歌曲天空之外歌词）

放言十首其六原文、作者

丝瓜热量高吗

甲减的危害和注意事项关于甲减的危害和注意事项

牛腩的做法大全家常牛腩的做法

航班前站起飞是什么意思

2020春节动车售票时间请看以下的介绍

花生紫米球的做法花生紫米球的做法大全

自己按摩胸会变大吗？

抖音上买的东西在哪里看订单

解决硬盘冗余错误解决方法 数据冗余可能导致的问题

推荐阅读

解决硬盘冗余错误解决方法数据冗余可能导致的问题