`
yale
  • 浏览: 356832 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

替代分布式事务策略

 
阅读更多

由于数据量的巨大,现在大部分的Web应用都需要部署很多个数据库实例。这样,有时候某些操作就可能需要去修改多个数据库实例中的数据。传统的解决方法是使用分布式事务保证数据的全局一致性,经典的方法是使用两阶段事务提交(我的blog中已经提到过),现在MySQL和PostgreSQL这类面向低端用户的开源数据库都支持分布式事务了,开发者泪在其中的同时,却没有考虑分布式事务是否给系统带来了伤害。

 

分布式事务提供的原则保证是以损害系统的可用性、性能与可伸缩性为代价的。只有在参与分布式事务的各个数据库实例都能够正常工作的前提下,分布式事务才能够顺利完成,只要有一个工作不正常,整个事务就不能完成。这样,系统的可用性就相当于参加分布式事务的各实例的可用性之积,实例越多,可用性下降越明显。从性能和可伸缩性角度看,首先是事务的总持续时间通常是各实例操作时间之和,因为一个事务中的各个操作通常是顺序执行的,这样事务的响应时间就会增加很多;其次是一般Web应用的事务都不大,单机操作时间也就几毫秒甚至不到1毫秒,一但涉及到分布式事务,提交时节点间的网络通信往返过程也为毫秒级别,对事务响应时间的影响也不可忽视。由于事务持续时间延长,事务对相关资源的锁定时间也相应增加,从而可能严重增加了并发冲突,影响到系统吞吐率和可伸缩性。

 

正是由于分布式事务有以上问题,在设计上就可以不采用分布式事务,而是通过其它途径来解决数据一致性问题。其中使用的最重要的技术就是消息队列和消息应用状态表。
举个例子。假设系统中有以下两个表:库存表、出入库明细表,其中库存表(记录商品当前库存、初期库存、末期库存),出入库明细表(记录每个商品出入的详细信息)这样,在进行一笔交易时,若使用事务,就需要对数据库进行以下操作:
事务开始;
插入数据到出入库明细表中;
更新库存表;
提交事务;

假设库存表和出入库明细表存储在不同的节点上,那么上述事务就是一个分布式事务。要消除这一分布式事务,将它拆分成两个子事务,一个写入数据到出入库明细表,一个更新库存表,这样做是不行的,因为有可能出入库明细表写入成功后,更新库存表失败,系统将不能恢复到一致状态。

 

解决方案是使用消息队列。如下所示,先启动一个事务,写入数据到出入库明细表后,并不直接去更新库存表,而是将要对库存表进行的更新插入到消息队列中。另外有一个异步任务轮询队列内容进行处理。

那么我们现在就需要将消息队列中的信息放到库存表中来提交第二个事务,提交成功后,再从消息队列中删除该消息。由于消息队列存储与库存表不在一起,可能还没来得及将应用过的消息从队列中删除时系统就出故障了。这时系统恢复后会重新应用一次这一消息,由于幂等性,应用多次也能产生正确的结果。

 

但实际情况下,消息很难具有幂等性,对某表执行一次和执行多次相同的sql语句(insert、update等语句)的结束显然是不一样的。解决这一问题的方法是使用另一个表记录已经被成功应用的消息,并且这个表使用与库存表相同的存储。

我们来仔细分析一下:
1、消息队列与出入库使用同一实例,因此第一个事务不涉及分布式操作;
2、新添加的表与库存表在同一个实例中,也能保证一致性;
3、第二个事务结束后,如果出故障,那么系统会重新从消息队列中取出这一消息,但通过新添加的表可以检查出来这一消息已经被应用过,跳过这一消息实现正确的行为;
4、最后将已经成功应用,且已经从消息队列中删除的消息从新添加的表中删除,可以将新添加的表保证在很小的状态(不清除也是可以的,不影响系统正确性)。由于消息队列与新添加的表在不同实例上,将对应新添加的表的记录删除之前可能出故障。一但这时出现故障,新添加的表中会留下一些垃圾内容,但不影响系统正确性,另外这些垃圾内容也是可以正确清理的。虽然由于没有分布式事务的强一致性保证,使用上述方案在系统发生故障时,系统将短时间内处于不一致状态。但基于消息队列和消息应用状态表,最终可以将系统恢复到一致。使用消息队列方案,解除了两个数据库实例之间的紧密耦合,其性能和可伸缩性是分布式事务不可比拟的。

 

当然,使用分布式事务有助于简化应用开发,使用消息队列明显需要更多的工作量,两者各有优缺点。个人观点是,对于时间紧迫或者对性能要求不高的系统,应采用分布式事务加快开发效率,对于时间需求不是很紧,对性能要求很高的系统,应考虑使用消息队列方案。对于原使用分布式事务,且系统已趋于稳定,性能要求高的系统,则可以使用消息队列方案进行重构来优化性能。

 

1
1
分享到:
评论
3 楼 guoshun0321 2014-07-23  
如果在第一次提交时,数据写入到消息队列后,如果由于网络故障,消息没有即使返回给应用程序,导致应用程序超时,整个应用回滚。那么消息队列里面是有数据的,数据库里面本次操作是无效的。这样就会导致数据的不一致性。
2 楼 heipacker 2014-04-02  
楼主这方案明显不行啊
1 楼 ruanzy888888 2014-02-13  
若第一个失败了,第二个成功了呢?

相关推荐

    PetShop4.0源码 详细的解析资料 两种同步和基于MSMQ的异步处理 缓存处理策略 Master Pages Wizard Control

    System.Transactions是.NET Framework 2.0下出现的一个事务控制的命名空间,它是处理替代COM+来处理分布式事务的一种新的途径。 2.使用泛型的强类型代替了IList。 3.使用了ASP.NET2.0下的角色及成员管理。 4.对于...

    petshop(宠物商店) V4.0源码文件

    System.Transactions是.NET Framework 2.0下出现的一个事务控制的命名空间,它是处理替代COM+来处理分布式事务的一种新的途径。 2.使用泛型的强类型代替了IList。 3.使用了ASP.NET2.0下的角色及成员管理。 4.对于...

    dbproxy]基于阿里cobar增强的opencloudb

    • 支持事务、ACID、可以替代Mysql的加强版数据库 • 一个可以视为“Mysql”集群的企业级数据库,用来替代昂贵的Oracle集群 • 一个融合内存缓存技术、Nosql技术、HDFS大数据的新型SQL Server • 结合传统数据库和...

    Mycat数据库中间件-其他

    支持分布式事务(弱xa)。 支持全局序列号,解决分布式下的主键生成问题。 分片规则丰富,插件化开发,易于扩展。 强大的web,命令行监控。 支持前端作为mysq通用代理,后端JDBC方式支持Oracle、DB2、SQL Server、...

    Mycat数据库中间件 v1.13

    支持分布式事务(弱xa)。 支持全局序列号,解决分布式下的主键生成问题。 分片规则丰富,插件化开发,易于扩展。 强大的web,命令行监控。 支持前端作为mysq通用代理,后端JDBC方式支持Oracle、DB2、SQL Server...

    Mycat2数据库中间件-其他

    支持分布式事务(弱xa)。支持全局序列号,解决分布式下的主键生成问题。分片规则丰富,插件化开发,易于扩展。强大的web,命令行监控。支持前端作为mysq通用代理,后端JDBC方式支持Oracle、DB2、SQL Server、...

    高性能MySQL(第3版).part2

    7.11分布式(XA)事务307 7.11.1内部XA事务307 7.11.2外部XA事务308 7.12查询缓存309 7.12.1MySQL如何判断缓存命中309 7.12.2查询缓存如何使用内存311 7.12.3什么情况下查询缓存能发挥作用313 7.12.4如何配置...

    经典JAVA.EE企业应用实战.基于WEBLOGIC_JBOSS的JSF_EJB3_JPA整合开发.pdf

    4.2.2 分布式事务处理、XA规范和 2PC协议 192 4.2.3 使用JTA全局事务保证多 数据库的一致性 193 4.3 事务隔离、传播属性的设置 198 4.3.1 并发访问和隔离 198 4.3.2 事务属性 199 4.4 EJB的事务管理 201 4.4.1 容器...

    ASP3《高级编程》(第一部分)

    13.1 分布式应用程序的结构 408 13.1.1 分层应用程序 408 13.1.2 Windows DNA 410 13.1.3 Windows DNA服务 411 13.1.4 网络结构 413 13.2 组件 415 13.2.1 组件定义 415 13.2.2 COM和COM+ 415 13.2.3 组件...

    ASP3《高级编程》(第二部分)

    13.1 分布式应用程序的结构 408 13.1.1 分层应用程序 408 13.1.2 Windows DNA 410 13.1.3 Windows DNA服务 411 13.1.4 网络结构 413 13.2 组件 415 13.2.1 组件定义 415 13.2.2 COM和COM+ 415 13.2.3 组件...

    iBATIS实战

    3.3.3 分布式高速缓存 49 3.4 将iBATIS添加到应用程序中 49 3.4.1 在独立应用程序中使用iBATIS 50 3.4.2 在Web应用程序中使用iBATIS 50 3.5 iBATIS和JDBC 51 3.5.1 释放JDBC资源 51 3.5.2 SQL注入 51 3.5.3 降低...

    SQL Server 2008数据库设计与实现

     8.3.4 不同的服务器(分布式查询)  8.4 视图与表值函数  8.4.1 一般用法  8.4.2 使用视图实现可配置的行级安全  8.5 数据混淆  8.6 监视与审核  8.6.1 服务器与数据库审核  8.6.2 使用DML触发器...

    Oracle9i的init.ora参数中文说明

    说明: 确定查询是否获取表级的读取锁, 以防止在包含该查询的事务处理被提交之前更新任何对象读取。这种操作模式提供可重复的读取, 并确保在同一事务处理种对相同数据的两次查询看到的是相同的值。 值范围: TRUE | ...

    Java核心技术II(第8版)

    9.3.2 安全策略文件 9.3.3 定制权限 9.3.4 实现权限类 9.4 用户认证 9.4.1 JAAS 登录模块 9.5 数字签名 9.5.1 消息摘要 9.5.2 消息签名 9.5.3 X.509证书格式 9.5.4 校验签名 9.5.5 认证问题 9.5.6 证书签名 9.5.7 ...

    asp.net知识库

    体验.net2.0的优雅(四):Provider、策略、控制反转和依赖注入 泛型最佳实践 asp.net 2.0下嵌套masterpage页的可视化编辑 C# 2.0与泛型 动态调用对象的属性和方法——性能和灵活性兼备的方法 泛型技巧系列:用泛型...

Global site tag (gtag.js) - Google Analytics