分布式事务，建议掌握这3种方式！

发表于 2025-04-14 更新于 2025-04-09 分类于架构阅读次数：本文字数： 10k 阅读时长 ≈ 10 分钟

大家好呀，我是猿java。

在如今微服务架构盛行的时代，分布式系统已成为企业应对高并发、弹性扩展需求的关键。然而，随着系统的分布式特性，事务管理也变得愈加复杂。传统的单体应用中，事务通常仅涉及一个数据库，但在分布式系统中，一个业务操作可能横跨多个服务和数据库，这就引入了分布式事务的概念。本文将带领大家深入了解分布式事务，解析其原理、剖析相关源码，并通过实例演示如何在Java项目中高效实现分布式事务管理。

1. 什么是分布式事务

在传统数据库系统中，事务（Transaction）是指一组操作的集合，这些操作要么全部成功，要么全部失败，以确保数据的一致性和完整性。事务有四个基本属性，简称ACID：

原子性（Atomicity）：事务中的所有操作要么全部完成，要么全部不做。
一致性（Consistency）：事务执行前后，数据库从一个一致性状态转变到另一个一致性状态。
隔离性（Isolation）：事务的执行不被其他事务干扰。
持久性（Durability）：事务一旦提交，其结果是永久性的，即使系统崩溃也不会丢失。

1.2 分布式事务的挑战

在分布式系统中，业务操作通常涉及多个微服务和多个数据库。例如，一个电商系统的下单操作可能需要同时更新订单数据库、库存数据库和支付数据库。这时，如果任一操作失败，整个下单流程需要回滚，以保证数据的一致性。

然而，分布式环境下，事务管理面临以下挑战：

多资源管理：事务涉及多个数据库或资源，需要协调各个资源的状态。
网络延迟和故障：分布式系统中，网络问题可能导致资源不可用或请求延迟。
复杂的故障恢复：需要处理部分操作成功、部分操作失败的复杂场景，确保系统最终的一致性。

二、分布式事务的原理

为了应对分布式事务带来的复杂性，业界提出了多种解决方案。其中最经典的是两阶段提交（2PC），除此之外还有三阶段提交（3PC）、基于消息的最终一致性等。本文重点介绍两种主要的分布式事务实现方式：

2.1 两阶段提交（2PC）

两阶段提交是分布式事务管理中最经典的协议，适用于需要强一致性的场景。其流程分为两个阶段：

准备阶段（Prepare Phase）：
- 协调者（Coordinator）向所有参与者（Participants）发送“准备提交”请求。
- 每个参与者执行本地事务操作，将操作结果记录到日志（如Undo Log），然后回复协调者“准备就绪”或“失败”。
提交阶段（Commit Phase）：
- 如果协调者收到所有参与者的“准备就绪”回复，则向所有参与者发送“提交”指令。
- 如果任一参与者回复“失败”，协调者则向所有参与者发送“回滚”指令。
- 参与者根据指令执行提交或回滚操作，完成事务。

优点：

保证强一致性，所有参与者要么全部提交，要么全部回滚。

缺点：

需要阻塞资源直到事务完成，可能导致性能瓶颈。
对协调者的可靠性要求高，一旦协调者崩溃，整个事务处于不确定状态。

2.2 基于消息的最终一致性

相较于2PC，基于消息的最终一致性是一种更加灵活的事务管理方式，适用于对性能要求较高、对一致性要求相对宽松的场景。常见的实现方式包括TCC（Try-Confirm-Cancel）和Saga模式。

2.2.1 TCC模式

TCC模式将一个分布式事务拆分为三个阶段：

Try（尝试）：预留资源，执行必要的检查。
Confirm（确认）：正式提交事务，执行业务操作。
Cancel（取消）：回滚事务，释放预留资源。

优点：

保证强一致性。
可控性强，每个阶段都有明确的操作。

缺点：

开发复杂度较高，需要定义并实现各个阶段的逻辑。

2.2.2 Saga模式

Saga模式将一个分布式事务拆分为一系列的局部事务，每个局部事务都对应一个独立的业务操作。如果某个局部事务失败，则需执行之前已完成事务的补偿操作，以回滚整个事务。

优点：

更加灵活，支持长事务和高并发。
对系统性能影响较小。

缺点：

最终一致性，无法保证即时一致性。
补偿逻辑复杂，可能导致数据暂时不一致。

三、源码分析：以Seata为例

为了更深入理解分布式事务的实现机制，本文以阿里巴巴开源的Seata作为示例，剖析其核心原理和关键源码。Seata支持多种事务模式，包括AT（Automatic Transaction）、TCC等，本文将重点解析AT模式。

3.1 Seata的核心组件

Seata主要由以下几个核心组件组成：

TM（Transaction Manager）：事务管理器，用于开启、提交、回滚全局事务。
RM（Resource Manager）：资源管理器，负责具体的资源（如数据库）的操作。
TC（Transaction Coordinator）：事务协调器，负责协调各个资源管理器的事务状态。
Undo Log：回滚日志，用于记录事务的操作，以便在回滚时恢复数据。

3.2 AT模式原理

AT模式基于数据库的二阶段提交协议，通过代理数据源和拦截SQL操作来实现。

事务开启：应用通过注解或API开启一个全局事务，Seata为其分配一个唯一的事务ID（Global Transaction ID）。
SQL拦截：Seata拦截应用的SQL操作，分析出事务对数据的影响，记录到Undo Log中。
事务提交：
- 在提交阶段，Seata会向TC发送提交指令，TC协调所有RM，如果所有RM都准备就绪，则通知RM提交事务。
- RM根据指令提交事务，同时清理Undo Log。
事务回滚：
- 如果在任何阶段出现失败，TC会通知所有RM回滚事务，RM根据Undo Log恢复数据。

3.3 关键源码剖析

以下是Seata AT模式中一些关键流程的源码剖析：

3.3.1 数据源代理

Seata通过代理数据源来拦截应用的SQL操作，实现对事务的控制。以DataSourceProxy为核心类，它包装了真实的数据源，对连接和执行SQL的操作进行了拦截。

public class DataSourceProxy implements DataSource {
    private final DataSource targetDataSource;
    // 构造函数省略

    @Override
    public Connection getConnection() throws SQLException {
        return new ConnectionProxy(targetDataSource.getConnection(), this);
    }

    // 其他方法省略
}

3.3.2 事务执行流程

当应用开启一个全局事务并执行数据库操作时，Seata的GlobalTransaction类负责记录事务状态，并与TC进行通信。

public class GlobalTransactionImpl implements GlobalTransaction {
    private String xid;
    private TransactionStatus status;

    // 开启事务
    @Override
    public void begin() {
        this.xid = generateXid();
        this.status = TransactionStatus.Begin;
        // 通知TC开启事务
    }

    // 提交事务
    @Override
    public void commit() {
        // 通知各RM提交事务
    }

    // 回滚事务
    @Override
    public void rollback() {
        // 通知各RM回滚事务
    }

    // 其他方法省略
}

3.3.3 Undo Log记录

在执行SQL操作之前，Seata会记录Undo Log，以便在需要时回滚事务。UndoLogManager负责管理Undo Log的写入和读取。

public class UndoLogManager {
    public void writeUndoLog(Connection conn, String sql) {
        // 解析SQL，生成对应的Undo SQL，并写入Undo Log表
    }

    public void rollback(String xid) {
        // 根据xid读取Undo Log，执行Undo SQL
    }

    // 其他方法省略
}

3.4 Seata的优缺点

优点：

高效透明：Seata对应用几乎无侵入，采用代理模式，实现高效的事务管理。
多样化模式：支持AT、TCC等多种事务模式，适应不同业务需求。
开源社区活跃：拥有广泛的社区支持和丰富的文档资源。

缺点：

学习曲线：对于初学者，理解Seata的内部机制需要一定时间。
性能开销：在高并发场景下，事务管理可能引入一定的性能开销，需要进行合理的配置和优化。

四、示例演示：使用Seata实现分布式事务

为了更直观地理解分布式事务的实现，下面通过一个简单的Spring Boot项目，演示如何使用Seata实现跨服务的分布式事务管理。

4.1 环境准备

安装并启动Seata Server

从Seata GitHub下载最新版本的Seata，解压后进入bin目录，修改registry.conf配置文件，设置注册中心（如Nacos、ZooKeeper），然后启动Seata Server：
1
sh seata-server.sh -p 8091 -m file
配置数据库

假设有两个数据库实例：order_db和inventory_db，分别用于订单服务和库存服务，创建相应的数据表。

4.2 创建订单服务和库存服务

4.2.1 订单服务（Order Service）

pom.xml中添加Seata相关依赖：

<dependencies>
    <!-- Spring Boot Starter -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
    <!-- Seata Starter -->
    <dependency>
        <groupId>io.seata</groupId>
        <artifactId>seata-spring-boot-starter</artifactId>
        <version>1.5.2</version>
    </dependency>
    <!-- MySQL Driver -->
    <dependency>
        <groupId>mysql</groupId>
        <artifactId>mysql-connector-java</artifactId>
        <scope>runtime</scope>
    </dependency>
    <!-- JPA and Hibernate -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-data-jpa</artifactId>
    </dependency>
</dependencies>

application.yml配置Seata和数据库：

spring:
  application:
    name: order-service
  datasource:
    url: jdbc:mysql://localhost:3306/order_db
    username: root
    password: 123456
    driver-class-name: com.mysql.cj.jdbc.Driver
  jpa:
    hibernate:
      ddl-auto: update
    show-sql: true

seata:
  enabled: true
  application-id: order-service
  tx-service-group: order-service-group

OrderServiceApplication.java启用Seata数据源代理：

@SpringBootApplication
@EnableAutoDataSourceProxy
public class OrderServiceApplication {
    public static void main(String[] args) {
        SpringApplication.run(OrderServiceApplication.class, args);
    }
}

OrderController.java编写下单接口：

@RestController
public class OrderController {

    @Autowired
    private OrderRepository orderRepository;

    @Autowired
    private InventoryClient inventoryClient;

    @PostMapping("/order")
    @GlobalTransactional(timeoutMills = 300000, name = "create-order")
    public String createOrder(@RequestParam("userId") Long userId,
                              @RequestParam("productId") Long productId,
                              @RequestParam("quantity") Integer quantity) {
        // 创建订单
        Order order = new Order();
        order.setUserId(userId);
        order.setProductId(productId);
        order.setQuantity(quantity);
        orderRepository.save(order);

        // 调用库存服务扣减库存
        inventoryClient.decrease(productId, quantity);

        return "Order created successfully";
    }
}

Order.java定义订单实体：

@Entity
public class Order {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;
    private Long userId;
    private Long productId;
    private Integer quantity;
    // getters and setters
}

OrderRepository.java定义订单仓库：

1 2	public interface OrderRepository extends JpaRepository<Order, Long> { }

4.2.2 库存服务（Inventory Service）

库存服务与订单服务类似，也需要配置Seata和数据库。

pom.xml添加Seata依赖：

<dependencies>
    <!-- Spring Boot Starter -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
    <!-- Seata Starter -->
    <dependency>
        <groupId>io.seata</groupId>
        <artifactId>seata-spring-boot-starter</artifactId>
        <version>1.5.2</version>
    </dependency>
    <!-- MySQL Driver -->
    <dependency>
        <groupId>mysql</groupId>
        <artifactId>mysql-connector-java</artifactId>
        <scope>runtime</scope>
    </dependency>
    <!-- JPA and Hibernate -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-data-jpa</artifactId>
    </dependency>
</dependencies>

application.yml配置Seata和数据库：

spring:
  application:
    name: inventory-service
  datasource:
    url: jdbc:mysql://localhost:3306/inventory_db
    username: root
    password: 123456
    driver-class-name: com.mysql.cj.jdbc.Driver
  jpa:
    hibernate:
      ddl-auto: update
    show-sql: true

seata:
  enabled: true
  application-id: inventory-service
  tx-service-group: inventory-service-group

InventoryServiceApplication.java启用Seata数据源代理：

@SpringBootApplication
@EnableAutoDataSourceProxy
public class InventoryServiceApplication {
    public static void main(String[] args) {
        SpringApplication.run(InventoryServiceApplication.class, args);
    }
}

InventoryController.java编写扣减库存接口：

@RestController
public class InventoryController {

    @Autowired
    private InventoryRepository inventoryRepository;

    @PostMapping("/inventory/decrease")
    @Transactional
    public String decrease(@RequestParam("productId") Long productId,
                           @RequestParam("quantity") Integer quantity) {
        Inventory inventory = inventoryRepository.findByProductId(productId);
        if (inventory.getQuantity() < quantity) {
            throw new RuntimeException("Insufficient inventory");
        }
        inventory.setQuantity(inventory.getQuantity() - quantity);
        inventoryRepository.save(inventory);
        return "Inventory decreased successfully";
    }
}

Inventory.java定义库存实体：

@Entity
public class Inventory {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;
    private Long productId;
    private Integer quantity;
    // getters and setters
}

InventoryRepository.java定义库存仓库：

1
2
3

public interface InventoryRepository extends JpaRepository<Inventory, Long> {
    Inventory findByProductId(Long productId);
}

InventoryClient.java定义Feign客户端用于订单服务调用库存服务：

@FeignClient(name = "inventory-service")
public interface InventoryClient {
    @PostMapping("/inventory/decrease")
    String decrease(@RequestParam("productId") Long productId,
                    @RequestParam("quantity") Integer quantity);
}

4.3 运行测试

启动Seata Server
1
sh seata-server.sh -p 8091 -m file
启动库存服务

运行InventoryServiceApplication，确保inventory_db中存在对应的产品和库存记录。
启动订单服务

运行OrderServiceApplication。
发起下单请求

使用Postman或curl发送POST请求：
1
curl -X POST "http://localhost:8081/order?userId=1&productId=1001&quantity=2"
- 成功场景：如果库存充足，订单创建和库存扣减都会成功。
- 失败场景：如果库存不足，则订单创建和库存扣减会回滚，确保数据一致性。

五、分布式事务的挑战与优化

尽管分布式事务提供了数据一致性的保障，但在实际应用中仍面临诸多挑战。以下是一些常见的问题及优化方案：

5.1 性能开销

问题：分布式事务需要协调多个资源，涉及网络通信和日志记录，可能导致延迟增加和吞吐量下降。

优化方案：

减小事务范围：尽量将事务控制在单一服务内部，减少跨服务的事务操作。
异步处理：对于某些业务场景，允许采用异步方式处理，降低事务对实时性能的影响。
批量操作：合并多个操作为一个批量操作，减少事务协调次数。

5.2 容错处理

问题：在分布式环境下，网络分区、服务故障等问题常见，确保事务的一致性和容错能力是一大挑战。

优化方案：

重试机制：在事务协调过程中，引入重试机制，处理临时性的网络或服务故障。
幂等操作：确保事务的每个操作具备幂等性，避免因重复执行导致的数据不一致。
监控与报警：建立完善的监控体系，实时监控事务状态和执行情况，及时发现和处理异常。

5.3 可扩展性限制

问题：分布式事务可能限制系统的横向扩展能力，特别是在事务协调器成为性能瓶颈时。

优化方案：

分片协调器：将事务协调器进行分片，分担事务管理的压力。
无状态协调：设计事务协调器为无状态服务，便于横向扩展和高可用部署。
轻量级协议：优化事务协议，减少协调器与资源管理器之间的通信次数和数据量。

六、结论

分布式事务是微服务架构中保障数据一致性的重要机制。通过理解其原理、剖析Seata等开源框架的源码，并结合实际场景进行示例演示，开发人员可以更好地应用分布式事务技术，解决跨服务的数据一致性问题。然而，分布式事务也带来了性能、复杂性等方面的挑战，需要在实际应用中权衡利弊，选择合适的事务管理方案。

随着技术的发展，越来越多的框架和工具涌现，提供了更加高效和灵活的分布式事务解决方案。持续学习和实践，将帮助开发人员在复杂的分布式系统中游刃有余，构建高性能、高可用的业务应用。

希望本文能够帮助Java开发人员深入理解分布式事务，掌握其实现原理，并在实际项目中灵活应用，为构建健壮的分布式系统奠定坚实的基础。

7. 学习交流

如果你觉得文章有帮助，请帮忙转发给更多的好友，或关注公众号：猿java，持续输出硬核文章。