🚀 MySQL 批量导入数据性能优化实战：关闭索引 + 事务 + 预编译，速度提升 20 倍！🌩️ 背景：当数据量成

🌩️ 背景：当数据量成为性能杀手

在电商大促、日志分析、数据迁移等场景中，批量导入海量数据 是高频操作。但传统的逐条插入方式（如 INSERT INTO ... VALUES (...)）会导致性能急剧下降，甚至引发数据库雪崩。

一次真实的性能灾难：
某平台在迁移用户数据时，因未做优化，导入 100 万条数据耗时 30 分钟，直接导致数据库连接池耗尽，服务瘫痪。

本文将揭秘 关闭索引、开启事务、预编译语句 三大核心优化手段，并通过完整案例对比性能差距，带你实现从“龟速”到“光速”的质变！

🔥 性能优化三大杀器

1. 关闭索引：斩断“枷锁”

问题：每次插入数据时，MySQL 需要同步更新索引（B+树重组），消耗 30%~50% 的 I/O 时间。
解决方案：

-- 导入前禁用索引（主键除外）
ALTER TABLE your_table DISABLE KEYS;  

-- 导入后重建索引（比逐条更新快 10 倍）
ALTER TABLE your_table ENABLE KEYS;

效果：避免索引维护开销，写入速度提升 3~5 倍。

2. 开启事务：化零为整

问题：默认每条 INSERT 自动提交事务，频繁刷盘（fsync）导致磁盘 I/O 暴增。
解决方案：

START TRANSACTION;  -- 开启事务
-- 执行批量插入
COMMIT;             -- 统一提交

效果：将 N 次磁盘 I/O 合并为 1 次，速度提升 5~10 倍。

3. 预编译语句：拒绝重复劳动

问题：每条 INSERT 需经历 SQL 解析、编译、优化，浪费 CPU 资源。
解决方案：使用 PreparedStatement 预编译 SQL 模板：

String sql = "INSERT INTO users (name, age) VALUES (?, ?)";  
PreparedStatement pstmt = conn.prepareStatement(sql);  

// 循环绑定参数
for (User user : userList) {  
    pstmt.setString(1, user.getName());  
    pstmt.setInt(2, user.getAge());  
    pstmt.addBatch();  // 加入批处理
}  

pstmt.executeBatch();  // 批量执行

效果：减少 SQL 解析开销，速度提升 2~3 倍。

⚡ 实战案例：10万条数据导入对决

1. 环境准备

表结构：

CREATE TABLE `user` (  
  `id` INT(11) NOT NULL AUTO_INCREMENT,  
  `name` VARCHAR(50) NOT NULL,  
  `age` INT(11) NOT NULL,  
  PRIMARY KEY (`id`),  
  KEY `idx_name` (`name`)  
) ENGINE=InnoDB;

数据量：10 万条用户记录。
硬件：4 核 CPU / 8GB 内存 / SSD 磁盘。

2. 性能对决：优化 vs 未优化

2.1 未优化：逐条插入

// Java 伪代码  
for (int i = 0; i < 100000; i++) {  
    String sql = "INSERT INTO user (name, age) VALUES ('User" + i + "', 20)";  
    statement.executeUpdate(sql);  // 逐条执行  
}

结果：

耗时：98 秒
磁盘 I/O：持续 100%
CPU 使用率：60%（大量时间消耗在 SQL 解析）

2.2 优化后：三剑客合璧

// Java 伪代码  
try (Connection conn = dataSource.getConnection()) {  
    conn.setAutoCommit(false);  // 关闭自动提交  
    
    // 禁用索引（主键不可禁用）
    try (Statement stmt = conn.createStatement()) {  
        stmt.execute("ALTER TABLE user DISABLE KEYS");  
    }  

    // 预编译 + 批处理  
    String sql = "INSERT INTO user (name, age) VALUES (?, ?)";  
    try (PreparedStatement pstmt = conn.prepareStatement(sql)) {  
        for (int i = 0; i < 100000; i++) {  
            pstmt.setString(1, "User" + i);  
            pstmt.setInt(2, 20);  
            pstmt.addBatch();  

            if (i % 5000 == 0) {  
                pstmt.executeBatch();  // 分批次提交  
            }  
        }  
        pstmt.executeBatch();  
    }  

    // 启用索引  
    try (Statement stmt = conn.createStatement()) {  
        stmt.execute("ALTER TABLE user ENABLE KEYS");  
    }  

    conn.commit();  // 提交事务  
}

结果：

耗时：4.2 秒 ✅
磁盘 I/O：仅 2 次峰值（事务提交时）
CPU 使用率：30%（资源利用率更均衡）

3. 性能对比报表

指标	未优化	优化后	提升倍数
总耗时	98 秒	4.2 秒	23x
磁盘 I/O 峰值	100%	20%	5x
事务提交次数	10 万	1	10万x
SQL 解析次数	10 万	1	10万x

🛠️ 避坑指南

1. 索引禁用的注意事项

主键无法禁用：ALTER TABLE ... DISABLE KEYS 对主键无效。
唯一索引风险：禁用后插入重复数据，启用索引时会报错。
重建索引耗时：数据量极大时，ENABLE KEYS 可能较慢，需预留时间。

2. 事务的批次控制

批次大小：每 5000~10000 条提交一次，避免内存溢出（OOM）。
错误回滚：捕获异常时执行 conn.rollback()，避免脏数据。

3. 预编译的参数绑定

防 SQL 注入：必须使用 setXxx() 绑定参数，禁止拼接 SQL。
类型匹配：setString、setInt 需与字段类型一致。

🚀 终极性能秘籍

并行导入：拆分为多线程，每个线程处理一个数据分片。
LOAD DATA INFILE：直接导入 CSV 文件，速度比 INSERT 快 10 倍。
调整参数：临时增大 innodb_buffer_pool_size、bulk_insert_buffer_size。

🌟 All Suggest

通过 关闭索引、开启事务、预编译语句 三项优化，我们实现了 10 万条数据导入从 98 秒到 4.2 秒的飞跃。

记住这个公式：
性能提升 = 减少磁盘 I/O + 降低 CPU 开销 + 利用批处理