Java 合并 Excel 文件的几种实用方法

6 阅读4分钟

在企业应用中,处理 Excel 文件是非常常见的需求,无论是财务报表、销售统计,还是数据分析,合并 Excel 文件都是必不可少的操作。不同的业务场景对合并方式的要求也各不相同,以下是几类常见的 Excel 合并场景:

  • 按文件合并:将多个 Excel 文件的数据整合到一个新文件中,每个文件对应一个工作表。
  • 合并工作表:将同一工作簿中不同工作表的数据汇总到一个工作表中,方便统计和分析。
  • 批量合并:处理大量 Excel 文件,将所有数据汇总到统一格式的表格中。
  • 统一表头:多个文件的表头可能不一致,合并时需要先统一表头再整合数据。

接下来,我们将结合这些场景,介绍几种在 Java 中实现 Excel 文件合并的方法。

环境准备与依赖安装

在开始操作之前,需要准备以下环境:

  • Java 8 或以上版本
  • Spire.XLS for Java(支持 Excel 2003、2007及以上版本)
  • IDE(如 IntelliJ IDEA 或 Eclipse)

在项目中引入 Spire.XLS 依赖:

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.xls</artifactId>
        <version>16.3.2</version>
    </dependency>
</dependencies>

注意:版本号根据你实际下载的 Spire.XLS for Java 版本替换即可。

示例一:合并多个 Excel 文件

如果需要将多个 Excel 文件合并到一个新文件,可以通过逐个文件、逐个工作表复制的方式实现。使用 ​​Workbook.getWorksheets().addCopy()​​ 方法可以完整保留工作表的内容,包括数据、格式、公式、图表和条件格式。在处理较大文件时,建议每次加载一个文件,以避免内存占用过高。

import com.spire.xls.*;

public class MergeExcels {
    public static void main(String[] args){
        String[] inputFiles = new String[]{"Budget Summary.xlsx", "Income.xlsx", "Expenses.xlsx"};

        Workbook newBook = new Workbook();
        newBook.getWorksheets().clear();
        Workbook tempBook = new Workbook();

        for (String file : inputFiles) {
            tempBook.loadFromFile(file);
            for (Worksheet sheet : (Iterable) tempBook.getWorksheets()) {
                newBook.getWorksheets().addCopy(sheet, WorksheetCopyType.CopyAll);
            }
        }

        newBook.saveToFile("MergeFiles.xlsx", ExcelVersion.Version2013);
        System.out.println("合并完成!");
    }
}

示例二:将多个工作表的数据合并到同一个工作表

当需要将多个工作表的数据汇总到同一个总表时,可以选定一个主工作表,将其他工作表的数据追加到其末尾。使用 ​​CellRange.copy()​​ 方法可以精确复制数据区域,同时保持原有的单元格格式和样式。处理时要注意跳过表头,避免重复添加。

import com.spire.xls.*;

public class MergeExcelWorksheets {
    public static void main(String[] args){
        Workbook workbook = new Workbook();
        workbook.loadFromFile("input.xlsx");

        Worksheet sheet1 = workbook.getWorksheets().get(0);
        Worksheet sheet2 = workbook.getWorksheets().get(1);

        CellRange sourceRange = sheet2.getAllocatedRange();
        CellRange destRange = sheet1.getCellRange(sheet1.getLastRow() + 1, 1);

        sourceRange.copy(destRange);
        sheet2.remove();

        workbook.saveToFile("MergeWorksheets.xlsx", ExcelVersion.Version2013);
        System.out.println("工作表数据合并完成!");
    }
}

示例三:批量合并目录下的 Excel 文件

如果要处理整个目录中的所有 Excel 文件,可以遍历文件夹,按文件和工作表顺序复制到新的工作簿。​​addCopy()​​ 方法同样适用,这样可以一次性处理大量报表,提高效率。处理大量文件时,最好按文件分批加载,以减少内存压力。

import com.spire.xls.*;
import java.io.File;

public class MergeExcelDirectory {
    public static void main(String[] args){
        File folder = new File("excel_folder");
        File[] files = folder.listFiles((dir, name) -> name.endsWith(".xlsx"));

        Workbook newBook = new Workbook();
        newBook.getWorksheets().clear();
        Workbook tempBook = new Workbook();

        for (File file : files) {
            tempBook.loadFromFile(file.getAbsolutePath());
            for (Worksheet sheet : (Iterable) tempBook.getWorksheets()) {
                newBook.getWorksheets().addCopy(sheet, WorksheetCopyType.CopyAll);
            }
        }

        newBook.saveToFile("MergedDirectory.xlsx", ExcelVersion.Version2013);
        System.out.println("批量合并完成!");
    }
}

示例四:合并 Excel 文件并统一表头

当源文件表头不一致或缺失时,可以先在目标工作表中设置统一表头,然后将各文件的数据依次复制到对应位置。​​CellRange.copy()​​ 可以确保数据正确对齐,行号累加避免覆盖。这样可以生成结构一致的总表,便于后续分析或统计。

import com.spire.xls.*;

public class MergeWithHeader {
    public static void main(String[] args){
        String[] files = {"Jan.xlsx", "Feb.xlsx", "Mar.xlsx"};
        Workbook workbook = new Workbook();
        workbook.getWorksheets().clear();
        Worksheet masterSheet = workbook.getWorksheets().add("Summary");

        masterSheet.getCellRange("A1").setText("日期");
        masterSheet.getCellRange("B1").setText("销售额");
        masterSheet.getCellRange("C1").setText("成本");

        int currentRow = 2;
        Workbook temp = new Workbook();

        for (String file : files) {
            temp.loadFromFile(file);
            Worksheet sheet = temp.getWorksheets().get(0);
            CellRange dataRange = sheet.getAllocatedRange();
            CellRange dest = masterSheet.getCellRange(currentRow, 1);
            dataRange.copy(dest);
            currentRow += dataRange.getRowCount();
        }

        workbook.saveToFile("MergedWithHeader.xlsx", ExcelVersion.Version2013);
        System.out.println("数据合并并统一表头完成!");
    }
}

合并 Excel 文件的注意事项

  • 列结构一致性:按行合并时注意各工作表的列顺序和数量,避免数据错位。
  • 数据类型保持一致:数字、日期、文本类型最好统一。
  • 内存优化:批量处理大量文件时,可分批加载,避免内存占用过高。
  • 格式保留:需要保留公式、样式和图表时,使用 WorksheetCopyType.CopyAll
  • 表头统一:合并数据前最好统一表头,特别是源文件列名不一致时。

总结

本文介绍了 Java 中四种常用的 Excel 合并方法:

  1. 按文件合并:完整保留每个工作表,适合整合报表或项目数据。
  2. 合并工作表数据到单表:将多个工作表数据汇总到一个总表,便于统计分析。
  3. 批量合并目录下文件:一次性处理整个目录中的 Excel 文件,提高效率。
  4. 统一表头合并:在源文件表头不一致的情况下,生成结构统一的总表。

通过合理选择方法,可以显著提高处理 Excel 数据的效率和准确性。