在企业应用中,处理 Excel 文件是非常常见的需求,无论是财务报表、销售统计,还是数据分析,合并 Excel 文件都是必不可少的操作。不同的业务场景对合并方式的要求也各不相同,以下是几类常见的 Excel 合并场景:
- 按文件合并:将多个 Excel 文件的数据整合到一个新文件中,每个文件对应一个工作表。
- 合并工作表:将同一工作簿中不同工作表的数据汇总到一个工作表中,方便统计和分析。
- 批量合并:处理大量 Excel 文件,将所有数据汇总到统一格式的表格中。
- 统一表头:多个文件的表头可能不一致,合并时需要先统一表头再整合数据。
接下来,我们将结合这些场景,介绍几种在 Java 中实现 Excel 文件合并的方法。
环境准备与依赖安装
在开始操作之前,需要准备以下环境:
- Java 8 或以上版本
- Spire.XLS for Java(支持 Excel 2003、2007及以上版本)
- IDE(如 IntelliJ IDEA 或 Eclipse)
在项目中引入 Spire.XLS 依赖:
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.xls</artifactId>
<version>16.3.2</version>
</dependency>
</dependencies>
注意:版本号根据你实际下载的 Spire.XLS for Java 版本替换即可。
示例一:合并多个 Excel 文件
如果需要将多个 Excel 文件合并到一个新文件,可以通过逐个文件、逐个工作表复制的方式实现。使用 Workbook.getWorksheets().addCopy() 方法可以完整保留工作表的内容,包括数据、格式、公式、图表和条件格式。在处理较大文件时,建议每次加载一个文件,以避免内存占用过高。
import com.spire.xls.*;
public class MergeExcels {
public static void main(String[] args){
String[] inputFiles = new String[]{"Budget Summary.xlsx", "Income.xlsx", "Expenses.xlsx"};
Workbook newBook = new Workbook();
newBook.getWorksheets().clear();
Workbook tempBook = new Workbook();
for (String file : inputFiles) {
tempBook.loadFromFile(file);
for (Worksheet sheet : (Iterable) tempBook.getWorksheets()) {
newBook.getWorksheets().addCopy(sheet, WorksheetCopyType.CopyAll);
}
}
newBook.saveToFile("MergeFiles.xlsx", ExcelVersion.Version2013);
System.out.println("合并完成!");
}
}
示例二:将多个工作表的数据合并到同一个工作表
当需要将多个工作表的数据汇总到同一个总表时,可以选定一个主工作表,将其他工作表的数据追加到其末尾。使用 CellRange.copy() 方法可以精确复制数据区域,同时保持原有的单元格格式和样式。处理时要注意跳过表头,避免重复添加。
import com.spire.xls.*;
public class MergeExcelWorksheets {
public static void main(String[] args){
Workbook workbook = new Workbook();
workbook.loadFromFile("input.xlsx");
Worksheet sheet1 = workbook.getWorksheets().get(0);
Worksheet sheet2 = workbook.getWorksheets().get(1);
CellRange sourceRange = sheet2.getAllocatedRange();
CellRange destRange = sheet1.getCellRange(sheet1.getLastRow() + 1, 1);
sourceRange.copy(destRange);
sheet2.remove();
workbook.saveToFile("MergeWorksheets.xlsx", ExcelVersion.Version2013);
System.out.println("工作表数据合并完成!");
}
}
示例三:批量合并目录下的 Excel 文件
如果要处理整个目录中的所有 Excel 文件,可以遍历文件夹,按文件和工作表顺序复制到新的工作簿。addCopy() 方法同样适用,这样可以一次性处理大量报表,提高效率。处理大量文件时,最好按文件分批加载,以减少内存压力。
import com.spire.xls.*;
import java.io.File;
public class MergeExcelDirectory {
public static void main(String[] args){
File folder = new File("excel_folder");
File[] files = folder.listFiles((dir, name) -> name.endsWith(".xlsx"));
Workbook newBook = new Workbook();
newBook.getWorksheets().clear();
Workbook tempBook = new Workbook();
for (File file : files) {
tempBook.loadFromFile(file.getAbsolutePath());
for (Worksheet sheet : (Iterable) tempBook.getWorksheets()) {
newBook.getWorksheets().addCopy(sheet, WorksheetCopyType.CopyAll);
}
}
newBook.saveToFile("MergedDirectory.xlsx", ExcelVersion.Version2013);
System.out.println("批量合并完成!");
}
}
示例四:合并 Excel 文件并统一表头
当源文件表头不一致或缺失时,可以先在目标工作表中设置统一表头,然后将各文件的数据依次复制到对应位置。CellRange.copy() 可以确保数据正确对齐,行号累加避免覆盖。这样可以生成结构一致的总表,便于后续分析或统计。
import com.spire.xls.*;
public class MergeWithHeader {
public static void main(String[] args){
String[] files = {"Jan.xlsx", "Feb.xlsx", "Mar.xlsx"};
Workbook workbook = new Workbook();
workbook.getWorksheets().clear();
Worksheet masterSheet = workbook.getWorksheets().add("Summary");
masterSheet.getCellRange("A1").setText("日期");
masterSheet.getCellRange("B1").setText("销售额");
masterSheet.getCellRange("C1").setText("成本");
int currentRow = 2;
Workbook temp = new Workbook();
for (String file : files) {
temp.loadFromFile(file);
Worksheet sheet = temp.getWorksheets().get(0);
CellRange dataRange = sheet.getAllocatedRange();
CellRange dest = masterSheet.getCellRange(currentRow, 1);
dataRange.copy(dest);
currentRow += dataRange.getRowCount();
}
workbook.saveToFile("MergedWithHeader.xlsx", ExcelVersion.Version2013);
System.out.println("数据合并并统一表头完成!");
}
}
合并 Excel 文件的注意事项
- 列结构一致性:按行合并时注意各工作表的列顺序和数量,避免数据错位。
- 数据类型保持一致:数字、日期、文本类型最好统一。
- 内存优化:批量处理大量文件时,可分批加载,避免内存占用过高。
- 格式保留:需要保留公式、样式和图表时,使用
WorksheetCopyType.CopyAll。 - 表头统一:合并数据前最好统一表头,特别是源文件列名不一致时。
总结
本文介绍了 Java 中四种常用的 Excel 合并方法:
- 按文件合并:完整保留每个工作表,适合整合报表或项目数据。
- 合并工作表数据到单表:将多个工作表数据汇总到一个总表,便于统计分析。
- 批量合并目录下文件:一次性处理整个目录中的 Excel 文件,提高效率。
- 统一表头合并:在源文件表头不一致的情况下,生成结构统一的总表。
通过合理选择方法,可以显著提高处理 Excel 数据的效率和准确性。