读取excel文件data.xlsx中的sheet1和sheet2工作表,合并成一个新的表格。该代码会将两个表格的所有字段全部合并(按表格标题名称合并)。
⚠️注意:必须要保证合并的字段的类型要一致。
# 导入pandas库
import pandas as pd
# 读取excel文件data.xlsx中的sheet1和sheet2工作表,暂存在 DataFrame 中
df1 = pd.read_excel('/Users/caidong/Desktop/data.xlsx', sheet_name='Sheet1')
df2 = pd.read_excel('/Users/caidong/Desktop/data.xlsx', sheet_name='Sheet2')
# 合并两个 DataFrame
df_combined = pd.concat([df1, df2], ignore_index=True)
# 将合并后的 DataFrame 写入新的 Excel 文件
df_combined.to_excel('/Users/caidong/Desktop/combined_data.xlsx', index=False)
如何只是想要合并部分字段,可以使用下面这部分代码:
⚠️注意:必须要保证合并的字段的类型要一致。
# 导入pandas库
import pandas as pd
# 读取excel文件data.xlsx中的sheet1工作表,只选择需要的字段
df1 = pd.read_excel('/Users/caidong/Desktop/data.xlsx', sheet_name='Sheet1', usecols=['姓名', '年龄', '性别'])
# 读取excel文件data.xlsx中的sheet2工作表,只选择需要的字段
df2 = pd.read_excel('/Users/caidong/Desktop/data.xlsx', sheet_name='Sheet2', usecols=['姓名', '年龄', '性别'])
# 由于我们只保留了共有的字段,我们可以直接合并这些字段
# 假设 '姓名', '年龄', '性别' 是可以对齐的字段,我们可以使用这些字段作为合并的基准
df_combined = pd.merge(df1, df2, on=['姓名', '年龄', '性别'], how='outer')
# 将合并后的 DataFrame 写入新的 Excel 文件
df_combined.to_excel('/Users/caidong/Desktop/combined_data.xlsx', index=False)