Pandas pd.merge() 报错:ValueError: You are trying to merge on int64 and object columns.

532 阅读1分钟

1、需求:

df1  和 df2 按照 A, B 两列进行合并,假设 df1 为 A B C 三列,df2 为 A B D 三列,将其中A B 相同的列 merge 为 A B C D 四列。 

outfile = pd.merge(df1, df2, how='left', on=['A','B'])

2、用 pandas 合并两个 CSV 文件时,报错信息如下:

ValueError: You are trying to merge on int64 and object columns. If you wish to proceed you should use pd.concat

3、尝试解决:

虽然建议我用 pd.concat() ,但显然 concat() 函数只是简单拼接,并不符合我希望把两个表内 A B 两列值相同的行合并在一起的需求。

使用 dtype() 函数输出想merge 的A B 列的类型:

既然 A 列是 object 类型, B 列是 int64 类型,所以将 B 列转为 int 类型:

df['A'] = df['A'].apply(pd.to_numeric)

以上,问题解决~