Python 查找两个大文件中不同内容

197 阅读1分钟

一、需求

查找两个大文件中不同内容。

二、解决方法

将两个文件中某一列作为主键(类似数据库概念,用主键表示唯一性),分别放入集合 set 中去重。

假设有两个集合 set1 和 set2:

set1 = (1,2,3,4,5)
set2 = (1,2,3,6)

则 set1 中有但是 set2 中没有的数据是:

result = set1 - set2
# 输出结果为 45

则 set2 中有但是 set1 中没有的数据是:

result = set2 - set1
# 输出结果为 6

以上,问题解决。