一、需求
查找两个大文件中不同内容。
二、解决方法
将两个文件中某一列作为主键(类似数据库概念,用主键表示唯一性),分别放入集合 set 中去重。
假设有两个集合 set1 和 set2:
set1 = (1,2,3,4,5)
set2 = (1,2,3,6)
则 set1 中有但是 set2 中没有的数据是:
result = set1 - set2
# 输出结果为 4,5
则 set2 中有但是 set1 中没有的数据是:
result = set2 - set1
# 输出结果为 6
以上,问题解决。