在 Python 列表和字典常踩的一个坑

832 阅读5分钟

一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第14天,点击查看活动详情

【导语】:在Python中,如果我们想要在遍历一组数据的过程中,对这组数据进行修改,通常会出现许多问题,例如对列表进行上述操作时, 会忽略部分数据;遍历字典时,不能修改数据。本文针对这些问题,提出了多种解决方案。

简介

一、关于列表

1.问题描述

在Python中,如果你试图在遍历一组数据的过程中,对其进行修改,这通常没什么问题。例如:


l = [3, 4, 56, 7, 10, 9, 6, 5]

for i in l:
    if not i % 2 == 0:
        continue
    l.remove(i)

print(l)

上述这段代码遍历了一个包含数字的列表,为了去除掉所有偶数,直接修改了列表l。然而,运行后输出却是:

[3, 56, 7, 9, 5]

等一下!输出似乎不对。最终的结果仍然含有一个偶数56。为什么没有成功去除这个数呢?我们可以尝试打印出 for循环遍历的所有元素,运行如下代码:

l = [3, 4, 56, 7, 10, 9, 6, 5]

for i in l:
    print(i)
    if not i % 2 == 0:
        continue
    l.remove(i)

print(l)

这段代码的输出为:

3
4
7
10
6
[3, 56, 7, 9, 5]

从输出可以看出,for循环似乎没有访问列表中的所有元素。为了解for循环在内部究竟做了什么, 我们可以使用 iter 和 next 来模拟一下。看看下面这个例子,我使用了ipython shell 来运行代码:


In [1]l = [3456710965]

In [2]# 把列表变成一个迭代器

In [3]it = iter(l)

In [4]# 使用 next() 方法来模拟 for循环

In [5]: next(it)
Out[5]: 3

In [6]: next(it)
Out[6]: 4

In [7]# 移除一个迭代器已经访问过的元素

In [8]: l.remove(3)

In [9]: next(it)
Out[9]: 7

In [10]# 注意此处跳过了56,我们可以再移除一个元素

In [11]: l.remove(4)

In [12]: next(it)
Out[12]: 9

上面这个实验揭示了:当你移除一个迭代器已经访问过的元素后,在下一次迭代时,会跳过右边的一个元素,直接访问下一个。

反之依然成立,即当开始迭代后,如果你在列表开头添加了一个元素,下次迭代时,可能会访问到已经迭代过的元素,下面这段代码就出现了这种情况:

In[1]l = [3456710965]

In[2]it = iter(l)

In[3]: next(it)
Out[3]: 3

In[4]: next(it)
Out[4]: 4

In[5]: l.insert(0, 44)

In[6]: next(it)
Out[6]: 4

注意当在列表头部添加了44后,4被访问了两次。

2.解决方案

为了解决上述问题,我们必须得确保:不能移除迭代器访问过的元素。

方案一

我们可以先对原列表进行翻转得到一个新列表,再对新列表进行迭代,并在原列表 l 中移除不符合条件的元素。该方案代码如下:

l = [3, 4, 56, 7, 10, 9, 6, 5]

# 迭代翻转后的列表
for i in reversed(l):
    print(i)
    if not i % 2 == 0:
        continue
    l.remove(i)

print(l)

结果如下:

5
6
9
10
7
56
4
3
[3, 7, 9, 5]

注意,迭代器现在成功访问到了列表中的所有元素,并最终输出了只含有奇数的列表。

方案二

我们还可以在开始迭代前,先复制列表 l 。但是当列表 l 中的数据过多时,这样做显然比较耗费性能。该方案代码如下:

l = [3, 4, 56, 7, 10, 9, 6, 5]

# 在这里使用 'l.copy()' 来对列表 l 进行浅拷贝
for i in l.copy():  
    print(i)   
    if not i % 2 == 0:     
        continue  
    l.remove(i)
    
print(l)

输出如下:

3
4
56
7
10
9
6
5
[3, 7, 9, 5]

该方案能保证迭代的顺序和移除元素的顺序相同。不过由于迭代和移除这两种操作针对的是两个不同的列表,因此顺序相同并不重要。

二、关于字典

1.问题描述

在对字典进行迭代时,不能修改字典。如下:

# {0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6, 7: 7, 8: 8, 9: 9}
d = {k: k for k in range(10)}

for k, v in d.items():  
    if not v % 2 == 0:    
        continue  
    d.pop(k)

这段代码会产生 RuntimeError :

Traceback (most recent call last):  
  File "F:/Documents/pythonprojects/01practice/app.py", line 7, in <module>  
    for k, v in d.items():
RuntimeError: dictionary changed size during iteration

2.解决方案

我们可以先复制字典的所有 key ,随后在迭代 key 的过程中,移除不符合条件的元素。过程如下:

# {0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6, 7: 7, 8: 8, 9: 9}
d = {k: k for k in range(10)}
# 这里复制了字典中的所有key值
# 没有复制整个字典
# 同时使用tuple()速度更快
for k in tuple(d.keys()):   
    if not d[k] % 2 == 0:    
        continue  
    d.pop(k)
    
print(d)

运行代码后输出如下:


{1133557799}

我们成功移除了字典中的所有偶数键值对!

结论

在本文中我们针对迭代一组数据时无法进行修改的问题,分别提出了不同的解决方案:如果想在遍历列表的时候,对列表进行修改, 我们可以先对原列表进行翻转或复制,从而得到一个新列表,随后在遍历新列表的过程中,修改原列表中的数据;如果我们想在遍历字典的时候,对字典进行修改,可以先复制字典的所有键值,然后在迭代键值的时候,修改字典中的数据。

致谢

由于作者才疏学浅,更兼时间和精力所限,代码中错误之处在所难免,敬请读者批评指正。

声明:发布此文是出于传递更多知识以供交流学习之目的。若有来源标注错误或侵犯了您的合法权益   ,请作者持权属证明与我们联系,我们将及时更正、删除,谢谢。