阅读 56

8个小技巧教你提升Python代码质量

Python是一门简单而灵活的编程语言,对于同一项小功能,可以有很多种实现方式。例如,我之前在文章《从轻松到王者,一文教你节省90%内存占用》中介绍过K-V数据结构的实现方式,可以有很多种不同的实现形式。

但是,不同的实现形式之前会有千差万别。

一种普通的实现形式在内存占用、执行效率方面和一种优秀的实现形式有千差万别。

本文,就来给大家介绍8个Python编程小技巧,帮助你写出更加优雅的Python代码。

1. enumerate()替代range(len())

**问题:**遍历一个列表,把里面小于0的值置为0。

遍历列表,是开发过程中经常会涉及到的一种操作。

大多数Python开发者都习惯于使用range(len())语法,这一种方式是很多教程、书籍上介绍的,因此,很多同学也就默认选择使用这种方式去遍历列表。

在遍历列表里,使用enumerate()枚举函数是一个更佳的选择,因为它可以同时获取索引当前项,这对在很多场景下是非常实用的。而使用range(len())却不能兼顾索引和当前项。

下面看一下2种方式的对比:

data = [1, 2, -3, -4]

# range(len())
for i in range(len(data)):
    if data[i] < 0:
        data[i] = 0

# enumerate()
data = [1, 2, -3, -4]
for idx, num in enumerate(data):
    if num < 0:
        data[idx] = 0
复制代码

点击并拖拽以移动

2. 列表表达式替代for循环

**问题:**求一个列表中所有制的平方。

如果使用比较常用的for循环方式是这样的:

squares = []
for i in range(10):
    squares.append(i*i)
复制代码

点击并拖拽以移动

而使用列表表达式,是下面这样的:

squares = [i*i for i in range(10)]
复制代码

点击并拖拽以移动

一行代码就可以实现for循环3行代码才能实现的功能。

列表表达式非常强大,它还可以结合条件语句进行使用。

不过,不要过度使用列表表达式。因为,它使代码变得简单的同时也增加了阅读理解的成本。所以,在一些复杂的语句不建议使用列表表达式。

3. 使用set去重

**问题:**对一个列表中的元素进行去重。

当看到这个问题,获取有的同学会想到很多复杂的方法,遍历、字典....

如果使用set一行代码就可以实现列表元素的去重。

因为,set是一种无序的集合,所以,它会自动去除列表中的重复元素。

my_list = [1,2,3,4,5,6,7,7,7]
set(my_list)
# set([1, 2, 3, 4, 5, 6, 7])
复制代码

点击并拖拽以移动

4. 利用生成器节省内存

**问题:**如果列表中有10000个元素,该如何节省内存?

如果元素比较少,使用列表是一个比较好的选择。如果元素多到一定程度,那么列表就变得非常耗费内存。

形象的解释生成器,就如同它的名称一样,它每次只生成一个元素,当你调用它的时候,它会逐步生成下一个元素。如果你不调用它的话,它就是一个非常节省内存的函数。

下面来对比一下,

import sys

my_list = [i for i in range(10000)]
print(sys.getsizeof(my_list), 'bytes') # 87616 bytes

my_gen = (i for i in range(10000))
print(sys.getsizeof(my_gen), 'bytes') # 128 bytes
复制代码

点击并拖拽以移动

可以看出,同样是10000个元素,在内存占用方面,使用列表是使用生成器的684.5倍。

5. 使用.get().setdefault()访问字典

**问题:**访问一个字典中的值。

当我们通过key访问字典时,如果字典中没有这个K-V值,那么,它会报错、终止程序,并返回KeyError。

所以更好的方法是在字典上使用.get()方法。这也会返回键的值,但是如果键不可用,它不会引发键错误。相反,它返回我们指定的默认值,如果我们没有指定它,则返回None。

my_dict = {'item': 'football', 'price': 10.00}
price = my_dict['count'] # KeyError!

# better:
price = my_dict.get('count', 0) # optional default value
复制代码

点击并拖拽以移动

使用字典进行计数是一种常用的操作。

在这个过程中,需要首先判断字典中是否存在key,然后赋给默认值,而使用.setdefault()可以直接给字典设定默认值。

6. 使用collections.Counter计数

**问题:**统计列表字段中的元素出现次数,筛选出现频率最高的元素。

在项目开发过中,计数、统计频率,是经常会遇到的问题。

而Python自带的标准模块collections.Counter提供了很多好用、强大的技术方法,只需要一行代码,就可以完成很多复杂逻辑才能完成的工作。

例如,你要统计一个列表中出现频率最高的元素,可以这样实现:

from collections import Counter

my_list = [10, 10, 10, 5, 5, 2, 9, 9, 9, 9, 9, 9]
counter = Counter(my_list)

most_common = counter.most_common(2)
print(most_common) # [(9, 6), (10, 3)]
print(most_common[0]) # (9, 6)
print(most_common[0][0]) # 9
复制代码

点击并拖拽以移动

7. 使用**合并字段

**问题:**给你2个字典,把元素合并到同一个字段里

你不需要经过2层遍历去读取字典中的元素,然后在把这些元素合并到同一个字典中,只需要简单的双星号**就可以实现这个需求。

这种语法是自Python 3.5以来的新语法,在Python3.5之前无法使用。

下面来看一下示例:

d1 = {'name': 'Alex', 'age': 25}
d2 = {'name': 'Alex', 'city': 'New York'}
merged_dict = {**d1, **d2}
print(merged_dict)
# {'name': 'Alex', 'age': 25, 'city': 'New York'}
复制代码

点击并拖拽以移动

8. 使用if x in list简化条件语句

**问题:**判断是否等于列表中的某个元素的值。

习惯于C/C++、Java等其他编程语言进行开发的同学,当遇到条件语句时,会选择==或者!=来进行判断。

如果需要判断的条件较多的话,这样需要写很长的语句,例如,

colors = ["red", "green", "blue"]

c = "red"

if c == "red"or c == "green"or c == "blue":
    print("is main color")
复制代码

点击并拖拽以移动

而在Python中,对于条件语句进行了很大程度的简化,可以使用in来解决这个问题,只需要简短的一行代码就可以完成。

colors = ["red", "green", "blue"]

c = "red"

if c in colors:
    print("is main color")
复制代码

点击并拖拽以移动

前面介绍的8个Python小技巧,虽然看上去非常简单,甚至在一些Python开发者眼里看着如同小儿科一般。但是,对于刚从书籍或者教程中走出来的同学,难免会陷入书本相对狭窄的范围内。

这时候,就需要多看、多学习。看别人的代码、让别人看自己的代码,在这个过程中学习一些自己不曾知道的小技巧,这对提升自己的编码能力非常有价值。而且,这不仅适用于Python,适合于任何一门其他编程语言。


干货推荐

为了方便大家,我花费了半个月的时间把这几年来收集的各种技术干货整理到一起,其中内容包括但不限于Python、机器学习、深度学习、计算机视觉、推荐系统、Linux、工程化、Java,内容多达5T+,我把各个资源下载链接整理到一个文档内,目录如下:

img点击并拖拽以移动

所有干货送给大家,希望能够点赞支持一下!

https://http://pan.baidu.com/s/1eks7CUyjbWQ3A7O9cmYljA (提取码:0000)

文章分类
后端
文章标签