一些让Python代码简洁的实用技巧总结

更新时间：2021年08月22日 15:15:06 作者：Frank Andrade

随着项目代码行数的增加,不可避免的遇到软件架构腐败的问题,所以如何写出简洁的代码至关重要,这篇文章主要给大家介绍了一些让Python代码简洁的实用技巧,需要的朋友可以参考下

前言

众所周知，编写Python代码在开始时十分容易，但随着你在工具包中添加更多的库，你的脚本可能会有不必要的代码行，变得冗长而混乱。可能短期内能够应付工作，但长期来看，麻烦不小。

在这篇文章中，我将与你分享7个技巧，使你在使用Python进行数据科学时更加简洁。这涵盖了我们日常所做的事情，例如修改Pandas数据框中的值，连接字符串，读取文件等操作！

1. 使用Lambda来修改Pandas数据框中的值

假设我们有以下df数据框:

data = [[1,2,3], [4,5,6], [7,8,9]]
df = pd.DataFrame(data, columns=[0,1,2])
IN[1]: print (df)
OUT[1]:    0  1  2
        0  1  2  3
        1  4  5  6
        2  7  8  9

现在由于某种原因，你需要在第0列的数字上添加01的值。一个常见的方法是定义一个函数来完成这个任务，然后用 apply 函数来修改一列的值。

def add_numbers(x):
    return f'{x}01'
df[0] = df[0].apply(add_numbers)
IN[1]: print (df)
OUT[1]:     0   1   2
        0  101  2   3
        1  401  5   6
        2  701  8   9

这并不复杂，但是在数据框中对每一个改变创建一个函数是不切实际的。这时lambda就派上了用场。

lambda函数类似于普通的Python函数，但它可以不使用名称来定义，这使得它成为一个漂亮的单行代码。之前使用的代码可以用以下方式来减少。

df[0] = df[0].apply(lambda x:f'{x}01')

当你不知道是否可以访问一个系列的属性来修改数据时，Lambda变得非常有用。

例如，列0包含字母，我们想把它们大写。

# 如果你知道.str的存在，你可以这样做
df[0] = df[0].str.title()
# 如果你不知道.str，你仍然可以用lambda大写
df[0] = df[0].apply(lambda x: x.title())

2. 使用f-string来连接字符串

字符串连接是Python中非常常见的操作，它可以用不同的方法来完成。最常见的方法是使用+运算符；然而，这个运算符的一个问题是我们不能在字符串之间添加任何分隔符。

当然，如果你想把 "Hello "和 "World "连接起来，一个典型的变通方法是添加一个空白分隔符（" "）。

print("Hello" + " " + "World")

这就完成了工作，但为了写出更可读的代码，我们可以用一个f-string来代替它。

IN[2]: print(f'{Hello} {World}')
OUT[2]: "Hello World"

在一个基本的例子中，这似乎是不必要的，但是当涉及到连接多个值时（正如你将在提示#3中看到的），f-string将使你免于书写多次+ " " +。我不知道过去有多少次不得不写+运算符，但现在不会了！

其他连接字符串的方法是使用join()方法或format()函数，然而f-string在字符串连接方面做得更好。

3. 用Zip()函数对多个列表进行迭代

你是否曾经想在 Python 中循环遍历一个以上的列表？当你有两个列表时，你可以用 enumerate 来实现。

teams = ['Barcelona', 'Bayern Munich', 'Chelsea']
leagues = ['La Liga', 'Bundesliga', 'Premiere League']
for i, team in enumerate(teams):
    league = leagues[i]
    print(f'{team} plays in {league}')

然而，当你有两个或更多的列表时，这变得不切实际。一个更好的方法是使用zip()函数。zip()函数接收迭代数据，将它们聚集在一个元组中，并返回之。

让我们再增加一个列表，看看zip()的威力!

teams = ['Barcelona', 'Bayern Munich', 'Chelsea']
leagues = ['La Liga', 'Bundesliga', 'Premiere League']
countries = ['Spain', 'Germany', 'UK']
for team, league, country in zip(teams, leagues, countries):
    print(f'{team} plays in {league}. Country: {country}')

上述代码的输出结果为：

Barcelona plays in La Liga. Country: Spain
Bayern Munich plays in Bundesliga. Country: Germany
Chelsea plays in Premiere League. Country: UK

此处你注意到我们在这个例子中使用了f-string吗？代码变得更有可读性，不是吗？

4. 使用列表理解法

清洗和处理数据的一个常见步骤是修改现有的列表。比如，我们有以下需要大写的列表：

words = ['california', 'florida', 'texas']

将words列表的每个元素大写的典型方法是创建一个新的大写列表，执行一次 for 循环，使用.title()，然后将每个修改的值附加到新的列表中。

capitalized = []
for word in words:
    capitalized.append(word.title())

然而，Pythonic的方法是使用列表理解来做到这一点。列表理解有一种优雅的方法来制作列表。

你可以用一行代码重写上面的for循环：

capitalized = [word.title() for word in words]

由此我们可以跳过第一个例子中的一些步骤，结果是一样的。

5. 对文件对象使用with语句

当在一个项目上工作时，我们经常会对文件进行读写操作。最常见的方法是使用open()函数打开一个文件，它会创建一个我们可以操作的文件对象，然后作为一个习惯的做法，我们应该使用close()关闭该文件对象。

f = open('dataset.txt', 'w')
f.write('new_data')
f.close()

这很容易记住，但有时写了几个小时的代码，我们可能会忘记用f.close()关闭f文件。这时，with语句就派上了用场。with语句将自动关闭文件对象f，形式如下:

with open('dataset.txt', 'w') as f:
    f.write('new_data')

有了这个，我们可以保持代码的简短。

你不需要用它来读取CSV文件，因为你可以用pandas的 pd.read_csv()轻松地读取，但在读取其他类型的文件时，这仍然很有用。例如，从pickle文件中读取数据时经常使用它。

import pickle 
# 从pickle文件中读取数据集
with open(‘test', ‘rb') as input:
    data = pickle.load(input)

6. 停止使用方括号来获取字典项, 利用.get()代替

比如，有以下一个字典:

person = {'name': 'John', 'age': 20}

我们可以通过person[name]和person[age]分别获得姓名和年龄。但是，由于某种原因，我们想获得一个不存在的键，如 "工资"，运行person[salary]会引发一个`KeyError'。

这时，get()方法就有用了。如果键在字典中，get()方法返回指定键的值，但是如果没有找到键，Python 将返回None。得益于此，你的代码不会中断。

person = {'name': 'John', 'age': 20}
print('Name: ', person.get('name'))
print('Age: ', person.get('age'))
print('Salary: ', person.get('salary'))

输出结果如下:

Name: John
Age: 20
Salary: None

7. 多重赋值

你是否曾想减少用于创建多个变量、列表或字典的代码行数？那么，你可以用多重赋值轻松做到这一点。

# 原始操作
a = 1
b = 2
c = 3
# 替代操作
a, b, c = 1, 2, 3
# 代替在不同行中创建多个列表
data_1 = []
data_2 = []
data_3 = []
data_4 = []
# 可以在一行中创建它们的多重赋值
data_1, data_2, data_3, data_4 = [], [], [], []
# 或者使用列表理解法
data_1, data_2, data_3, data_4 = [[] for i in range(4)]

原文链接:

https://towardsdatascience.com/7-tips-to-level-up-your-python-code-for-data-science-4a64dbccd86d

总结

到此这篇关于让Python代码简洁的实用技巧的文章就介绍到这了,更多相关Python代码简洁技巧内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python数据分析pandas之布尔索引使用详解
这篇文章主要为大家介绍了Python数据分析pandas之布尔索引使用示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2023-07-07
Python使用matplotlib时显示中文乱码解决方法(或更改字体)
这篇文章主要给大家介绍了关于Python使用matplotlib时显示中文乱码的解决方法(或更改字体),在Matplotlib中,中文乱码问题通常出现在图表的标题、标签和刻度上,文中通过代码介绍的非常详细,需要的朋友可以参考下
2023-12-12
使用Python实现将Word文档转换为PNG图片
在这篇博客中,我将介绍一个使用Python编写的小工具,它能够将指定文件夹中的所有Word文档转换为PNG图片,这个工具基于wxPython库构建图形用户界面,接下来,我将详细说明这个工具的功能及其实现,需要的朋友可以参考下
2024-08-08
查找适用于matplotlib的中文字体名称与实际文件名对应关系的方法
这篇文章主要介绍了查找适用于matplotlib的中文字体名称与实际文件名对应关系的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-01-01
Python实现在线批量美颜功能过程解析
这篇文章主要介绍了Python实现在线批量美颜功能过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-06-06
python函数装饰器之带参数的函数和带参数的装饰器用法示例
这篇文章主要介绍了python函数装饰器之带参数的函数和带参数的装饰器用法,结合实例形式分析了Python函数装饰器中函数带多个参数以及装饰器带有多个参数的具体原理与实现方法,需要的朋友可以参考下
2019-11-11
python列表插入append(), extend(), insert()用法详解
在本篇文章里小编给大家整理了关于python列表插入append(), extend(), insert()用法以及相关知识点，有需要的朋友们参考下。
2019-09-09
2行Python实现给图片加水印效果
这篇文章主要给大家介绍了如何通过2行Python实现给图片加水印效果的相关资料,实现的方法主要是利用filestools库,文中还介绍了一行代码如何给图片加水印,需要的朋友可以参考下
2021-10-10
pandas实现datetime64与unix时间戳互转
这篇文章主要介绍了pandas实现datetime64与unix时间戳互转，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2022-07-07
Python切图九宫格的实现方法
这篇文章主要介绍了Python切图九宫格的实现方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-10-10