Python多进程与多线程的使用场景详解

 更新时间:2021年03月05日 16:08:35   作者:大帅不是我  
这篇文章主要给大家介绍了关于Python多进程与多线程使用场景的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

前言

Python多进程适用的场景:计算密集型(CPU密集型)任务

Python多线程适用的场景:IO密集型任务

计算密集型任务一般指需要做大量的逻辑运算,比如上亿次的加减乘除,使用多核CPU可以并发提高计算性能。

IO密集型任务一般指输入输出型,比如文件的读取,或者网络的请求,这类场景一般会遇到IO阻塞,使用多核CPU来执行并不会有太高的性能提升。

下面使用一台64核的虚拟机来执行任务,通过示例代码来区别它们,

示例1:执行计算密集型任务,进行1亿次运算

使用多进程

from multiprocessing import Process
import os, time
 
 
# 计算密集型任务
def work():
 res = 0
 for i in range(100 * 100 * 100 * 100): # 亿次运算
  res *= i
 
 
if __name__ == "__main__":
 l = []
 print("本机为", os.cpu_count(), "核 CPU") # 本机为64核
 start = time.time()
 for i in range(4):
  p = Process(target=work) # 多进程
  l.append(p)
  p.start()
 for p in l:
  p.join()
 stop = time.time()
 print("计算密集型任务,多进程耗时 %s" % (stop - start))

使用多线程

from threading import Thread
import os, time
 
 
# 计算密集型任务
def work():
 res = 0
 for i in range(100 * 100 * 100 * 100): # 亿次运算
  res *= i
 
 
if __name__ == "__main__":
 l = []
 print("本机为", os.cpu_count(), "核 CPU") # 本机为64核
 start = time.time()
 for i in range(4):
  p = Thread(target=work) # 多线程
  l.append(p)
  p.start()
 for p in l:
  p.join()
 stop = time.time()
 print("计算密集型任务,多线程耗时 %s" % (stop - start))

两段代码输出:

本机为 64 核 CPU
计算密集型任务,多进程耗时 6.864224672317505
 
本机为 64 核 CPU
计算密集型任务,多线程耗时 37.91042113304138

说明:上述代码中,分别使用4个多进程和4个多线程去执行亿次运算,多进程耗时6.86s,多线程耗时37.91s,可见在计算密集型任务场景,使用多进程能大大提高效率。

另外,当分别使用8个多进程和8个多线程去执行亿次运算时,耗时差距更大,输出如下:

本机为 64 核 CPU
计算密集型任务,多进程耗时 6.811635971069336
 
本机为 64 核 CPU
计算密集型任务,多线程耗时 113.53767895698547

可见在64核的cpu机器下,同时使用8个多进程和4个多进程效率几乎一样。而使用多线程则就效率较慢。要最高效地利用CPU,计算密集型任务同时进行的数量应当等于CPU的核心数

示例2:400次,阻塞两秒,读取文件

使用多进程(4核cpu)

from multiprocessing import Process
import os, time
 
 
# I/0密集型任务
def work():
 time.sleep(5) # 阻塞两秒
 
 
if __name__ == "__main__":
 l = []
 print("本机为", os.cpu_count(), "核 CPU")
 start = time.time()
 for i in range(1000):
  p = Process(target=work) # 多进程
  l.append(p)
  p.start()
 for p in l:
  p.join()
 stop = time.time()
 print("I/0密集型任务,多进程耗时 %s" % (stop - start))

使用多线程(4核cpu)

from threading import Thread
import os, time
 
 
# I/0密集型任务
def work():
 time.sleep(5) # 阻塞两秒
 
 
if __name__ == "__main__":
 l = []
 print("本机为", os.cpu_count(), "核 CPU")
 start = time.time()
 
 for i in range(1000):
  p = Thread(target=work) # 多线程
  l.append(p)
  p.start()
 for p in l:
  p.join()
 stop = time.time()
 print("I/0密集型任务,多线程耗时 %s" % (stop - start))

输出:

本机为 64 核 CPU
I/0密集型任务,多进程耗时 12.28218412399292
 
 
本机为 64 核 CPU
I/0密集型任务,多线程耗时 5.399136066436768

说明:python的多线程有于GIL锁的存在,无论是多少核的cpu机器,也只能使用单核,从输出结果来看,对于IO密集型任务使用多线程比较占优。

FAQ:执行多进程的io密集型任务时,报了一个错:

OSError: [Errno 24] Too many open files

原因:linux系统限制

ulimit -n
# 输出 1024

解决:(临时提高系统限制,重启后失效)

ulimit -n 10240

总结

到此这篇关于Python多进程与多线程使用场景的文章就介绍到这了,更多相关Python多进程与使用场景内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • padas 生成excel 增加sheet表的实例

    padas 生成excel 增加sheet表的实例

    今天小编就为大家分享一篇padas 生成excel 增加sheet表的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • 详解Python中的Dict

    详解Python中的Dict

    这篇文章主要为大家介绍了Python中的Dict,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • Python中经常使用的代码片段

    Python中经常使用的代码片段

    大家好,本篇文章主要讲的是Python中经常使用的代码片段,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下
    2022-01-01
  • 带你了解python装饰器

    带你了解python装饰器

    Python中的装饰器是你进入Python大门的一道坎,不管你跨不跨过去它都在那里。Python中的装饰器的概念经常会让人搞得一头雾水,所以今天就好好来分析一下python中的装饰器
    2017-06-06
  • 一文带你了解Python枚举类enum的使用

    一文带你了解Python枚举类enum的使用

    枚举是与多个唯一常量绑定的一组符号,因为枚举表示的是常量,建议枚举成员名用大写 IntEnum 便于进行系统交互。本文将通过一些示例代码讲解Python枚举类的使用,需要的可以参考一下
    2022-10-10
  • Django利用LogEntry生成历史操作实战记录

    Django利用LogEntry生成历史操作实战记录

    LogEntry是在后台开发中经常用到的模块,它在admin是默认开启的。文中给大家介绍了在admin页面上查看操作日志的方法及实战代码,感兴趣的朋友跟随小编一起看看吧
    2021-12-12
  • Python使用try-except捕获与处理异常的实现方法

    Python使用try-except捕获与处理异常的实现方法

    在Python中,try-except 语句是用于捕获和处理异常的主要工具,当程序运行过程中发生错误时,try-except 结构可以有效地防止程序崩溃,并允许开发者为错误提供适当的解决方案,接下来,我们将详细探讨 try-except 的使用方式,需要的朋友可以参考下
    2024-11-11
  • python使用htmllib分析网页内容的方法

    python使用htmllib分析网页内容的方法

    这篇文章主要介绍了python使用htmllib分析网页内容的方法,涉及Python使用htmllib模块的相关技巧,需要的朋友可以参考下
    2015-05-05
  • Python 转移文件至云对象存储的方法

    Python 转移文件至云对象存储的方法

    对象存储(Cloud Object Storage,COS)是一种存储海量文件的分布式存储服务,具有高扩展性、低成本、可靠安全等优点。这篇文章主要介绍了Python 转移文件至云对象存储,需要的朋友可以参考下
    2021-02-02
  • Python新手在作用域方面经常容易碰到的问题

    Python新手在作用域方面经常容易碰到的问题

    这篇文章主要介绍了Python新手在作用域方面经常容易碰到的问题,全局变量和局部变量方面的知识在Python学习当中是基础中的基础,需要的朋友可以参考下
    2015-04-04

最新评论