时间:2021-05-22
对于多线程的使用,我们经常是用thread来创建,比较繁琐. 在Python中,可以使用map函数简化代码。map可以实现多任务的并发
map 函数一手包办了序列操作、参数传递和结果保存等一系列的操作,map函数负责将线程分给不同的CPU。
在 Python 中有个两个库包含了 map 函数: multiprocessing 和它鲜为人知的子库 multiprocessing.dummy.dummy 是 multiprocessing 模块的完整克隆,唯一的不同在于 multiprocessing 作用于进程,而 dummy 模块作用于线程。
代码如下:
from multiprocessing.dummy import Pool as ThreadPoolimport osimport requestsimport timeimport numpy as np# 文件夹位置filepath = r'C:\Users\Administrator\Desktop\ceshi'pool = ThreadPool(10)#开启线程数,即一次性抛出的请求数time_list = []#用来计算时间xml_list = []#数据集pathDir = os.listdir(filepath)for i, allDir in enumerate(pathDir): filename = os.path.join('%s%s' % (filepath + '\\', allDir)) kk = open(filename, 'r', encoding='utf-8').read() data = kk.encode('utf-8') for k in range(10): xml_list.append(data)def res(data): # 访问目标服务器地址 url_host = 'https://mp.csdn.net/mdeditor#' start = time.clock() s = requests.post(url_host, data=data) end = time.clock() if s.status_code == 200: print(end-start) time_list.append(end-start) else: print('请求失败')# 传入的参数,1为函数, 2为参数result = pool.map(res, xml_list)all_arr = np.array(time_list)aver = np.mean(all_arr)variance = np.var(all_arr)mid = np.median(all_arr)min_num = np.min(all_arr)max_num = np.max(all_arr)print('平均值 : '+ str(aver))print('方差 : ' + str(variance))print('中值 : ' + str(mid))print('最小值 : ' + str(min_num))print('最大值 : ' + str(max_num))个人做的小测试,如果有错误的地方希望留言提出意见及建议。
补充:python多进程(multiprocessing)(map)
map函数一手包办了序列操作,参数传递和结果保存等一系列的操作。
from multiprocessing.dummy import Poolpoop = Pool(4) # 4代表电脑是多少核的results = pool.map(爬取函数,网址列表)from multiprocessing.dummy import Pool as ThreadPoolimport requestsimport timekv = {'user-agent':'Mozilla/5.0'}def getsource(url): html = requests.get(url,headers=kv)urls = []for i in range(0,41): i = i*50 newpage = 'https://tieba.baidu.com/f?kw=读书&ie=utf-8&pn=' + str(i) urls.append(newpage)# 单线程爬取time1 = time.time()for each in urls: print(each) getsource(each)time2 = time.time()print('单线程耗时: ' + str(time2-time1))# 多线程爬取pool = ThreadPool(8)time3 = time.time()results = pool.map(getsource, urls)pool.close()pool.join()time4 = time.time()print('多线程所消耗时间:' + str(time4 - time3))以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
Python多线程的实例详解一)线程基础1、创建线程:thread模块提供了start_new_thread函数,用以创建线程。start_new_thread
Python的多线程有两种实现方法:函数,线程类1.函数调用thread模块中的start_new_thread()函数来创建线程,以线程函数的形式告诉线程该做
1.多线程的作用简而言之,多线程是并行处理相互独立的子任务,从而大幅度提高整个任务的效率。2.Python中的多线程相关模块和方法Python中提供几个用于多线
Python界有条不成文的准则:计算密集型任务适合多进程,IO密集型任务适合多线程。本篇来作个比较。通常来说多线程相对于多进程有优势,因为创建一个进程开销比较大
在Python多线程中如何创建一个线程对象如果你要创建一个线程对象,很简单,只要你的类继承threading.Thread,然后在__init__里首先调用th