一、并发与多线程
在计算机领域中,我们会频繁听到并发和并行两个概念。其中,并发是指同一时间段内处理多个任务,而并行则是指同一时刻执行多个任务。那么多线程技术可以帮助实现并发操作。
在Python中,我们可以使用threading模块来创建和操作线程对象。其中,threading模块中最常用的是Thread类。下面是一个简单的多线程的示例代码:
import threading
def worker():
"""Thread worker function"""
print('Worker')
threads = []
for i in range(5):
t = threading.Thread(target=worker)
threads.append(t)
t.start()
通过上面的代码可以看出,我们创建了5个线程,这5个线程共享同一个函数worker()。每个线程都会执行worker()函数中的操作。这就实现了并发操作,提高了程序的效率。
二、Python的全局解释器锁(GIL)
但是,需要注意的是,Python解释器中的全局解释器锁(GIL)会限制Python线程的并行执行,因为在同一时间只能有一个线程在解释器中运行Python字节码。这也就是说,Python多线程是并发执行的,而不是并行执行的。
了解了GIL的限制,我们可以考虑使用线程池来提高并发操作的效率。线程池中维护着大量线程,在需要的时候分配给程序使用,从而避免了线程创建和销毁所带来的开销。下面是一个使用Python中的ThreadPoolExecutor实现线程池的示例代码:
from concurrent.futures import ThreadPoolExecutor
import concurrent.futures
def worker(count):
"""Thread worker function"""
print(f'Thread-{count}')
with ThreadPoolExecutor(max_workers=5) as executor:
future_to_count = {executor.submit(worker, count): count for count in range(5)}
for future in concurrent.futures.as_completed(future_to_count):
count = future_to_count[future]
try:
data = future.result()
except Exception as exc:
print(f'Thread-{count} generated an exception: {exc}')
else:
print(f'Thread-{count} done')
上面的代码中,我们使用ThreadPoolExecutor创建了一个最大5个线程的线程池,接着使用submit方法向线程池中提交任务,最后通过as_completed()函数获得每个线程的结果。这种方式可以大大提高并发操作的效率。
三、使用Python多线程进行IO密集型操作
除了使用线程池来提高并发操作的效率外,我们还可以使用多线程解决一些IO密集型操作。因为在这种情况下,线程的执行不会阻塞CPU,而是在等待IO操作完成时被阻塞,这就可以让其他线程继续执行,并提高效率。
下面是一个使用多线程处理IO密集型操作的示例代码:
import threading
import requests
def download(url):
"""Thread worker function"""
filename = url.split('/')[-1]
with open(filename, 'wb') as f:
response = requests.get(url)
f.write(response.content)
print(f'Downloaded {filename}')
urls = [
'https://picsum.photos/200/300',
'https://picsum.photos/250/350',
'https://picsum.photos/300/400',
'https://picsum.photos/350/450',
'https://picsum.photos/400/500'
]
threads = []
for url in urls:
t = threading.Thread(target=download, args=(url,))
threads.append(t)
t.start()
上面的代码中,我们使用requests库下载了一些图片,并使用多线程的方式下载,加快了下载的速度。
四、使用Python多线程进行CPU密集型操作
在Python中,并发编程主要是通过多线程完成的,但是多线程对于CPU密集型操作并不友好。因为在同一时间只有一个线程可以在解释器中运行Python字节码,所以线程的数量也不会对程序的性能起到很大的作用。
在这种情况下,我们可以考虑使用多进程来实现并发操作。每个进程都维护着自己的解释器和GIL,因此可以实现真正的并行操作。下面是一个使用Python多进程进行CPU密集型操作的示例代码:
import multiprocessing
def fib(n):
"""Fibonacci function"""
if n<=2:
return 1
return fib(n-1) + fib(n-2)
pool = multiprocessing.Pool(processes=4)
inputs = [10, 11, 12, 13]
outputs = pool.map(fib, inputs)
print(outputs)
上面的代码中,我们使用Python的multiprocessing.Pool类实现多进程计算斐波那契数列。在这种情况下,每个进程维护着自己的解释器和GIL,因此可以实现并行操作。