您的位置:

优化python程序执行时间的方法——wall clock timing

一、使用时间复杂度较低的算法

在编写python程序时,可以通过使用时间复杂度较低的算法来减少程序的执行时间。如果程序执行时间非常长,那么就要考虑优化算法的时间复杂度。

例如,在对一个列表进行查找或排序时,常用的方法是使用for循环和sort()函数。但是,这种方法的时间复杂度为O(n^2),如果列表很大,程序执行时间就会非常长。而如果使用快速排序或归并排序等算法,时间复杂度可以降为O(nlogn),程序执行时间就会大大缩短。

# 例如,对一个列表进行排序

# 方法一:
def bubble_sort(nums):
    for i in range(len(nums)-1):
        for j in range(len(nums)-1-i):
            if nums[j] > nums[j+1]:
                nums[j], nums[j+1] = nums[j+1], nums[j]
    return nums

# 方法二:
def merge_sort(nums):
    if len(nums) <= 1:
        return nums
    mid = len(nums) // 2
    left = merge_sort(nums[:mid])
    right = merge_sort(nums[mid:])
    return merge(left, right)

def merge(left, right):
    result = []
    i, j = 0, 0
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    result += left[i:]
    result += right[j:]
    return result

nums = [3, 5, 1, 6, 4, 2]
print(bubble_sort(nums))  # 原生的冒泡算法
print(merge_sort(nums))   # 归并排序算法

二、使用生成式代替列表操作

在python中,有时我们需要对一个列表进行多次操作,如果每次都对原列表进行操作,就会造成重复计算,增加程序的执行时间。这时我们可以使用生成式代替列表操作,从而减少程序的执行时间。

生成式是一种方便快捷的列表操作方式,可以通过一行代码来实现多个操作,并且可以直接生成列表。因为生成式只执行一次,所以可以大大降低程序执行的时间。

# 例如,使用生成式计算一个列表中每个数的平方

# 方法一:
nums = [1, 2, 3, 4]
squares = []
for num in nums:
    squares.append(num**2)

# 方法二:
nums = [1, 2, 3, 4]
squares = [num**2 for num in nums]

三、避免重复计算

在编写程序时,不要重复计算相同的值。如果程序中有循环结构或递归结构,会有很多重复计算的情况,这些重复计算会增加程序的执行时间。

为了避免重复计算,可以使用缓存机制,将计算结果缓存起来,下次使用时就可以直接查缓存,这样可以大大提高程序的执行效率。

# 例如,计算斐波那契数列的第n项

# 方法一:
def fibonacci(n):
    if n <= 1:
        return n
    return fibonacci(n-1) + fibonacci(n-2)

# 方法二:
cache = {}
def fibonacci(n):
    if n in cache:
        return cache[n]
    if n <= 1:
        return n
    value = fibonacci(n-1) + fibonacci(n-2)
    cache[n] = value
    return value

print(fibonacci(100))

四、使用可视化工具

在优化python程序执行时间时,可以使用各种可视化工具来帮助我们分析程序的性能瓶颈。

例如,可以使用cProfile模块来查看程序的函数调用次数、时间和耗时等信息,还可以使用pstats模块对结果进行统计和分析。

# 查看程序的函数调用次数和耗时
import cProfile
import re

def factorial(n):
    if n == 0:
        return 1
    else:
        return n * factorial(n-1)

def test_factorial():
    for i in range(10):
        assert factorial(i) == 1

if __name__ == '__main__':
    cProfile.run('test_factorial()')

五、使用线程和进程

在python中,可以使用多线程和多进程的方式来加速程序的执行。通过将任务划分为多个子任务,并同时执行这些子任务,可以提高程序的执行效率。

多线程适用于cpu计算量不大的程序,多进程适用于cpu计算量较大的程序。同时,由于python有全局解释器锁,因此多线程在并发性方面并不会有太大的提升。

# 例如,使用多线程和多进程分别对一个列表进行排序

# 多线程:
import threading

def bubble_sort(nums):
    for i in range(len(nums)-1):
        for j in range(len(nums)-1-i):
            if nums[j] > nums[j+1]:
                nums[j], nums[j+1] = nums[j+1], nums[j]
    return nums

def sort(nums):
    nums = bubble_sort(nums)

if __name__ == '__main__':
    nums = [3, 5, 1, 6, 4, 2]
    threads = []
    for i in range(2):
        t = threading.Thread(target=sort, args=(nums,))
        threads.append(t)
        t.start()
    for t in threads:
        t.join()

# 多进程:
from multiprocessing import Process

def bubble_sort(nums):
    for i in range(len(nums)-1):
        for j in range(len(nums)-1-i):
            if nums[j] > nums[j+1]:
                nums[j], nums[j+1] = nums[j+1], nums[j]
    return nums

def sort(nums):
    nums = bubble_sort(nums)

if __name__ == '__main__':
    nums = [3, 5, 1, 6, 4, 2]
    processes = []
    for i in range(2):
        p = Process(target=sort, args=(nums,))
        processes.append(p)
        p.start()
    for p in processes:
        p.join()

六、使用numba加速python程序

numba是一种可以加速python程序的库,可以将python代码编译为机器码,从而显著提高程序的执行效率。

在使用numba时,需要将需要加速的函数使用jit装饰器进行修饰,从而实现代码的即时编译。

# 例如,使用numba对一个计算圆周率的程序进行加速

# 原生程序:
import math

def compute_pi(n):
    pi = 0
    for i in range(n):
        pi += math.pow(-1, i) / (2*i + 1)
    return 4 * pi

print(compute_pi(1000000))

# numba加速:
import numba

@numba.jit
def compute_pi(n):
    pi = 0
    for i in range(n):
        pi += math.pow(-1, i) / (2*i + 1)
    return 4 * pi

print(compute_pi(1000000))

七、使用numpy进行向量化计算

在python中,numpy是一个非常常用的库,使用numpy进行向量化计算可以加速程序的执行。向量化计算是一种对数组或矩阵进行运算的方式,可以将运算交给底层的C语言来执行,从而提高程序的执行效率。

# 例如,使用numpy进行向量化计算

import numpy as np

x = np.array([1, 2, 3, 4])
y = np.array([5, 6, 7, 8])

# 使用for循环进行计算
result = []
for i in range(len(x)):
    result.append(x[i] + y[i])
print(result)

# 使用numpy进行向量化计算
result = x + y
print(result)

八、使用jit编译python代码

除了使用numba进行加速外,还可以使用其他的编译器来加速python程序的执行。例如,使用Cython可以将python代码编译为C语言代码,并生成.so文件,在程序运行时调用C语言代码来进行计算,从而提高程序的执行效率。

使用Cython编译可以加快python的执行速度,并且在一些特定的计算场景下,加速效果非常显著。

# 例如,使用Cython编译一个计算斐波那契数列的程序

# 原生程序:
def fib(n):
    if n==1 or n==2:
        return 1
    return fib(n-1) + fib(n-2)

# Cython编译:
# 首先需要安装cython库
# 然后创建一个fib.pyx文件,并编写如下的代码
# 然后运行以下命令生成.so文件
# python setup.py build_ext --inplace

# fib.pyx
def fib(int n):
    if n==1 or n==2:
        return 1
    return fib(n-1) + fib(n-2)

# setup.py
from distutils.core import setup
from Cython.Build import cythonize

setup(
    ext_modules = cythonize("fib.pyx")
)

# main程序中调用.so文件
import fib

print(fib.fib(100))

九、使用可变数据结构代替不可变数据结构

在python中,可变数据结构比不可变数据结构具有更高的执行效率。因为当一个不可变数据结构发生变化时,它需要创建一个新的对象来存储修改后的结果,这个过程需要多次的内存分配和释放,从而增加了程序的执行时间。

因此,当一个数据结构需要重复修改时,可以使用可变数据结构代替不可变数据结构,从而提高程序的执行效率。

# 例如,使用列表代替元组来存储数据

# 使用元组存储数据
def process_data(data):
    result = []
    for item in data:
        result.append(item[0] * item[1])
    return result

data = ((1, 2), (3, 4), (5, 6))
print(process_data(data))

# 使用列表存储数据
def process_data(data):
    result = []
    for item in data:
        result.append(item[0] * item[1])
    return result

data = [[1, 2], [3, 4], [5, 6]]
print(process_data(data))

十、使用profiling工具进行代码分析

在优化python程序执行时间时,可以使用各种profiling工具来分析程序的性能瓶颈,找到程序的瓶颈所在,从而有针对性地进行优化。

各种profiling工具的原理都不一样,常见的有cProfile、memory_profiler、pyinstrument、line_profiler等。

# 例如,使用pyinstrument工具分析程序的性能瓶颈

# 首先需要安装pyinstrument库
# 然后在程序中插入以下代码
import pyinstrument
profiler = pyinstrument.Profiler()
profiler.start()
# 执行程序
profiler.stop()

print(profiler.output_text(unicode=True, color=True))

总结

在优化python程序执行时间时,可以从多个方面入手,例如使用时间复杂度较低的算法、使用生成式代替列表操作、避免重复计算、使用可视化工具、使用线程和进程、使用numba加速python程序、使用numpy进行向量