您的位置:

深入Python random模块之random.sample()

Python的random模块提供了许多用于生成随机数的函数。其中,random.sample(sequence, k)函数可用于从指定序列中随机选取固定数量的元素,并返回这些元素的列表。

一、函数用法

random.sample(sequence, k)函数需要两个参数:一个是具有多个元素的序列,另一个是要选取的元素的数量。如果要从一个序列中选取长度为k的随机子序列,则可以使用以下方法:

import random

data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
sample_data = random.sample(data, k=3)

print(sample_data)

该程序将从data中选取3个随机元素,并输出该子序列:

[7, 3, 1]

如果要在随机过程中避免重复元素,可以使用random.sample()函数的变种。在这种情况下,选取的数量k不能大于序列的长度。如下所示:

import random

data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
sample_data = random.sample(data, k=len(data))

print(sample_data)

此程序将对data序列进行完全随机化,并输出:

[3, 1, 6, 5, 8, 10, 9, 4, 2, 7]

二、应用实例

随机选样是数据分析的一项常见操作。例如,我们可以使用random.sample()函数来生成一个样本,以对总体数据的分布进行推断。以下是一个简单的例子:

import random
import numpy as np
import matplotlib.pyplot as plt

data = np.random.normal(0, 1, 10000) # 生成一个随机正态分布的序列
sample_data = random.sample(data.tolist(), k=1000)

plt.hist(data, bins=50, alpha=0.5, color='b') # 绘制总体分布的直方图
plt.hist(sample_data, bins=50, alpha=0.5, color='r') # 绘制样本分布的直方图
plt.show()

此程序将生成一个随机正态分布的序列,然后选取1000个样本点进行分析。通过在同一个画布上绘制总体分布和样本分布的直方图,可以很容易地比较它们的相似之处以及差异之处。

三、使用小技巧

random.sample()函数还有一种应用情景,即从字符串或列表中随机选择一个元素。以下是一些例子:

import random

s = 'abcdefghijklmnopqrstuvwxyz'
random_char = random.sample(s, k=1)

print(random_char)

此程序将在字母表中随机选取一个字母,并输出:

['m']

在下一个例子中,我们从列表pizza_choices中随机选择一种披萨,以为晚餐做决定提供参考:

import random

pizza_choices = ['cheese', 'pepperoni', 'sausage', 'vegetable', 'hawaiian']
pizza_choice = random.sample(pizza_choices, k=1)

print("Tonight's pizza special: " + pizza_choice[0] + " pizza")

该程序将从pizza_choices序列中随机选取一种披萨,并输出结果:

Tonight's pizza special: vegetable pizza

四、结语

random.sample()函数是Python中一个强大的随机选样工具。它不仅可以从数字列表中随机选取样本,还可以从字符串、元组、集合等序列中选取元素。此外,该函数还可以用于生成随机序列、数据采样、统计分布推断等多种应用情景。