一、Python Numpy简介
Python Numpy是一个基于Python语言的开源科学计算库,其最重要的特点是提供了一种多维数组对象(ndarray),用于高效地存储和操作大型数据集合,同时还提供了大量的数学函数库。
在数据科学领域,随机数非常常见,可以用来生成模拟数据、初始化模型参数、进行采样等。而Python Numpy中提供了一系列的随机数生成函数,可以快速、高效地生成高质量的随机数。
二、Python Numpy随机数生成函数
Python Numpy中的随机数函数有两类:一类是生成特定分布的随机数函数,比如均匀分布、正态分布、泊松分布等;另一类是生成随机整数的函数。
三、均匀分布
均匀分布是指在相同的区间内,各个数值出现的可能性相等,是一种最简单的概率分布。Python Numpy中的均匀分布函数为np.random.uniform,其函数原型为:
numpy.random.uniform(low=0.0, high=1.0, size=None)
参数说明:
- low:生成的随机数的最小值
- high:生成的随机数的最大值
- size:生成随机数的数目或形状,默认为None,表示返回单个随机数
示例代码:
import numpy as np # 生成一个均匀分布的随机数 random_num = np.random.uniform() print(random_num) # 生成一个均匀分布的随机数组,形状为(2, 3) random_arr = np.random.uniform(low=0, high=10, size=(2, 3)) print(random_arr)
四、正态分布
正态分布是自然界中非常常见的概率分布,其形态呈现钟形曲线,在数据科学领域中也被广泛使用。Python Numpy中的正态分布函数为np.random.normal,其函数原型为:
numpy.random.normal(loc=0.0, scale=1.0, size=None)
参数说明:
- loc:分布的均值(即期望值)
- scale:分布的标准差
- size:生成随机数的数目或形状,默认为None,表示返回单个随机数
示例代码:
import numpy as np # 生成一个正态分布的随机数 random_num = np.random.normal() print(random_num) # 生成一个正态分布的随机数组,形状为(2, 3) random_arr = np.random.normal(loc=0, scale=1, size=(2, 3)) print(random_arr)
五、随机整数
在一些数据科学领域中,需要生成随机整数。Python Numpy提供了两个用于生成随机整数的函数,分别是np.random.randint和np.random.shuffle。
六、np.random.randint
np.random.randint可以生成一个指定区间内的随机整数。其函数原型为:
numpy.random.randint(low, high=None, size=None, dtype='I')
参数说明:
- low:生成的随机整数的最小值(包含)
- high:生成的随机整数的最大值(不包含),默认为None,表示随机整数的范围为[0, low)
- size:生成随机整数的数目或形状,默认为None,表示返回单个随机整数
- dtype:生成随机整数的数据类型
示例代码:
import numpy as np # 生成一个指定范围[0, 10)的随机整数 random_int = np.random.randint(10) print(random_int) # 生成一个指定范围[0, 100)的5个随机整数组成的一维数组 random_arr = np.random.randint(100, size=5) print(random_arr) # 生成一个指定范围[0, 100)的(2, 3)形状的随机整数数组 random_arr = np.random.randint(100, size=(2, 3)) print(random_arr)
七、np.random.shuffle
np.random.shuffle可以对数组进行随机排列,即将数组中的元素打乱。其函数原型为:
numpy.random.shuffle(x)
参数说明:
- x:要打乱的数组
示例代码:
import numpy as np # 生成一维数组并打乱顺序 arr = np.arange(10) np.random.shuffle(arr) print(arr) # 生成二维数组并打乱每一行的顺序 arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) np.apply_along_axis(np.random.shuffle, 1, arr) print(arr)
八、总结
Python Numpy提供了一系列的随机数生成函数,可以方便、高效地生成高质量的随机数。我们可以使用这些函数来生成模拟数据、初始化模型参数、进行采样等。在具体使用时,需要根据具体需求选择不同的随机数函数。
示例代码:
# 生成一个均匀分布的随机数组,形状为(2, 3) random_arr1 = np.random.uniform(low=0, high=1, size=(2, 3)) # 生成一个正态分布的随机数组,形状为(2, 3) random_arr2 = np.random.normal(loc=0, scale=1, size=(2, 3)) # 生成一个指定范围[0, 100)的(2, 3)形状的随机整数数组 random_arr3 = np.random.randint(100, size=(2, 3)) print(random_arr1) print(random_arr2) print(random_arr3)