一、概述
numpy正态分布是概率统计中的重要概念,也是numpy中的一个常用函数,常用于生成随机数和概率分布的模拟。它可以用一组数值来表示某个随机变量的分布情况,其图像呈钟形曲线,中间部分高而两端低。正态分布函数包含两个参数,即平均值和标准差,通过调整这两个参数可以控制正态分布的形状。接下来从几个方面来详细阐述numpy正态分布。
二、生成正态分布随机数
import numpy as np
import matplotlib.pyplot as plt
# 生成随机数
mu, sigma = 0, 0.1 # 平均值和标准差
s = np.random.normal(mu, sigma, 1000)
# 绘图
count, bins, ignored = plt.hist(s, 30, density=True)
plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) * np.exp(-(bins - mu)**2 / (2 * sigma**2)),
linewidth=2, color='r')
plt.show()
numpy中的random模块可以用于生成正态分布的随机数,需要传入平均值和标准差作为参数。上述代码生成了1000个均值为0,标准差为0.1的正态分布随机数,并通过matplotlib库绘制了对应的概率密度函数图像。可以看到,其呈钟形曲线,且中心围绕着0值,两端随着距离0的增大呈指数下降。
三、计算正态分布概率密度函数值
import numpy as np
def norm_pdf(x, mu, sigma):
"""
计算正态分布概率密度函数值
:param x: 自变量
:param mu: 均值
:param sigma: 标准差
:return: 对应的概率密度函数值
"""
return np.exp(-((x - mu) ** 2) / (2 * (sigma ** 2))) / (sigma * np.sqrt(2 * np.pi))
x_values = np.linspace(-10, 10, num=100) # 获取x轴的数值
y_values = norm_pdf(x_values, 0, 1) # 获取对应的y轴数值
# 绘图
import matplotlib.pyplot as plt
plt.plot(x_values, y_values, 'b')
plt.show()
我们可以定义一个函数来计算正态分布函数的值,并使用numpy中linspace函数得到一组x轴坐标,根据正态分布函数公式计算对应的y轴坐标。上述代码绘制了均值为0,标准差为1的正态分布的概率密度函数图像。可见在x轴0点处概率密度函数值最大。
四、生成二维正态分布
import numpy as np
import matplotlib.pyplot as plt
# 均值和协方差矩阵
mu = np.array([0., 0.])
sigma = np.array([[ 1. , 0.5], [0.5, 1.]])
# 生成二维正态分布样本
x, y = np.random.multivariate_normal(mu, sigma, 1000).T
# 绘图
fig, ax = plt.subplots()
ax.plot(x, y, 'x')
plt.axis('equal')
plt.show()
二维正态分布是一种随机向量的概率分布,可以用二元高斯分布表示,它与单维正态分布类似,也有均值和方差这两个参数,并且具有相互独立的组成元素。上述代码演示了如何通过numpy中函数multivariate_normal生成二维正态分布样本,传入均值和协方差矩阵作为参数即可。得到样本之后,可以使用matplotlib库进行绘图。通过散点图展示得到的样本,得到的图形呈现椭圆形状,且中心处有一点集中。
五、正态分布应用
除了生成随机数和计算概率密度函数外,正态分布在实际应用中也有较多的场景。例如,正态分布可以用于建立回归模型,也可以用于判断随机过程是否符合正态分布假设等。
六、总结
正态分布是概率统计领域中的重要概念,numpy中提供了生成随机数、计算概率密度函数、生成二维正态分布样本等多个功能函数,是数据分析和统计建模中常用的工具之一。在实际应用中,正态分布在建模和数据分析过程中发挥了重要作用。