一、截断正态分布的性质
截断正态分布是指在正态分布的基础上,将其限制在某个区间内。其特点是在限定的区间内密度函数不为0,在区间外部则密度函数为0。
与正态分布相似,截断正态分布也具有对称性、一峰性、钟形曲线以及70-95-99.7规律等基本性质。同时,截断正态分布也有从小到大趋于零、平均值等于中位数、方差能够描述分布的分散程度等特性。
通过对分布区间的限制,截断正态分布加强了对分布的控制,应用场景广泛。
二、正态分布的独立性判断
对于两个随机变量x和y,若其相互独立,则有P(x=a, y=b)=P(x=a)P(y=b)。通常情况下,我们将几组数据绘制成散点图,通过观察散点图的形状,来判断两个随机变量是否相互独立。
但有时候,正态分布的方差越小,散点图上的点越密集,相互独立的判断则更为困难。此时,我们可以采用Pearson相关系数或Spearman相关系数等方法进行判断。
三、截断正态分布的密度函数
对于一般的正态分布N(μ, σ^2),其密度函数为:
而对于截断正态分布N(a, b|μ, σ^2),其密度函数为:
其中I(x)为指示函数,当x满足条件时取值为1,否则为0。
四、截尾正态分布表达式
截尾正态分布与截断正态分布类似,主要区别在于其密度函数在限定区间外依然有一定值,但值逐渐衰减。其密度函数为:
其中,$\Phi$为正态分布函数。
五、截断正态分布的似然函数
对于一个截断正态分布模型,若其随机样本为$x_1, x_2, ..., x_n$,似然函数为:
我们的目标是求解最大化该函数的$\mu$和$\sigma$,从而确定该样本的模型参数。
六、截断正态分布的概率密度函数
截断正态分布的概率密度函数是指在给定参数条件下的概率密度函数。对于一个截取区间为[a, b]的截断正态分布,其概率密度函数为:
其中,$\phi(x)$和$\Phi(x)$分别为标准正态分布的概率密度函数和分布函数。
七、截断正态分布图像
import numpy as np from scipy.stats import truncnorm import matplotlib.pyplot as plt a, b = 20, 60 mu, sigma = 40, 10 x = np.linspace(mu - 4*sigma, mu + 4*sigma, 100) plt.plot(x, truncnorm.pdf(x, (a - mu)/sigma, (b - mu)/sigma, loc=mu, scale=sigma), 'r-', lw=5, alpha=0.6, label='truncnorm pdf') plt.legend(loc='best', frameon=False) plt.show()
八、截断正态分布密度函数
import numpy as np from scipy.stats import truncnorm a, b = 20, 60 mu, sigma = 40, 10 pdf = truncnorm.pdf(np.linspace(mu - 4*sigma, mu + 4*sigma, 100), (a - mu)/sigma, (b - mu)/sigma, loc=mu, scale=sigma) print("pdf:", pdf)
九、截断正态分布张量的函数
import tensorflow as tf from tensorflow_probability import distributions as tfd a, b = 20, 60 mu, sigma = 40, 10 tfd_truncnorm = tfd.TruncatedNormal(loc=mu, scale=sigma, low=a, high=b) print("mean:", tf.constant(mu)) print("mode:", tfd_truncnorm.mode()) print("variance:", tf.square(sigma))