一、boxplot函数介绍
boxplot是matlab中一个十分常用的函数,主要用于数据可视化。它可以将数据的五个关键统计指标(最小值,下四分位数,中位数,上四分位数,最大值)用一个箱体表示出来,很好地展现了数据的分布情况。
boxplot(data) % 直接绘制箱线图,默认为垂直方向
boxplot(data,'orientation','horizontal') % 绘制水平方向的箱线图
二、基本用法
使用boxplot函数绘制箱线图时,需要将数据以列向量或者矩阵的形式传递给该函数。
data = rand(50,5); % 生成50行5列的随机数矩阵
boxplot(data);
上述代码将生成一个垂直方向的箱线图,其中每一列对应矩阵data中的一列数据。
三、箱线图的元素
箱线图主要包含以下元素:
- 箱体:代表数据集合的中间50%范围,即第一四分位数Q1至第三四分位数Q3之间的数据
- 上下两条线(最大值和最小值):箭头上方和下方的线,要求距箱体不超过1.5倍IQR(四分位距)
- 中位数线:箱体中间的线,代表数据的中位数
- 离群值:超过1.5倍IQR范围外的数据点,用加号或圆点表示
data = [1,2,5,6,9,10,11,16]; % 一个例子
boxplot(data);
四、设置参数
boxplot函数提供了很多参数可以设置,例如修改箱线图的颜色、线型、离群值的显示方式等等。
以下是一些常用参数的代码示例:
data = rand(50,5); % 生成50行5列的随机数矩阵
figure; % 创建新窗口
boxplot(data,'Colors','r'); % 修改线条颜色为红色
boxplot(data,'Labels',{'A','B','C','D','E'}); % 修改每个箱体的标签
boxplot(data,'Symbol','+','Whisker',1.5); % 修改离群值的符号为加号,线的长度为1.5倍IQR,默认是四分位差程度以外的最大最小值。
boxplot(data,'PlotStyle','compact'); % 修改箱体风格为紧凑型
五、多组数据的比较
boxplot函数也可以用于多组数据的比较,在一个图中同时绘制多个箱线图。
data1 = rand(50,1);
data2 = rand(50,1)*2;
data3 = rand(50,1)*3;
data4 = rand(50,1)*4;
boxplot([data1,data2,data3,data4],'Labels',{'A','B','C','D'});
六、总结
本文详细介绍了matlab中boxplot函数的用法。我们可以通过传递数据,设置颜色、标签等参数,绘制出美观直观的箱线图。boxplot函数在数据分析、统计、机器学习等领域有着广泛的应用。