一、散点图概述
散点图是一种以点的位置为坐标,以变量的值为数据的图表形式,用于观察两个变量之间的关系是否存在某种模式、趋势或异常值。在数据科学领域,散点图经常用于探索性数据分析和建模。
二、Python绘制散点图
1. 准备数据
使用Python绘制散点图需要先准备好数据,这里以一个简单的例子说明:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.scatter(x, y) plt.show()
上面的代码中,我们准备了两个数据序列x和y,然后使用plt.scatter函数绘制散点图,并使用plt.show函数显示图表。
2. 设置图表属性
虽然上面的代码能够生成散点图,但该图表缺少一些必要的属性,例如X、Y轴标签和图表标题等。下面我们来添加这些属性:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.scatter(x, y) plt.xlabel('X Axis') plt.ylabel('Y Axis') plt.title('Scatter Plot') plt.show()
通过给X、Y轴分别添加标签和设置标题,我们使图表更加清晰易懂。
3. 使用样式和颜色
通过指定样式和颜色,我们可以使散点图更加美观。例如下面的代码添加了大小、颜色、标记形状等属性:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.scatter(x, y, s=100, c='r', marker='o') plt.xlabel('X Axis') plt.ylabel('Y Axis') plt.title('Scatter Plot') plt.show()
上面的代码中,我们使用参数s设置点的大小,参数c设置点的颜色,参数marker设置标记形状,其中'r'表示红色,'o'表示一个圆形的标记。
4. 绘制多组数据
在实际的数据分析中,我们可能需要同时绘制多组数据,以便比较不同数据之间的关系。下面的代码演示了如何同时绘制两组数据:
import matplotlib.pyplot as plt x1 = [1, 2, 3, 4, 5] y1 = [2, 4, 6, 8, 10] x2 = [1, 2, 3, 4, 5] y2 = [1, 3, 5, 7, 9] plt.scatter(x1, y1, s=100, c='r', marker='o', label='Group 1') plt.scatter(x2, y2, s=100, c='b', marker='x', label='Group 2') plt.xlabel('X Axis') plt.ylabel('Y Axis') plt.title('Scatter Plot') plt.legend() plt.show()
上面的代码中,我们使用plt.scatter函数分别绘制两组数据,通过参数label设置每组数据的标签,然后使用plt.legend函数将标签放在图表的右上角。
三、总结
Python是数据科学领域最流行的编程语言之一,也是绘制散点图的一种很好的工具。通过本文,我们学习了如何使用Python绘制散点图,从基本的绘制到图表属性的设置,再到多组数据的绘制,让我们对散点图制作有了更深入的理解。