Python matplotlib实战之气泡图绘制

 更新时间:2023年08月27日 09:22:28   作者:databook  
气泡图是一种多变量的统计图表,可以看作是散点图的变形,这篇文章主要为大家介绍了如何使用Matplotlib绘制气泡图,需要的小伙伴可以参考下

气泡图是一种多变量的统计图表,可以看作是散点图的变形。

与散点图不同的是,每一个气泡都表示三个维度的数据,除了像散点图一样有X,Y轴,气泡的大小可以表示另一个维度的数据。

例如,x轴表示产品销量,y轴表示产品利润,气泡大小代表产品市场份额百分比。

它可以帮助我们发现变量之间的模式、趋势和异常值。

通过气泡的大小和颜色,我们可以同时比较多个变量的值,并且可以快速识别出具有较大或较小数值的数据点。

1. 主要元素

气泡图通常用于展示和比较数据之间的关系和分布,可以展示三维(X,Y轴,气泡大小),甚至四维数据(X,Y轴,气泡大小,气泡颜色)之间的关系。
它的主要元素包括:

  • 横轴和纵轴:气泡图通常使用横轴和纵轴来表示两个变量的值。这些变量可以是数值型、分类型或时间型。
  • 气泡大小:气泡图通过气泡的大小来表示第三个变量的值。通常,气泡的大小与该变量的值成正比,较大的气泡表示较大的数值。
  • 气泡颜色:气泡图还可以使用颜色来表示第四个变量的值。不同的颜色可以用于区分不同的数据类别或者表示不同的数值范围。

2. 适用的场景

气泡图适用的分析场景包括:

  • 多变量关系分析:气通过横轴、纵轴和气泡大小,可以同时呈现三个变量的信息,帮助我们发现变量之间的模式、趋势和相关性。
  • 数据聚类和分类:气泡颜色可以用于区分不同的数据类别或者表示不同的数值范围。这使得气泡图在数据聚类和分类分析中非常有用,可以帮助我们识别出不同群组或类别之间的差异和相似性。
  • 比较分析:用于比较不同类别或不同时间点的数据。通过气泡的大小和颜色,我们可以直观地比较多个变量的值,快速识别出具有较大或较小数值的数据点,从而帮助我们理解数据的分布和变化情况。
  • 异常值检测:帮助我们快速识别出具有异常数值的数据点。通过比较气泡的大小和颜色,我们可以发现与其他数据点相比具有明显不同数值的数据,从而帮助我们识别和分析异常情况。

3. 不适用的场景

气泡图在以下情况可能不适用:

  • 大数据集:当数据集非常庞大时,气泡图可能不适合展示所有数据点,因为过多的气泡可能会导致图表混乱不清。
  • 单变量分析:如果只需要分析单个变量的分布或趋势,气泡图可能过于复杂,不是最佳选择。
  • 离散数据:如果数据是离散的,而不是连续的数值型数据,气泡图可能无法有效地展示变量之间的关系。

4. 分析实战

本次使用气泡图分析 2021年中欧之间的贸易数据情况。

气泡图可以分析三个维度的对比:

  • 进口额:横轴
  • 出口额:纵轴
  • 进出口总额:气泡大小

4.1. 数据来源

数据来源国家统计局公开的数据,整理好的数据可从下面的地址下载:databook.top/nation/A06

用到的三个统计数据分别是:

  • 中国同欧洲各国(地区)进出口总额:A06050103.csv
  • 中国向欧洲各国(地区)出口总额:A06050203.csv
  • 中国从欧洲各国(地区)进口总额:A06050303.csv
fp = "d:/share/data/A06050103.csv"
df_total = pd.read_csv(fp)
fp = "d:/share/data/A06050203.csv"
df_output = pd.read_csv(fp)
fp = "d:/share/data/A06050303.csv"
df_input = pd.read_csv(fp)

4.2. 数据清理

数据清理步骤主要包括:

  • 提取每个文件中2021年的数据
  • 去除中欧整体的交易额数据,只保留和各个国家之间的贸易数据
  • 合并进出口总额,进口额,出口额到一个数据集中
  • 过滤多余字符,生成一个表示国家的数据列
#提取每个文件中2021年的数据
df = df_total[df_total["sj"] == 2021]
#去除中欧整体的交易额数据,只保留和各个国家之间的贸易数据
data = df.loc[2:, ["zbCN", "value"]]
#重新映射列的名称
data = data.rename(columns={"zbCN":"country", "value": "total"})
#过滤多余字符,生成一个表示国家的数据列
data["country"] = data["country"].str.replace("中国同", "", regex=False)
data["country"] = data["country"].str.replace("进出口总额(万美元)", "", regex=False)
df = df_input[df_input["sj"] == 2021]
#合并进出口总额,进口额,出口额到一个数据集中
data["input"] = df.loc[2:, ["value"]]
df = df_output[df_output["sj"] == 2021]
#合并进出口总额,进口额,出口额到一个数据集中
data["output"] = df.loc[2:, ["value"]]
data.head(5)

和欧洲的总体交易数据位于每个数据集的第一行,所用用 loc[2:, ...] 来过滤。

4.3. 分析结果可视化

with plt.style.context("seaborn-v0_8"):
    fig = plt.figure()
    ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
    ax.scatter(
        data["input"] / 10000,
        data["output"] / 10000,
        data["total"] / 10000,
        c = np.random.rand(len(data)),
        cmap="Accent",
        alpha=0.6,
    )
    ax.set_xlabel("进口额(亿元)")
    ax.set_ylabel("出口额(亿元)")
    x = np.linspace(0, 1400, 7)
    y = x
    ax.plot(x, y, '-')

从图中可以看出:

横轴是进口额,纵轴是出口额,气泡越大,进出口总额越大。

中间的蓝色线表示进出口额度一样,可以看出,大部分国家都在蓝色线之上,说明我国和大部分欧洲的贸易都是顺差

到此这篇关于Python matplotlib实战之气泡图绘制的文章就介绍到这了,更多相关matplotlib气泡图内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 详解appium自动化测试工具(monitor、uiautomatorviewer)

    详解appium自动化测试工具(monitor、uiautomatorviewer)

    这篇文章主要介绍了详解appium自动化测试工具(monitor、uiautomatorviewer),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 3分钟看懂Python后端必须知道的Django的信号机制

    3分钟看懂Python后端必须知道的Django的信号机制

    这篇文章主要介绍了3分钟看懂Python后端必须知道的Django的信号机制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • Django视图和URL配置详解

    Django视图和URL配置详解

    这篇文章主要介绍了Django视图和URL配置详解,分享了相关代码示例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • Pytorch四维Tensor转图片并保存方式(维度顺序调整)

    Pytorch四维Tensor转图片并保存方式(维度顺序调整)

    这篇文章主要介绍了Pytorch四维Tensor转图片并保存方式(维度顺序调整),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-12-12
  • Tensorflow 查看变量的值方法

    Tensorflow 查看变量的值方法

    今天小编就为大家分享一篇Tensorflow 查看变量的值方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Python实现获取网页信息并解析

    Python实现获取网页信息并解析

    这篇文章主要为大家详细介绍了如何使用Python实现获取网页信息并解析功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-05-05
  • pytorch模型部署到onnx的详细过程

    pytorch模型部署到onnx的详细过程

    这篇文章主要介绍了如何简单的将pytorch模型部署到onnx,本文结合示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-08-08
  • 详解如何使用OpenCV和像素处理图像灰度化

    详解如何使用OpenCV和像素处理图像灰度化

    这篇文章主要为大家介绍了如何使用OpenCV和像素处理图像灰度化的方法示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • Django接收post前端返回的json格式数据代码实现

    Django接收post前端返回的json格式数据代码实现

    这篇文章主要介绍了Django接收post前端返回的json格式数据代码实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • Python实现日期判断和加减操作详解

    Python实现日期判断和加减操作详解

    这篇文章主要介绍了如何利用Python实现日期的判断,以及对日期的加减操作,文中的示例代码对我们学习或工作有一定的价值,需要的可以参考一下
    2022-01-01

最新评论