Python中不同图表的数据可视化的实现

 更新时间:2022年08月08日 14:23:05   作者:海拥  
数据可视化是以图形格式呈现数据。它通过以简单易懂的格式汇总和呈现大量数据,帮助人们理解数据的重要性,并有助于清晰有效地传达信息。本文为大家准备了Python实现不同图表数据可视化的代码,需要的可以参考一下

数据可视化是以图形格式呈现数据。它通过以简单易懂的格式汇总和呈现大量数据,帮助人们理解数据的重要性,并有助于清晰有效地传达信息。

考虑这个给定的数据集,我们将为其绘制不同的图表:

用于分析和呈现数据的不同类型的图表

 1.直方图

直方图表示特定现象发生的频率,这些现象位于特定的数值范围内,并以连续和固定的间隔排列。

在下面的代码中绘制直方图Age, Income, Sales。因此,输出中的这些图显示了每个属性的每个唯一值的频率。

# 导入 pandas 和 matplotlib
import pandas as pd
import matplotlib.pyplot as plt

# 创建上面给出的表的二维数组
data = [['E001', 'M', 34, 123, 'Normal', 350],
		['E002', 'F', 40, 114, 'Overweight', 450],
		['E003', 'F', 37, 135, 'Obesity', 169],
		['E004', 'M', 30, 139, 'Underweight', 189],
		['E005', 'F', 44, 117, 'Underweight', 183],
		['E006', 'M', 36, 121, 'Normal', 80],
		['E007', 'M', 32, 133, 'Obesity', 166],
		['E008', 'F', 26, 140, 'Normal', 120],
		['E009', 'M', 32, 133, 'Normal', 75],
		['E010', 'M', 36, 133, 'Underweight', 40] ]

# 使用上述数据数组创建的数据框
df = pd.DataFrame(data, columns = ['EMPID', 'Gender',
									'Age', 'Sales',
									'BMI', 'Income'] )

# 为数值数据创建直方图
df.hist()

# show plot
plt.show()

输出:

2. 柱形图

柱形图用于显示不同属性之间的比较,或者它可以显示项目随时间的比较。

# 此处使用之前代码的数据框

# 绘制数值条形图,将显示所有 3 个年龄、收入、销售额之间的比较
df.plot.bar()

# 在 2 个属性之间绘制
plt.bar(df['Age'], df['Sales'])
plt.xlabel("Age")
plt.ylabel("Sales")
plt.show()

输出:

3. 箱线图

箱线图是基于 minimum, first quartile, median, third quartile, and maximum. 术语“箱线图”来自这样一个事实,即图形看起来像一个矩形,线条从顶部和底部延伸。由于延伸线,这种类型的图有时被称为盒须图。

# 对于数据框的每个数字属性
df.plot.box()

# 单个属性箱线图
plt.boxplot(df['Income'])
plt.show()

输出:

4、饼图

饼图显示一个静态数字以及类别如何代表整体的一部分。饼图以百分比表示数字,所有段的总和需要等于 100%。

plt.pie(df['Age'], labels = {"A", "B", "C",
							"D", "E", "F",
							"G", "H", "I", "J"},
							
autopct ='% 1.1f %%', shadow = True)
plt.show()

plt.pie(df['Income'], labels = {"A", "B", "C",
								"D", "E", "F",
								"G", "H", "I", "J"},
								
autopct ='% 1.1f %%', shadow = True)
plt.show()

plt.pie(df['Sales'], labels = {"A", "B", "C",
							"D", "E", "F",
							"G", "H", "I", "J"},
autopct ='% 1.1f %%', shadow = True)
plt.show()

输出:

5、散点图

散点图显示了两个不同变量之间的关系,它可以揭示分布趋势。当有许多不同的数据点,并且您想突出数据集中的相似性时,应该使用它。这在查找异常值和了解数据分布时很有用。

# 收入和年龄之间的散点图
plt.scatter(df['income'], df['age'])
plt.show()

# 收入和销售额之间的散点图
plt.scatter(df['income'], df['sales'])
plt.show()

# 销售额和年龄之间的散点图
plt.scatter(df['sales'], df['age'])
plt.show()

输出 :

以上就是Python中不同图表的数据可视化的实现的详细内容,更多关于Python图表数据可视化的资料请关注脚本之家其它相关文章!

相关文章

  • 对pandas中iloc,loc取数据差别及按条件取值的方法详解

    对pandas中iloc,loc取数据差别及按条件取值的方法详解

    今天小编就为大家分享一篇对pandas中iloc,loc取数据差别及按条件取值的方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • 使用Python处理KNN分类算法的实现代码

    使用Python处理KNN分类算法的实现代码

    KNN分类算法(K-Nearest-Neighbors Classification),又叫K近邻算法,是一个概念极其简单,而分类效果又很优秀的分类算法,这篇文章主要介绍了使用Python处理KNN分类算法,需要的朋友可以参考下
    2022-09-09
  • python django事务transaction源码分析详解

    python django事务transaction源码分析详解

    这篇文章主要介绍了python django事务transaction源码分析详解的相关资料,需要的朋友可以参考下
    2017-03-03
  • 深入解读Python解析XML的几种方式

    深入解读Python解析XML的几种方式

    这篇文章主要为大家详细介绍了深入解读Python解析XML的几种方式,以ElementTree模块为例,演示具体使用方法和场景,感兴趣的小伙伴们可以参考一下
    2016-02-02
  • python列表中常见的一些排序方法

    python列表中常见的一些排序方法

    在Python实际开发中会经常需要用到对列表进行排序,下面这篇文章主要给大家介绍了关于python列表中常见的一些排序方法,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-09-09
  • python用selenium打开浏览器后秒关闭浏览器的解决办法

    python用selenium打开浏览器后秒关闭浏览器的解决办法

    最近朋友在学Selenium的时候遇到一个问题,当执行完selenium程序后,浏览器会闪退也就是自动关闭,这篇文章主要给大家介绍了关于python用selenium打开浏览器后秒关闭浏览器的解决办法,需要的朋友可以参考下
    2023-07-07
  • Pycharm内置终端及远程SSH工具的使用教程图文详解

    Pycharm内置终端及远程SSH工具的使用教程图文详解

    这篇文章主要介绍了Pycharm内置终端及远程SSH工具的使用教程,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • 在Django中预防CSRF攻击的操作

    在Django中预防CSRF攻击的操作

    这篇文章主要介绍了在Django中预防CSRF攻击的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Python中 pickle 模块的 dump() 和 load() 方法详解

    Python中 pickle 模块的 dump() 和 load()&

    Python 的 pickle 模块用于实现二进制序列化和反序列化,一个对象可以被序列化到文件中,然后可以从文件中恢复,这篇文章主要介绍了Python中 pickle 模块的 dump() 和 load() 方法详解,需要的朋友可以参考下
    2022-12-12
  • Python必备shelve与dbm本地持久化存储数据的两个强大工具

    Python必备shelve与dbm本地持久化存储数据的两个强大工具

    当涉及存储大量数据并且需要高效访问时,shelve和dbm模块是Python中用于本地持久化存储数据的两个强大工具,它们允许开发人员以键值对的形式存储数据,并支持快速的检索和更新操作,在本文将深入探讨这两个模块,展示它们的优势和应用场景
    2024-01-01

最新评论