教你怎么用python绘制dotplot

 更新时间:2021年04月23日 10:27:45   作者:jeffery0207  
这篇文章主要介绍了教你怎么用python绘制dotplot,文中有非常详细的代码示例,对正在学习python的小伙伴们有很好地帮助,需要的朋友可以参考下

一、前言

R语言不少库都可以方便的画dotplot,但是低频使用R这么多年,我依旧觉得R不是一门真正的编程语言。目前,在python中绘制dotplot貌似没有很轻量、方便的库,因此工作之余写了这个python_dotplot包,方便自己也希望能够方便他人吧。

二、安装

可以通过pypi快速安装:

pip install python_dotplot

该package当然可能存在一定的bug,所以也会处于不断迭代的过程中,可以通过以下方式获得特定或最新版本

pip install python_dotplot --upgrade
pip install python_dotplot==0.0.1b1

如果通过--upgrade参数不能获得最新版本,国内镜像会有一定的延迟,可指定pypi官方源指定镜像:

pip install -i https://pypi.python.org/pypi python_dotplot

三、模块导入

import dotplot
import dotplot.utils
import pandas as pd

%config InlineBackend.figure_format = 'retina'  # 如果你的电脑设备是视网膜屏,可指定该参数渲染jupyter图像,会超清晰,超好看

包的层级结构很简单,主要包括以下模块:

dotplot

├── cmap.py # 自定义color map

├── core.py # 实现了Dotplot类,用于封装数据以及绘图

├── hierarchical.py # 实现了层次聚类,用于支持dotplot行和列通过层次聚类进行自动排序

├── __init__.py # 初始化模块

└── utils.py # 实用函数,目前是夹带私货,我自己用的预处理函数,也许对其他人也有用

四、数据准备

我们首先需要准备一个数据,这里要求输入必须是一个tidy data格式的pandas Dataframe,简而言之,tidy data是指在该数据框中每一行是一个观测,每一列是一个属性,下面以示例数据为例:

term_list = ['GO:0002455', 'GO:0006958', 'GO:0006956', 'GO:0038096','GO:0002673',
             'GO:0051251', 'GO:0060333', 'GO:0006910','GO:0002483', 'GO:0002440',
             'GO:0009141', 'GO:0009123', 'GO:0006119', 'GO:0009260', 'GO:0015985', 'GO:0015986', 'GO:0006260',
            'GO:0044843', 'GO:0061621', 'GO:0061718']

up = pd.read_csv('./example_data/group1.csv', header=0, index_col=0)
down = pd.read_csv('./example_data/group2.csv', header=0, index_col=0)

data = dotplot.utils.merge_clusterprofile_results(dataframes=(up, down), groups=['B6_up', 'B6_down'], term_list=term_list)
data.head()
Description GeneRatio BgRatio pvalue p.adjust qvalue geneID Count group
ID
GO:0002455 humoral immune response mediated by circulatin... 22/178 150/18670 19.365993 16.222197 16.298589 HLA-DQB1/CD55/IGHM/PTPRC/TRBC2/IGHG2/IGKV3-20/... 22 B6_up
GO:0006958 complement activation, classical pathway 20/178 137/18670 17.588789 14.989062 15.065454 CD55/IGHM/TRBC2/IGHG2/IGKV3-20/IGHV4-34/IGHV3-... 20 B6_up
GO:0006956 complement activation 20/178 175/18670 15.453684 13.008859 13.085251 CD55/IGHM/TRBC2/IGHG2/IGKV3-20/IGHV4-34/IGHV3-... 20 B6_up
GO:0038096 Fc-gamma receptor signaling pathway involved i... 18/178 139/18670 14.916693 12.675988 12.752379 PTPRC/LYN/IGHG2/IGKV3-20/IGHV4-34/IGHV3-30/IGL... 18 B6_up
GO:0002673 regulation of acute inflammatory response 18/178 159/18670 13.871614 11.817674 11.894066 HLA-E/CD55/IGHG2/IGKV3-20/IGHV4-34/IGHV3-30/IG... 18 B6_up

五、画图

首先我们可以借助 DotPlot的类方法parse_from_tidy_data 对数据进行封装,然后直接调用plot函数进行绘图。当然,你也可以通过DotPlot的构造函数__init__()来实例化DotPlot对象。

  • 一维数据展示
new_keys = {'item_key': 'Description','group_key': 'group','sizes_key': 'Count'}
dp = dotplot.DotPlot.parse_from_tidy_data(data, **new_keys)
sct = dp.plot(size_factor=10, cmap='Reds')  # 通过size_factor 调节图中点的大小

在这里插入图片描述

dp = dotplot.DotPlot.parse_from_tidy_data(data, item_key='Description', group_key='group', sizes_key='Count')  # 该效果完全同上,这是python语言特性
sct = dp.plot(size_factor=10, cmap='Reds')

在这里插入图片描述

  • 二维数据展示

我们可以通过color_key指定data中的列做颜色映射。

new_keys = {'item_key': 'Description','group_key': 'group','sizes_key': 'Count','color_key': 'pvalue'}
dp = dotplot.DotPlot.parse_from_tidy_data(data, **new_keys)
sct = dp.plot(size_factor=10, cmap='Reds', cluster_row=True)

在这里插入图片描述

  • ​三维数据展示

可以通过circle_key增加一列作为虚线圆圈的映射。

DEFAULT_CLUSTERPROFILE_KEYS = {
    'item_key': 'Description', 'group_key': 'group',
    'sizes_key': 'Count', 'color_key': 'pvalue',
    'circle_key': 'qvalue'
}
dp = dotplot.DotPlot.parse_from_tidy_data(data, **DEFAULT_CLUSTERPROFILE_KEYS)
sct = dp.plot(size_factor=10, cmap='Reds', cluster_row=True)

在这里插入图片描述

当然,更多的参数我们可以通过signature来查看,我对这些参数都做了类型注释,应该是通俗易懂的:

?dp.plot
Signature:
dp.plot(
    size_factor:float=15,
    vmin:float=0,
    vmax:float=None,
    path:Union[os.PathLike, NoneType]=None,
    cmap:Union[str, matplotlib.colors.Colormap]='Reds',
    cluster_row:bool=False,
    cluster_col:bool=False,
    cluster_kws:Union[Dict, NoneType]=None,
    **kwargs,
)
Docstring:
:param size_factor: `size factor` * `value` for the actually representation of scatter size in the final figure
:param vmin: `vmin` in `matplotlib.pyplot.scatter`
:param vmax: `vmax` in `matplotlib.pyplot.scatter`
:param path: path to save the figure
:param cmap: color map supported by matplotlib
:param kwargs: dot_title, circle_title, colorbar_title, dot_color, circle_color
            other kwargs are passed to `matplotlib.Axes.scatter`
:param cluster_row, whether to cluster the row
:param cluster_col, whether to cluster the col
:param cluster_kws, key args for cluster, including `cluster_method`, `cluster_metric`, 'cluster_n'
:return:

因此,我们可以通过关键字参数修改图例中的部分组件:

sct = dp.plot(size_factor=10, cmap='Reds', cluster_row=True,
dot_title = 'Count', circle_title='-log10(qvalue)',
colorbar_title = '-log10(pvalue)')

在这里插入图片描述

六、写在篇末

dotplot在数据可视化中是一个强有力的展示方式,选择一个合适的可视化方式胜过千言万语

最后,最适合的可视化方式是最直观、最简洁的,不是炫技,别被花里胡哨的可视化所迷住双眼而忽略了信息的传达。

到此这篇关于教你怎么用python绘制dotplot的文章就介绍到这了,更多相关python绘制dotplot内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • keras 多gpu并行运行案例

    keras 多gpu并行运行案例

    这篇文章主要介绍了keras 多gpu并行运行案例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • python解析xml模块封装代码

    python解析xml模块封装代码

    这篇文章主要分享下在python中解析xml文件的模块用法,以及对模块封装的方法,有需要的朋友参考下
    2014-02-02
  • 对python读取zip压缩文件里面的csv数据实例详解

    对python读取zip压缩文件里面的csv数据实例详解

    今天小编就为大家分享一篇对python读取zip压缩文件里面的csv数据实例详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • pygame实现非图片按钮效果

    pygame实现非图片按钮效果

    这篇文章主要介绍了pygame实现非图片按钮效果,不使用图片制作,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-10-10
  • 利用Python获取操作系统信息实例

    利用Python获取操作系统信息实例

    作为一个运维人员,经常需要获取系统的的各种信息,使用python会很方便帮助获得,这篇文章运用实例告诉大家如何利用Python来获取操作系统的信息,有需要的可以参考借鉴。
    2016-09-09
  • Python入门教程之运算符重载详解

    Python入门教程之运算符重载详解

    运算符重载意味着赋予超出其预定义的操作含义的扩展含义。例如运算符 + 用于添加两个整数以及连接两个字符串和合并两个列表。本文将通过示例带大家详细了解Python的运算符重载,感兴趣的可以了解一下
    2022-09-09
  • 使用python将图片改为灰度图或黑白图

    使用python将图片改为灰度图或黑白图

    使用python将图片改为灰度图或黑白图有三种方式,分别是是使用cv2库和PIL库来实现,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-04-04
  • Win10下python 2.7与python 3.7双环境安装教程图解

    Win10下python 2.7与python 3.7双环境安装教程图解

    这篇文章主要介绍了Win10下python 2.7与python 3.7双环境安装教程,本文图文并茂给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-10-10
  • 基于python实现自动化办公学习笔记(CSV、word、Excel、PPT)

    基于python实现自动化办公学习笔记(CSV、word、Excel、PPT)

    这篇文章主要介绍了基于python实现自动化办公学习笔记,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • python 已知平行四边形三个点,求第四个点的案例

    python 已知平行四边形三个点,求第四个点的案例

    这篇文章主要介绍了python 已知平行四边形三个点,求第四个点的案例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04

最新评论