Python Pyecharts绘制桑基图分析用户行为路径

 更新时间:2022年05月11日 16:39:05   作者:蚂蚁ailing  
这篇文章主要为大家介绍了Python Pyecharts绘制桑基图分析用户行为路径,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

桑基图,它的核心是对不同点之间,通过线来连接。线的粗细代表流量的大小。很多工具都能实现桑基

图,比如:Excel、tableau,我们今天要用 Pyecharts 来绘制。

因为没有用户行为路径相关的公开数据,所以本次实现可视化是根据泰坦尼克号,其生存与遇难的人的

数据,来分析流向路径。学会思路,你也可以换成自己公司的用户行为埋点数据。

读取数据

数据来源:https://www.kaggle.com/c/titanic

from pyecharts import options as opts
from pyecharts.charts import Sankey
import pandas as pd
data = pd.read_excel('/Users/wangwangyuqing/Desktop/train.xlsx')
data

整理数据结构:父类→子类→值

从父类到子类,每相邻的两个分类变量都需要计算,使用 Pandas 中数据透视表,计算后的数据纵向合并成三列。

lis = data.columns.tolist()[:-1]
lis1 = lis[:-1]
lis2 = lis[1:]
data1 = pd.DataFrame()
for i in zip(lis1,lis2):  
    datai = data.pivot_table('ID',index=list(i),aggfunc='count').reset_index()
    datai.columns=[0,1,2]
    data1 = data1.append(datai)
data1

生成节点数据

需要把所有涉及到的节点去重规整在一起。列表内嵌套字典的形式去重汇总。

# 生成nodes
nodes = []
# 先添加几个顶级的父节点
nodes.append({'name':'C港口'})
nodes.append({'name':'Q港口'})
nodes.append({'name':'S港口'})
# 添加其他节点
for i in data1[1].unique():    
    dic = {}    
    dic['name'] = i    
    nodes.append(dic)
nodes

组织数据:定义节点和流量

数据从哪里流向哪里,流量(值)是多少,循环+字典来组织数据

links = []
for i in data1.values:    
    dic = {}    
    dic['source'] = i[0]    
    dic['target'] = i[1]    
    dic['value'] = i[2]
    links.append(dic)
links

数据可视化

c = (
    Sankey(init_opts=opts.InitOpts(width="1200px", height="800px",theme='westeros'))
    .add(
        "",
        nodes=nodes,
        links=links,
        linestyle_opt=opts.LineStyleOpts(opacity=0.2, curve=0.5, color="source"),
        label_opts=opts.LabelOpts(position="right"),
    )
    .set_global_opts(title_opts=opts.TitleOpts(title="桑基图"))
    .render("/Users/wangwangyuqing/Desktop/image.html")
)

桑基图是分析用户路径的有效方法之一,能非常直观地展现用户旅程,帮助我们进一步确定转化漏斗中的关键步骤,发现用户的

流失点,找到有价值的用户群体,看用户主要流向了哪里,发现用户的兴趣点以及被忽略的产品价值,寻找新的机会。

以上就是Python Pyecharts绘制桑基图分析用户行为路径的详细内容,更多关于Pyecharts绘制桑基图的资料请关注脚本之家其它相关文章!

相关文章

  • pymysql模块使用简介与示例

    pymysql模块使用简介与示例

    这篇文章主要介绍了pymysql模块使用的相关资料,帮助大家更好的利用python操作MySQL数据库,感兴趣的朋友可以了解下
    2020-11-11
  • Pycharm中的下载安装、配置与测试方式

    Pycharm中的下载安装、配置与测试方式

    这篇文章主要介绍了Pycharm中的下载安装、配置与测试方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-12-12
  • Python中的列表及其操作方法

    Python中的列表及其操作方法

    这篇文章主要介绍了Python中的列表及其操作方法,涉及到的方法包括对列表元素进行修改、添加、删除、排序以及求列表长度等,此外还介绍了列表的遍历、数值列表、切片和元组的一些操作,下文详细介绍需要的小伙伴可以参考一下
    2022-03-03
  • Django在urls.py利用函数path()配置路由时传递参数给调用的视图函数的方法(推荐)

    Django在urls.py利用函数path()配置路由时传递参数给调用的视图函数的方法(推荐)

    这篇文章主要介绍了Django在urls.py利用函数path()配置路由时传递参数给调用的视图函数的方法(推荐),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2024-01-01
  • 以Python的Pyspider为例剖析搜索引擎的网络爬虫实现方法

    以Python的Pyspider为例剖析搜索引擎的网络爬虫实现方法

    这篇文章主要介绍了以Python的Pyspider为例剖析搜索引擎的网络爬虫实现方法,Pyspider是一个开源项目、用Python语言编写十分简洁且具有爬虫程序的代表性,需要的朋友可以参考下
    2015-03-03
  • python批量生成本地ip地址的方法

    python批量生成本地ip地址的方法

    这篇文章主要介绍了python批量生成本地ip地址的方法,实例分析了Python实现生成本地IP地址并绑定到网卡上的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03
  • python脚本执行CMD命令并返回结果的例子

    python脚本执行CMD命令并返回结果的例子

    今天小编就为大家分享一篇python脚本执行CMD命令并返回结果的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • python基于celery实现异步任务周期任务定时任务

    python基于celery实现异步任务周期任务定时任务

    这篇文章主要介绍了python基于celery实现异步任务周期任务定时任务,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • Python中range函数的使用方法

    Python中range函数的使用方法

    这篇文章主要介绍了Python中range函数的使用方法,文章基于Python3环境展开range函数的使用方法,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-05-05
  • pandas实现滑动窗口的示例代码

    pandas实现滑动窗口的示例代码

    本文主要介绍了pandas实现滑动窗口的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03

最新评论