Pandas使用stack和pivot实现数据透视的方法(数据透视)

一、经过统计得到多维度指标数据

非常场景的统计场景，指定多个维度，计算聚合后的指标
实例：统计得到“电影评分数据集”，每个月份的每个分数被评分多少次:(月份、分数1-5、次数)

import pandas as pd
import numpy as np
%matplotlib inline
df=pd.read_csv(
  "./datas/ml-1m/ratings.dat",
 sep="::",
 engine='python',
 names='UserID::MovieID::Rating::Timestamp'.split("::"),
 header=None
)
df.head()
#将时间戳转换为具体的时间
df['padate']=pd.to_datetime(df["Timestamp"],unit='s')
df.head()
df.dtypes
#实现数据统计 
# 对于这样格式的数据，我想查看按月份，不同评分的次数趋势，是没有办法进行实现的，需要将数据转换为每个评分是一列才可以实现。
df_group=df.groupby([df["padate"].dt.month,"Rating"])["UserID"].agg(pv=np.sum) 
df_group.head(20)

二、使用unstack实现数据的二维透视

目的：想要画图对比按照月份的不同评分的数量趋势

df_stack=df_group.unstack()
df_stack
df_stack.plot()
#unstack和stack是互逆的操作
df_stack.stack().head(20)

三、使用pivot简化透视

pivot方法相当于对df使用set_index创建分层索引，然后调用unstack

df_group.head(20)
df_reset=df_group.reset_index()
df_reset.head()
df_pivot=df_reset.pivot("padate","Rating","pv")
df_pivot.head()
df_pivot.plot()

四、stack、unstack、pivot的语法

1.stack

stack:DataFrame.stack(level=-1,dropna=True),将column变成index，类似把横放的书籍变成竖放
level=-1代表多层索引的最内层，可以通过==0,1,2指定多层索引的对应层

2.unstack

unstack:DataFrame.unstack(level=-1,fill_value=None)，将index变成column，类似把竖放的书变成横放

3.pivot

pivot:DataFrame.pivot(index=None,columns=None,values=None)，指定index,columns,values实现二维透视

总结

到此这篇关于Pandas使用stack和pivot实现数据透视的方法的文章就介绍到这了,更多相关Pandas stack和pivot数据透视内容请搜索本站以前的文章或继续浏览下面的相关文章希望大家以后多多支持本站！

动态拨号：关键词排名下降是啥缘故，快速提高排名怎样做

排名优化：网站排名优化方法有什么，如何做有效果

老域名：怎样才算老域名，老域名建站有什么影响

内容优化：关键字排名要做哪些方面的优化，怎样做

技巧：网站转化率究竟是什么，有什么提升的技巧

一下吧：外贸站优化有哪些基本的做法和注意事项

概要：竞价推广费用大概要多少呢，竞价推广好不好

一下吧：SEO中site是什么意思，作用和应用是怎样的

邮箱：付费邮箱有哪些优势，付费邮箱挑选要考虑什么

集群是什么意思：集群是什么意思，都有哪些优势呢

服务器配置数据库配置服务器运维服务器安全
互联网资讯服务器公司 IDC数据中心
免费服务器香港服务器租用美国服务器租用

公司动态

产品资讯

行业资讯

Pandas使用stack和pivot实现数据透视的方法

目录

一、经过统计得到多维度指标数据

二、使用unstack实现数据的二维透视

三、使用pivot简化透视

四、stack、unstack、pivot的语法

1.stack

2.unstack

3.pivot

总结

骑士cms人才系统安装教程

ntp服务器

实时开通

免备案

全天候客户服务

专属顾问服务