是否可以以某种方式自定义 QTabWidget？

Question

SergFSM

Asked:2022-09-17 19:15:23 +0000 UTC2022-09-17 19:15:23 +0000 UTC 2022-09-17 19:15:23 +0000 UTC

分组DataFrame时如何更改级别的层次结构？

772

假设我们有一个这样的 DataFrame：

samp = pd.DataFrame({'region': ['North','North','South','South','East','East','West','West'], 
                     'store': list('ABCDEFGH'), 
                     'num': 100, 
                     'year':['2020','2020','2021','2021','2021','2021','2020','2021']})

  region store  num  year
0  North     A  100  2020
1  North     B  100  2020
2  South     C  100  2021
3  South     D  100  2021
4   East     E  100  2021
5   East     F  100  2021
6   West     G  100  2020
7   West     H  100  2021

需要按行对地区数据进行分组，按列对年份进行分组。

我通过 pivot_table or 来执行此操作groupby，这给出了相同的结果。或多或少是这样的：

pd.pivot_table(samp, index='region', columns='year',values=['store','num'],
                   aggfunc={'store': 'count','num':'sum'})

samp.groupby(['region','year']).agg(
           total_num=("num","sum"), 
           stores=("store", "count")).unstack()

我们以以下形式在输出中获得必要的数据：

         total_num      stores     
year     2020   2021    2020 2021
region                             
East      NaN  200.0    NaN  2.0
North   200.0    NaN    2.0  NaN
South     NaN  200.0    NaN  2.0
West    100.0  100.0    1.0  1.0

是否可以以某种方式更改分组顺序（层次结构？）以获取这种形式的数据（即按年份对列进行分组）：

       2020                2021
values total_num  stores   total_num  stores
region                             
East         NaN     NaN        200.0    2.0
North      200.0     2.0          NaN    NaN
South        NaN     NaN        200.0    2.0
West       100.0     1.0        100.0    1.0

在 Excel 数据透视表中，只需轻轻移动鼠标即可完成此操作，但在这里我找不到以这种形式显示数据的方法。swaplevel基本上不会改变任何东西。

这可以以某种方式完成吗？

1 个回答

Voted

MaxU - stop genocide of UA · Answer 1 · 2022-09-17T20:17:14Z

Best Answer

MaxU - stop genocide of UA

2022-09-17T20:17:14Z2022-09-17T20:17:14Z

使用DataFrame.swaplevel()和DataFrame.sort_index()：

res = (samp
       .groupby(['region','year'])
       .agg(total_num=("num","sum"),stores=("store", "count"))
       .unstack()
       .swaplevel(axis=1)
       .sort_index(axis=1))

结果：

In [60]: res
Out[60]:
year     2020             2021
       stores total_num stores total_num
region
East      NaN       NaN    2.0     200.0
North     2.0     200.0    NaN       NaN
South     NaN       NaN    2.0     200.0
West      1.0     100.0    1.0     100.0

4

分组DataFrame时如何更改级别的层次结构？

表格填充不起作用

提示 50/50，有两个，其中一个是正确的

在 PyQt5 中停止进程

我的脚本不工作

在文本文件中写入和读取列表

如何像屏幕截图中那样并排排列这些块？

确定文本文件中每一行的字符数

将接口对象传递给 JAVA 构造函数

正确更新数据库中的数据

Python解析不是css

分组DataFrame时如何更改级别的层次结构？

1 个回答

相关问题