圣诞树动画

Question

GralL

Asked:2020-09-14 21:44:05 +0000 UTC2020-09-14 21:44:05 +0000 UTC 2020-09-14 21:44:05 +0000 UTC

分组后如何对不同的DataFrame列应用不同的聚合函数？

772

我有一个数据框

 col1  col2  col3     col4  col5   col6  col7
 0     Sem   01.2017   2     4     Noo    RX
 1     Kola  01.2017   3     4     Foo    RX
 2     Kety  02.2017   4     3     Roo    RX
 3     Pyti  01.2017   5     5     Kaa    RX
 4     Pyti  02.2017   3     1     Joo    RX
 5     Kola  03.2017   8     3     PPP    RX
 6     Café  01.2017   1     1     Cf     RX
 7     Kety  02.2017   2     1     T      RX

我groupby()为两个字段 col2、col3 做了，并找到了字段 col4 的总和：

df.groupby(['col2', 'col3'])['col4'].sum()

发生：

  col2    col3    col4
  Kola   01.2017   3
         03.2017   8
  Kety   02.2017   6
  Pyti   01.2017   5
         02.2017   3
  Sem    01.2017   2
  Café   01.2017   1

但是对于同一个分组，我需要添加第三列['col5'].unique()

最终结果应如下所示：

  col2     col3    col4   col5
  Kola    01.2017   3      4 
          03.2017   8      3
  Kety    02.2017   6      [3,1]
  Pyti    01.2017   5      5
          02.2017   3      1
  Sem     01.2017   2      4
  Café    01.2017   1      1

1 个回答

Voted

MaxU - stop genocide of UA · Answer 1 · 2020-09-14T21:49:56Z

Best Answer

MaxU - stop genocide of UA

2020-09-14T21:49:56Z2020-09-14T21:49:56Z

使用df.groupby(...).agg()方法：

In [183]: df.groupby(['col2', 'col3']).agg({'col4':'sum', 'col5':'unique'})
Out[183]:
             col4    col5
col2 col3
Café 1.2017     1     [1]
Kety 2.2017     6  [3, 1]
Kola 1.2017     3     [4]
     3.2017     8     [3]
Pyti 1.2017     5     [5]
     2.2017     3     [1]
Sem  1.2017     2     [4]

2

分组后如何对不同的DataFrame列应用不同的聚合函数？

是否可以在 C++ 中继承类 <---> 结构？

这种神经网络架构适合文本分类吗？

为什么分配的工作方式不同？

控制台中的光标坐标

如何在 C++ 中删除类的实例？

点是否属于线段的问题

json结构错误

ServiceWorker 中的“获取”事件

c ++控制台应用程序exe文件[重复]

按多列从sql表中选择

分组后如何对不同的DataFrame列应用不同的聚合函数？

1 个回答

相关问题