圣诞树动画

Question

Viktorov

Asked:2020-11-05 03:20:05 +0000 UTC2020-11-05 03:20:05 +0000 UTC 2020-11-05 03:20:05 +0000 UTC

如何计算pandas中值个数的百分比？

772

我有一个DataFrame，其中包含各种值。

import pandas as pd 
df = pd.DataFrame({"data": [1, 1, 1, 1, 0, 0, 0, 2, 2, 3]})

我想计算每个值占总数据的百分之几，也就是得到一个这样的表：

value | percent
_____________________
0     | 30 ( или 0.3)
1     | 40 ( или 0.4)
2     | 20 ( или 0.2)
3     | 10 ( или 0.1)

我可以这样算：

# Добавляю еще одну колонку, чтобы нормально посчитать count()
df['column'] = 1
df2 = df.groupby('data').count()
df2['percent'] = df2['column'] / len(df.index)

我得到了我正在寻找的东西：

      column  percent
data                 
0          3      0.3
1          4      0.4
2          2      0.2
3          1      0.1

但是，我仍然觉得我做错了一切。这样的问题应该更容易解决。你能告诉我解决我的问题的最佳方法吗？

2 个回答

Voted

MaxU - stop genocide of UA · Answer 1 · 2020-11-05T04:06:29Z

Best Answer

MaxU - stop genocide of UA

2020-11-05T04:06:29Z2020-11-05T04:06:29Z

您可以使用GroupBy.size()方法- 在这种情况下，您不需要创建新列：

In [4]: df.groupby('data').size() / len(df)
Out[4]:
data
0    0.3
1    0.4
2    0.2
3    0.1
dtype: float64

4

lmaxl · Answer 2 · 2022-05-28T23:30:13Z

lmaxl

2022-05-28T23:30:13Z2022-05-28T23:30:13Z

可能无关紧要，但我认为是：

df['data'].value_counts(normalize=True)

1

如何计算pandas中值个数的百分比？

是否可以在 C++ 中继承类 <---> 结构？

这种神经网络架构适合文本分类吗？

为什么分配的工作方式不同？

控制台中的光标坐标

如何在 C++ 中删除类的实例？

点是否属于线段的问题

json结构错误

ServiceWorker 中的“获取”事件

c ++控制台应用程序exe文件[重复]

按多列从sql表中选择

如何计算pandas中值个数的百分比？

2 个回答

相关问题