是否可以以某种方式自定义 QTabWidget？

Question

Yuriy Tigiev

Asked:2021-11-28 21:00:46 +0000 UTC2021-11-28 21:00:46 +0000 UTC 2021-11-28 21:00:46 +0000 UTC

如何快速计算表格中每一行排序元素的差值的算术平均数、几何平均数和调和平均数？

772

如何快速高效地计算一亿行表中每行排序元素差的算术、几何和调和平均值？

如果一行的两个元素之间的差为零，则必须将零替换为 1 才能计算平均值。

下面是代码。仅计数有效，ndf['r1']但由于apply. 我不知道如何快速计算几何和调和平均值。

import pandas as pd
import math

lst = [[1,23,45],[20,30,10],[60,15,2]]

df = pd.DataFrame(lst, columns = ['col1', 'col2', 'col3']) 
print(df)
ndf = pd.DataFrame()


ndf['r1'] = df.apply(lambda x: pd.Series(list(x.sort_values())),axis=1).diff(axis=1).iloc[:,1:].mean(axis=1)
#ndf['r2'] = (10 ** df.apply(lambda x: x.sort_values(),axis=1).diff(axis=1).iloc[:,1:].applymap(math.log10).sum(axis=1)) ** (1/len(columns)) 
#ndf['r3'] = len(df.columns)/( (1/df.diff(axis=1).iloc[:,1:]).sum(axis=1) )

print(ndf)

1 个回答

Voted

MaxU - stop genocide of UA · Answer 1 · 2021-11-28T21:38:13Z

Best Answer

MaxU - stop genocide of UA

2021-11-28T21:38:13Z2021-11-28T21:38:13Z

样本数据：

from scipy.stats import gmean, hmean

df = pd.DataFrame([[1,23,45],[20,30,10],[60,15,2],[45,1,1]])

In [91]: df
Out[91]:
    0   1   2
0   1  23  45
1  20  30  10
2  60  15   2
3  45   1   1  # <--- пример строки, где разность двух элементов одной строки равна нулю

Numpy使用和的矢量化解决方案SciPy：

# матрица разностей остортированных элементов каждой строки в таблице
a = np.diff(np.sort(df, axis=1), axis=1)
# замена 0 --> 1
a[a==0] = 1
res = pd.DataFrame({
    "mean": np.mean(a, axis=1),
    "gmean": gmean(a, axis=1),
    "hmean": hmean(a, axis=1)
}, index=df.index)

结果：

In [92]: res
Out[92]:
   mean      gmean      hmean
0  22.0  22.000000  22.000000
1  10.0  10.000000  10.000000
2  29.0  24.186773  20.172414
3  22.5   6.633250   1.955556

2

如何快速计算表格中每一行排序元素的差值的算术平均数、几何平均数和调和平均数？

如何从列表中打印最大元素（str 类型）的长度？

如何在 PyQT5 中清除 QFrame 的内容

如何将具有特定字符的字符串拆分为两个不同的列表？

导航栏活动元素

是否可以将文本放入数组中？[关闭]

如何一次用多个分隔符拆分字符串？

如何通过 ClassPath 创建 InputStream？

在一个查询中连接多个表

对列表列表中的所有值求和

如何对齐 string.Format 中的列？

如何快速计算表格中每一行排序元素的差值的算术平均数、几何平均数和调和平均数？

1 个回答

相关问题