2020年新年大赛！

Question

Viktorov

Asked:2020-01-22 23:48:49 +0000 UTC2020-01-22 23:48:49 +0000 UTC 2020-01-22 23:48:49 +0000 UTC

比较给定 epsilon 值的列并将结果放在第三列

772

我正在尝试解决这个问题：
有一个带有两列实数的 DataFrame。
我想构建第三列，它将采用值：

1 - 如果第二列中的数字大于第一列中的数字
0 - 如果两列中的数字相等
-1 - 如果第二列中的数字小于第一列中的数字

比较时，我想考虑一些 epsilon，因为由于测量误差，这些数字可能“大致相等”。

我写了这段代码，它似乎可以按我的需要工作：

columns = ['col1', 'col2']
data = [[1.0, 1.0], [1.0, 2.0], [2.0, 1.0]]
epsilon = 0.01
df = pd.DataFrame(data, columns=columns)
df['is_up'] = np.where((df['col2'] - df['col1'] > epsilon),1, np.nan)
df['is_down'] = np.where((df['col2'] - df['col1'] < - epsilon),-1, np.nan)
df['is_equal'] =  np.where((abs(df['col2'] - df['col1']) < epsilon),0, np.nan)

df['col3'] = df[['is_up','is_down','is_equal']].replace('None','').sum(1)

结果：

-----------------------------------------------
col1 | col2 | is_up | is_down | is_equal | col3
-----------------------------------------------
1.0  |1.0   |NaN    |NaN      |0.0       |0.0
1.0  |2.0   |1.0    |NaN      |NaN       |1.0
2.0  |1.0   |NaN    |-1.0     |NaN       |-1.0

但是，我有一种感觉，它可以做得更简单，更清晰，更快。请指出正确的道路！

2 个回答

Voted

CrazyElf · Answer 1 · 2020-01-23T00:43:38Z

Best Answer

CrazyElf

2020-01-23T00:43:38Z2020-01-23T00:43:38Z

在我看来，我可以提供一个更易于理解的解决方案，但使用额外的 numba 库。这个库中的 vectorize 装饰器允许您使用值的向量（数组），就好像它们是普通数字一样（并且做得非常快）。

from numba import vectorize

@vectorize
def compare_with_epsilon(x, y, epsilon):
  if x - y > epsilon:
    return 1
  elif x - y < -epsilon:
    return -1
  else:
    return 0

df['col3'] = compare_with_epsilon(df['col2'].values, df['col1'].values, epsilon)

原则上，如果您在传递给函数输入的数组值的循环中进行并行迭代，则可以不使用向量化，但是使用这样的装饰器，代码更清晰，应该可以很快工作.

4

MaxU - stop genocide of UA · Answer 2 · 2020-01-23T05:04:12Z

MaxU - stop genocide of UA

2020-01-23T05:04:12Z2020-01-23T05:04:12Z

np.isclose()也可以使用np.sign()：

df['col3'] = np.where(
    np.isclose(df['col1'], df['col2'], atol=epsilon), 
    0, 
    np.sign(df['col2'] - df['col1']))

3

比较给定 epsilon 值的列并将结果放在第三列

如何从列表中打印最大元素（str 类型）的长度？

如何在 PyQT5 中清除 QFrame 的内容

如何将具有特定字符的字符串拆分为两个不同的列表？

导航栏活动元素

是否可以将文本放入数组中？[关闭]

如何一次用多个分隔符拆分字符串？

如何通过 ClassPath 创建 InputStream？

在一个查询中连接多个表

对列表列表中的所有值求和

如何对齐 string.Format 中的列？

比较给定 epsilon 值的列并将结果放在第三列

2 个回答

相关问题