2020年新年大赛！

Question

Viktorov

Asked:2020-03-26 16:40:59 +0000 UTC2020-03-26 16:40:59 +0000 UTC 2020-03-26 16:40:59 +0000 UTC

如何通过条件“in np.array”从 Pandas 中的 DataFrame 中选择数据？

772

我有类似这个数据集的东西，只有几十万行：

data = [{'name': 'name1', 'launch_id': 5},\
        {'name': 'name2', 'launch_id': 6},\
        {'name': 'name2', 'launch_id': 7},\
        {'name': 'name3', 'launch_id': 8}]
df = pd.DataFrame(data)

将会：

  | launch_id | name
---------------------
0   5           name1
1   6           name2
2   7           name2
3   8           name3

我想从中选择一些launch_id从另一个大型 DataFrame 获得的行。我用名字launch_id保存了必要的：np.arraysimple

simple = np.array([5, 8])

现在我想得到以下结果：

  | launch_id | name
---------------------
0   5           name1
3   8           name3

如果我写一个 SQL 查询，我会写一些where launch_id in simple.

如何在 Pandas 中获得类似的结果？

1 个回答

Voted

MaxU - stop genocide of UA · Answer 1 · 2020-03-26T16:42:53Z

Best Answer

MaxU - stop genocide of UA

2020-03-26T16:42:53Z2020-03-26T16:42:53Z

In [16]: df.query("launch_id in @simple")
Out[16]:
   launch_id   name
0          5  name1
3          8  name3

或者

In [18]: df[df['launch_id'].isin(simple)]
Out[18]:
   launch_id   name
0          5  name1
3          8  name3

Pandas 与 SQL 的比较...

PS Apache Spark SQL 支持 ANSI SQL，因此允许您直接编写 SQL 查询。

5

如何通过条件“in np.array”从 Pandas 中的 DataFrame 中选择数据？

根据浏览器窗口的大小调整背景图案的大小

理解for循环的执行逻辑

复制动态数组时出错（C++）

Or and If,elif,else 构造[重复]

如何构建支持 x64 的 APK

如何使按钮的输入宽度？

如何显示对象变量的名称？

如何循环一个函数？

LOWORD 宏有什么作用？

从字符串的开头删除直到并包括一个字符

如何通过条件“in np.array”从 Pandas 中的 DataFrame 中选择数据？

1 个回答

相关问题