RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 747562
Accepted
AivanF.
AivanF.
Asked:2020-11-21 18:07:49 +0000 UTC2020-11-21 18:07:49 +0000 UTC 2020-11-21 18:07:49 +0000 UTC

Pandas:与 OR 逻辑合并

  • 772

如何在Pandas 'e 中通过逻辑运算OR对多个字段的表进行内部联合?就像SQL中的表达式中的条件?该功能允许您只获得几个字段的完全匹配(即逻辑与操作)。ONJOINmerge

例子。有dataframedf1和df2,它们有两个共同的字段A和B,需要根据条件合并df1.A = df2.A OR df1.B = df2.B表中的信息df1被认为具有较高的优先级,即如果匹配只出现在一个字段(A或B)中,那么第二个的值取自df1。

df1:

#    A    B        C
0    104  peter    28
1    228  andre    10
2    89   paul     17
3    219  saul     14

df2:

#    A    B
0    104  jessy
1    230  andre
2    219  saul
3    126  amy

结果:

#    A    B        C
0    104  peter    28
1    228  andre    10
2    219  saul     14
python
  • 2 2 个回答
  • 10 Views

2 个回答

  • Voted
  1. Best Answer
    MaxU - stop genocide of UA
    2020-11-22T01:29:39Z2020-11-22T01:29:39Z

    对于简单的过滤,有一个更简单的解决方案:

    In [12]: df1.query("A in @df2.A or B in @df2.B")
    Out[12]:
         A      B   C
    0  104  peter  28
    1  228  andre  10
    3  219   saul  14
    

    或者

    In [17]: df1.loc[(df1['A'].isin(df2['A'])) | (df1['B'].isin(df2['B']))]
    Out[17]:
         A      B   C
    0  104  peter  28
    1  228  andre  10
    3  219   saul  14
    
    • 4
  2. AivanF.
    2020-11-21T18:07:49Z2020-11-21T18:07:49Z

    不幸的是,Pandas 没有用于此类操作的内置功能。为了得到想要的结果,我们需要根据想要的参数对dataframes进行独立的合并,然后把表格变成单一的格式,去掉重复,合并成最终的表格:

    # объединяем по полю А
    mix1 = pd.merge(df1, df2, how='inner', on=['A'])
    # приводим таблицы к единому виду
    mix1['B'] = mix1['B_x']
    mix1.drop('B_x', axis=1, inplace=True)
    mix1.drop('B_y', axis=1, inplace=True)
    
    
    # объединяем по полю В
    mix2 = pd.merge(df1, df2, how='inner', on=['B'])
    # избавляемся от дубликатов (*)
    mix2 = mix2.loc[mix2['A_x'] != mix2['A_y']]
    # приводим таблицы к единому виду
    mix2['A'] = mix2['A_x']
    mix2.drop("A_x", axis=1, inplace=True)
    mix2.drop("A_y", axis=1, inplace=True)
    
    
    # конкатенация в итоговый датафрейм с новой нумерацией строк
    result = pd.concat([mix1, mix2], ignore_index=True)
    

    (*) 关于重复。按字段 A 合并数据帧会给出 A 相等的两个表共有的行,它们还包括 A 和 B 相等的行。类似地,由 B 合并将给出具有公共 A 和 B 的行。因此,连接这两个表将给出重复rows ,其中 A 和 B 相等。因此,在第二个表中进行过滤,结果只保留具有相等 B 而不是 A 的行,并且结果表具有三个必要组合的副本:

    A_ |  AB
    --------
    __ |  _B
    
    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    Python 3.6 - 安装 MySQL (Windows)

    • 1 个回答
  • Marko Smith

    C++ 编写程序“计算单个岛屿”。填充一个二维数组 12x12 0 和 1

    • 2 个回答
  • Marko Smith

    返回指针的函数

    • 1 个回答
  • Marko Smith

    我使用 django 管理面板添加图像,但它没有显示

    • 1 个回答
  • Marko Smith

    这些条目是什么意思,它们的完整等效项是什么样的

    • 2 个回答
  • Marko Smith

    浏览器仍然缓存文件数据

    • 1 个回答
  • Marko Smith

    在 Excel VBA 中激活工作表的问题

    • 3 个回答
  • Marko Smith

    为什么内置类型中包含复数而小数不包含?

    • 2 个回答
  • Marko Smith

    获得唯一途径

    • 3 个回答
  • Marko Smith

    告诉我一个像幻灯片一样创建滚动的库

    • 1 个回答
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Алексей Шиманский 如何以及通过什么方式来查找 Javascript 代码中的错误? 2020-08-03 00:21:37 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    user207618 Codegolf——组合选择算法的实现 2020-10-23 18:46:29 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5