RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1596042
Accepted
Светлана
Светлана
Asked:2024-10-08 16:13:31 +0000 UTC2024-10-08 16:13:31 +0000 UTC 2024-10-08 16:13:31 +0000 UTC

使用 merge 按键合并两个 Pandas 数据帧

  • 772

合并两个数据框时,会出现额外的行。我将用一个例子来解释:数据帧1(50行),我通过4个键将数据帧2(1600万行)的列附加到它,最终的数据帧是51行。此外,这是额外的一行 - 它重复其中一行,即,事实上,行数由于行 - 重复而增加。可能是什么原因?当然,您可以稍后删除重复项,但我希望它们一开始就不会形成。 (至于数据类型 - 一切都很好,我检查过)

Вот примеры кода (2 варианта):

df_merged1 = pd.merge(
    res_test1, df3_,
    left_on=['uuid',  'id_route', 'vehicle_type', 'time' ],
    right_on=['uuid',  'id_route', 'vehicle_type', 'time' ]
)

df_merged2 = res_test1.merge(df3_, on=['uuid',  'id_route', 'vehicle_type', 'time' ])
pandas
  • 1 1 个回答
  • 29 Views

1 个回答

  • Voted
  1. Best Answer
    Sobolenko.Evgeniy
    2024-10-08T16:37:27Z2024-10-08T16:37:27Z

    如果左表中的一组键对应于右表中具有同一组键的多行,则可能会发生这种情况。

    import pandas as pd
    
    df1 = pd.DataFrame.from_dict({'1': [1, 2],
                                  '2': ['a', 'b']})
    df2 = pd.DataFrame.from_dict({'1': [1, 2, 2, 3],
                                  '3': ['a', 'd', 'd', 'c']})
    result1 = pd.merge(df1, df2)
    display(result1)
    

    我们得到:

    1 2 3
    1 一个 一个
    2 乙 d
    2 乙 d

    然后,您只需drop_duplicates在合并之前使用正确的数据集,只留下具有一组唯一键的行。

    df_merged2 = res_test1.merge(df3_.drop_duplicates(['uuid',  'id_route', 'vehicle_type', 'time']), on=['uuid',  'id_route', 'vehicle_type', 'time' ])
    
    • 2

相关问题

  • 如何在 Matplotlib 中的函数中组织数据标签

  • 按日期过滤,另一个数据框条件

  • 熊猫。按两个条件对行进行排序

  • 在控制台中写入 CSV 文件不存在

  • 多索引删除

  • 创建 pandas 多索引

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5