RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1559147
Accepted
Follin
Follin
Asked:2023-12-27 18:11:23 +0000 UTC2023-12-27 18:11:23 +0000 UTC 2023-12-27 18:11:23 +0000 UTC

需要获取重复项

  • 772

同事们,美好的一天。有 2 个 2 个月的数据框有用户数据,您需要比较这 2 个数据框并找到 2 个月内重复的用户。目前,我只留下了所需的列,并且似乎创建了一个包含该值(重复或不重复)的新列。链接到源数据

m = (october.merge(november, how='outer', on=['Структурная единица'], 
          suffixes=['', '_new'], indicator=True))
结构单元 _合并
0 客户 两个都
1 TsSO 特维尔 两个都
2 1760 仅左
3 1760 仅左
4 6251 仅左
... ...
23984 瓦列里·奥列戈维奇 亚什克维奇
23985 亚什克维奇维罗妮卡
23986 尼古拉·亚什克维奇
23987 亚绍夫·扎哈尔·杰尼索维奇
23988 亚绍娃·纳迪亚·穆斯哈托芙娜 right_only

23989 行 × 2 列

为了清楚起见,我还附上了表格的屏幕截图,否则无法使表格相同: 在此输入图像描述 如何在单独的数据框中显示所有重复用户及其数量?

python
  • 2 2 个回答
  • 61 Views

2 个回答

  • Voted
  1. Алексей Р
    2023-12-27T19:07:06Z2023-12-27T19:07:06Z

    如果您需要出现在第一帧和第二帧中的唯一全名列表,请像这样:

    df = df1.merge(df2, on='Структурная единица', how='inner')['Структурная единица'].drop_duplicates()
    

    指示符在这里是多余的;使用参数 就足够了how='inner'。然后删除重复项。

    • 1
  2. Best Answer
    Kirill Kondratenko
    2023-12-27T21:05:10Z2023-12-27T21:05:10Z

    如果我正确理解您需要在两个数据帧中查找用户的匹配项以及该用户的重复总数,那么使用.isin()and 的函数将执行以下操作value_counts():

    def user_counts(df1, df2, column):
        return (df1[df1[column].isin(df2[column])][column].value_counts() +
                df2[df2[column].isin(df1[column])][column].value_counts()).reset_index()
    
    user_counts(october, november, 'Структурная единица')
    

    结论:

        Структурная единица count
    0   Абаканов Савелий Андреевич  2
    1   Абасов Эмиль    2
    2   Абашин Роман Владимирович   3
    3   Аббасова Диана Дмитриевна   4
    4   Абдулин 2
    ... ... ...
    2245    тимофеева алиса николаевна  2
    2246    федорова александра андреевна   3
    2247    школьников юрий олеговвич   4
    2248    шувалов федор александрович 3
    2249    янглеев данила артемович    2
    
    2250 rows × 2 columns
    
    • 1

相关问题

  • 是否可以以某种方式自定义 QTabWidget?

  • telebot.anihelper.ApiException 错误

  • Python。检查一个数字是否是 3 的幂。输出 无

  • 解析多个响应

  • 交换两个数组的元素,以便它们的新内容也反转

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5