是否可以以某种方式自定义 QTabWidget？

Question

Follin

Asked:2023-12-27 18:11:23 +0000 UTC2023-12-27 18:11:23 +0000 UTC 2023-12-27 18:11:23 +0000 UTC

需要获取重复项

772

同事们，美好的一天。有 2 个 2 个月的数据框有用户数据，您需要比较这 2 个数据框并找到 2 个月内重复的用户。目前，我只留下了所需的列，并且似乎创建了一个包含该值（重复或不重复）的新列。链接到源数据

m = (october.merge(november, how='outer', on=['Структурная единица'], 
          suffixes=['', '_new'], indicator=True))

结构单元	_合并
0 客户	两个都
1 TsSO 特维尔	两个都
2 1760	仅左
3 1760	仅左
4 6251	仅左
...	...
23984	瓦列里·奥列戈维奇亚什克维奇
23985	亚什克维奇维罗妮卡
23986	尼古拉·亚什克维奇
23987	亚绍夫·扎哈尔·杰尼索维奇
23988	亚绍娃·纳迪亚·穆斯哈托芙娜 right_only

23989 行 × 2 列

为了清楚起见，我还附上了表格的屏幕截图，否则无法使表格相同：如何在单独的数据框中显示所有重复用户及其数量？

2 个回答

Voted

Алексей Р · Answer 1 · 2023-12-27T19:07:06Z

Алексей Р

2023-12-27T19:07:06Z2023-12-27T19:07:06Z

如果您需要出现在第一帧和第二帧中的唯一全名列表，请像这样：

df = df1.merge(df2, on='Структурная единица', how='inner')['Структурная единица'].drop_duplicates()

指示符在这里是多余的；使用参数就足够了how='inner'。然后删除重复项。

1

Kirill Kondratenko · Answer 2 · 2023-12-27T21:05:10Z

如果我正确理解您需要在两个数据帧中查找用户的匹配项以及该用户的重复总数，那么使用.isin()and 的函数将执行以下操作value_counts()：

def user_counts(df1, df2, column):
    return (df1[df1[column].isin(df2[column])][column].value_counts() +
            df2[df2[column].isin(df1[column])][column].value_counts()).reset_index()

user_counts(october, november, 'Структурная единица')

结论：

    Структурная единица count
0   Абаканов Савелий Андреевич  2
1   Абасов Эмиль    2
2   Абашин Роман Владимирович   3
3   Аббасова Диана Дмитриевна   4
4   Абдулин 2
... ... ...
2245    тимофеева алиса николаевна  2
2246    федорова александра андреевна   3
2247    школьников юрий олеговвич   4
2248    шувалов федор александрович 3
2249    янглеев данила артемович    2

2250 rows × 2 columns

需要获取重复项

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

需要获取重复项

2 个回答

相关问题