合并两个数据框时,会出现额外的行。我将用一个例子来解释:数据帧1(50行),我通过4个键将数据帧2(1600万行)的列附加到它,最终的数据帧是51行。此外,这是额外的一行 - 它重复其中一行,即,事实上,行数由于行 - 重复而增加。可能是什么原因?当然,您可以稍后删除重复项,但我希望它们一开始就不会形成。 (至于数据类型 - 一切都很好,我检查过)
Вот примеры кода (2 варианта):
df_merged1 = pd.merge(
res_test1, df3_,
left_on=['uuid', 'id_route', 'vehicle_type', 'time' ],
right_on=['uuid', 'id_route', 'vehicle_type', 'time' ]
)
df_merged2 = res_test1.merge(df3_, on=['uuid', 'id_route', 'vehicle_type', 'time' ])
如果左表中的一组键对应于右表中具有同一组键的多行,则可能会发生这种情况。
我们得到:
然后,您只需
drop_duplicates
在合并之前使用正确的数据集,只留下具有一组唯一键的行。