有两个数据框:
df1
carNumber last_name first_name tel_drv
0 м599ео89 Максимов Сергей 79888888888
1 к595ум89 Шердаков Илья 79999999999
2 м055ун89 Иванов Александр 77979879879
3 м599ео89 Игамбердиев Исак 77789746566
4 н100ан89 Гученко Антон 79132131321
5 к584ум89 Пучеглазов Денис 79879877979
df2
carNumber carBrand carModel carColor carType carYear
0 м599ео89 Chery Tiggo Красный Эконом 2014
1 к595ум89 Chevrolet Cruze Серый Эконом 2013
2 м055ун89 Ford GRAND C-MAX Чёрный Эконом 2006
3 м599ео89 Hyundai Sonata Бежевый Эконом 2007
4 м904во89 Hyundai Solaris Голубой Эконом 2013
5 е585св89 Hyundai Solaris Серебристый Комфорт 2014
通过以下方式连接表carNumber
:
df_drv_car = df1.merge(df2, how='left')
但是df_drv_car
DataFrame 中出现了重复项。我究竟做错了什么?
我需要:
df_drv_car
carNumber last_name first_name tel_drv carBrand carModel carColor carType carYear
0 м599ео89 Максимов Сергей 79888888888 Chery Tiggo Красный Эконом 2014
1 к595ум89 Шердаков Илья 79999999999 Chevrolet Cruze Серый Эконом 2013
и т.д.
这就是集合的笛卡尔积的工作原理。如果两组中都有重复项,则结果集将包含所有组合:
你的桌子也会发生同样的情况: