一个星期以来,我一直在挠头。有 4 列,两个数据框各 2 列。比较列df1['Name']和df2['Name 2']时需要找到唯一值。重要的是 df1['Age'] 和 df2['Majority'] 列的值绑定到 df3['Name'] 的值,这样它们就不会在比较中丢失。以 3 列结束,df3['Name']、df3['Age']、df3['Speciality'] 列中的唯一名称。
import pandas as pd
data1 = {'Имя': ['Сергей', 'Владимир', 'Александр', 'Евгений', 'Анна', 'Татьяна', 'Ирина', 'Ольга', 'Елена', 'Сергей'],
'Возраст': [20, 25, 35, 28, 35, 41, 45, 30, 42, 46],}
data2 = {
'Имя': ['Александр', 'Сергей', 'Евгений', 'Объект', 'Объект', 'Объект', 'Татьяна', 'Объект', 'Объект', 'Объект'],
'Специальность': ['Программист', 'Строитель', 'Монтажник', 'Инженер', 'Домохозяйка', 'Повар', 'Швея', 'Врач', 'Актриса', 'Программист'],}
df1 = pd.DataFrame(data1, index=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
df2 = pd.DataFrame(data2, index=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
df3 = pd.DataFrame(list(range(10)))
df3[['Имя', 'Возраст']] = df1.loc[:, ['Имя', 'Возраст']]
df3[['Имя 2', 'Специальность']] = df2.loc[:, ['Имя', 'Специальность']]
如果我对您的理解正确,那么
DataFrame.merge这就是您所需要的:如果这不是您所需要的,请尝试使用
how函数参数merge。