Les lignes en double lors de la fusion de dataframes en python
Je suis actuellement à la fusion de 2 dataframes avec une jointure externe, mais après la fusion, je vois que toutes les lignes sont dupliqués, même lorsque les colonnes j'ai fait la fusion à contenir les mêmes valeurs. Dans le détail:
list_1 = pd.read_csv('list_1.csv')
list_2 = pd.read_csv('list_2.csv')
merged_list = pd.merge(list_1 , list_2 , on=['email_address'], how='inner')
à la suite de l'entrée et de résultats:
list_1:
email_address, name, surname
john.smith@email.com, john, smith
john.smith@email.com, john, smith
elvis@email.com, elvis, presley
fine list_2:
email_address, street, city
john.smith@email.com, street1, NY
john.smith@email.com, street1, NY
elvis@email.com, street2, LA
merged_list:
email_address, name, surname, street, city
john.smith@email.com, john, smith, street1, NY
john.smith@email.com, john, smith, street1, NY
john.smith@email.com, john, smith, street1, NY
john.smith@email.com, john, smith, street1, NY
elvis@email.com, elvis, presley, street2, LA
elvis@email.com, elvis, presley, street2, LA
Ma question est, ne devrait-elle pas être comme cela?
merged_list (comment je l'aime :D):
email_address, name, surname, street, city
john.smith@email.com, john, smith, street1, NY
john.smith@email.com, john, smith, street1, NY
elvis@email.com, elvis, presley, street2, LA
Comment puis-je faire en sorte qu'il devient comme ça?
Merci beaucoup pour votre aide!
Mon commentaire peut sembler idiots, mais qui ne devrait pas l'opération de fusion et être merged_list = pd.de fusion(list_1 , fine list_2 ,=['email_address'], comment='intérieure') ?
Double Possible de les Pandas de Fusion - Comment éviter la duplication des colonnes
Oui j'ai fait une erreur dans la description, il fixe! De toute façon ma requête actuelle en python est comme vous l'avez dit 😀 Merci!
Double Possible de les Pandas de Fusion - Comment éviter la duplication des colonnes
Oui j'ai fait une erreur dans la description, il fixe! De toute façon ma requête actuelle en python est comme vous l'avez dit 😀 Merci!
OriginalL'auteur Roberto Bertinetti | 2016-08-18
Vous devez vous connecter pour publier un commentaire.
Les lignes en double, sont attendus. Chaque john smith dans
list_1
correspond à chaque john smith danslist_2
. J'ai dû abandonner les doublons dans une des listes. J'ai choisilist_2
.veuillez vous envisagez de accepter et upvoting une réponse si vous pensez qu'il a répondu à votre question
Désolé m'a pris du temps mais je l'ai fait 🙂
OriginalL'auteur piRSquared