python pandas read_csv délimiteur dans la colonne de données
Je vais avoir ce type de fichier CSV:
12012;My Name is Mike. What is your's?;3;0
1522;In my opinion: It's cool; or at least not bad;4;0
21427;Hello. I like this feature!;5;1
Je veux obtenir ces données dans da pandas.DataFrame
.
Mais read_csv(sep=";")
lève des exceptions en raison de la point-virgule à l'utilisateur de générer un message de la colonne dans la ligne 2 (À mon avis: C'est cool; ou au moins pas mal). Toutes les autres colonnes constamment numérique dtypes.
Quelle est la méthode la plus pratique pour gérer cela?
Pouvez-vous expliquer plus sur votre problème? quelle est votre sortie attendue?
mon intention est d'analyser ce csv des données dans un DataFrame. Mais il jette une exception, car il y a un point-virgule dans une colonne et les pandas pense qu'il doit le diviser en deux colonnes.
Qui est la production de ces ambiguë fichiers et est-il possible de remuer ciel et terre pour obtenir sain d'esprit?
mon intention est d'analyser ce csv des données dans un DataFrame. Mais il jette une exception, car il y a un point-virgule dans une colonne et les pandas pense qu'il doit le diviser en deux colonnes.
Qui est la production de ces ambiguë fichiers et est-il possible de remuer ciel et terre pour obtenir sain d'esprit?
OriginalL'auteur Thomas Pazur | 2015-06-17
Vous devez vous connecter pour publier un commentaire.
Traiter avec des sociétés non cotées délimiteurs est toujours une nuisance. Dans ce cas, puisqu'il ressemble cassé le texte est connu pour être entouré par trois correctement codé colonnes, nous pouvons récupérer. TBH, je venais d'utiliser le standard de Python lecteur et de construire un DataFrame la fois à partir de:
qui produit
Ensuite, nous pouvons immédiatement enregistrer et obtenir quelque chose de la cité correctement:
OriginalL'auteur DSM