Python 3 Pandas Erreur: les pandas.analyseur.CParserError: Erreur de segmentation des données. C erreur: 11 champs de la ligne 5, vu 13
J'ai vérifié cette réponse que je vais avoir un problème similaire.
Python Pandas Erreur de segmentation des données
Cependant, pour certaines raisons, TOUTES mes lignes sont ignorées.
Mon code est simple:
import pandas as pd
fname = "data.csv"
input_data = pd.read_csv(fname)
et l'erreur que j'obtiens est:
File "preprocessing.py", line 8, in <module>
input_data = pd.read_csv(fname) #raw data file ---> pandas.core.frame.DataFrame type
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 465, in parser_f
return _read(filepath_or_buffer, kwds)
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 251, in _read
return parser.read()
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 710, in read
ret = self._engine.read(nrows)
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 1154, in read
data = self._reader.read(nrows)
File "pandas/parser.pyx", line 754, in pandas.parser.TextReader.read (pandas/parser.c:7391)
File "pandas/parser.pyx", line 776, in pandas.parser.TextReader._read_low_memory (pandas/parser.c:7631)
File "pandas/parser.pyx", line 829, in pandas.parser.TextReader._read_rows (pandas/parser.c:8253)
File "pandas/parser.pyx", line 816, in pandas.parser.TextReader._tokenize_rows (pandas/parser.c:8127)
File "pandas/parser.pyx", line 1728, in pandas.parser.raise_parser_error (pandas/parser.c:20357)
pandas.parser.CParserError: Error tokenizing data. C error: Expected 11 fields in line 5, saw 13
Donc, quelque part, nous sommes censés à la rétro-ingénierie à partir de l'erreur de vos données qui l'a produite? S'il vous plaît poster échantillon brut d'entrée de données
Il semble que vos CSV n'ont pas le même nombre de champs de chaque ligne. Essayez de l'ouvrir dans Excel ou votre favori programme de feuille de calcul pour vérifier sa structure.
Cette description m'a amené ici et c'était le même problème que j'ai eu. +1 pour l'.
Générer dynamiquement les noms de colonne de la variable nombre de colonnes pour read_csv(): stackoverflow.com/a/52890095/1427624
Il semble que vos CSV n'ont pas le même nombre de champs de chaque ligne. Essayez de l'ouvrir dans Excel ou votre favori programme de feuille de calcul pour vérifier sa structure.
Cette description m'a amené ici et c'était le même problème que j'ai eu. +1 pour l'.
Générer dynamiquement les noms de colonne de la variable nombre de colonnes pour read_csv(): stackoverflow.com/a/52890095/1427624
OriginalL'auteur user1452494 | 2015-04-20
Vous devez vous connecter pour publier un commentaire.
Solution est d'utiliser des pandas intégré séparateur de "reniflage".
OriginalL'auteur user1452494
Pour ceux qui débarquent ici, j'ai eu ce message d'erreur lorsque le fichier était en fait un .fichier xls pas un vrai .csv. Essayez de réenregistrer au format csv dans un tableur app.
OriginalL'auteur Kate Stohr
J'ai eu la même erreur, j'ai lu mes données csv à l'aide de ceci :
d1 = pd.read_json('my.csv')
ensuite, j'ai essayer cette
d1 = pd.read_json('my.csv', sep='\t')
et cette fois c'est bon.
Donc vous pouvez essayer cette méthode si votre délimiteur n'est pas ',", parce que la valeur par défaut est ',', donc si vous ne l'indique pas clairement, il va mal.
les pandas.read_csv
OriginalL'auteur ShenDu
Cette erreur d'analyse peut se produire pour plusieurs raisons et des solutions pour les différentes raisons qui ont été présentées ici ainsi que dans Python Pandas Erreur de segmentation des données.
J'ai posté une solution à l'une des raisons possibles de cette erreur ici: https://stackoverflow.com/a/43145539/6466550
OriginalL'auteur computerist