Python 3 Pandas Erreur: les pandas.analyseur.CParserError: Erreur de segmentation des données. C erreur: 11 champs de la ligne 5, vu 13

J'ai vérifié cette réponse que je vais avoir un problème similaire.

Python Pandas Erreur de segmentation des données

Cependant, pour certaines raisons, TOUTES mes lignes sont ignorées.

Mon code est simple:

import pandas as pd

fname = "data.csv"
input_data = pd.read_csv(fname)

et l'erreur que j'obtiens est:

  File "preprocessing.py", line 8, in <module>
    input_data = pd.read_csv(fname) #raw data file ---> pandas.core.frame.DataFrame type
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 465, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 251, in _read
    return parser.read()
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 710, in read
    ret = self._engine.read(nrows)
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 1154, in read
    data = self._reader.read(nrows)
  File "pandas/parser.pyx", line 754, in pandas.parser.TextReader.read (pandas/parser.c:7391)
  File "pandas/parser.pyx", line 776, in pandas.parser.TextReader._read_low_memory (pandas/parser.c:7631)
  File "pandas/parser.pyx", line 829, in pandas.parser.TextReader._read_rows (pandas/parser.c:8253)
  File "pandas/parser.pyx", line 816, in pandas.parser.TextReader._tokenize_rows (pandas/parser.c:8127)
  File "pandas/parser.pyx", line 1728, in pandas.parser.raise_parser_error (pandas/parser.c:20357)
pandas.parser.CParserError: Error tokenizing data. C error: Expected 11 fields in line 5, saw 13

Donc, quelque part, nous sommes censés à la rétro-ingénierie à partir de l'erreur de vos données qui l'a produite? S'il vous plaît poster échantillon brut d'entrée de données
Il semble que vos CSV n'ont pas le même nombre de champs de chaque ligne. Essayez de l'ouvrir dans Excel ou votre favori programme de feuille de calcul pour vérifier sa structure.
Cette description m'a amené ici et c'était le même problème que j'ai eu. +1 pour l'.
Générer dynamiquement les noms de colonne de la variable nombre de colonnes pour read_csv(): stackoverflow.com/a/52890095/1427624

OriginalL'auteur user1452494 | 2015-04-20

9

Solution est d'utiliser des pandas intégré séparateur de "reniflage".
```
input_data = pd.read_csv(fname, sep=None) 
```
OriginalL'auteur user1452494
4

Pour ceux qui débarquent ici, j'ai eu ce message d'erreur lorsque le fichier était en fait un .fichier xls pas un vrai .csv. Essayez de réenregistrer au format csv dans un tableur app.

OriginalL'auteur Kate Stohr
2

J'ai eu la même erreur, j'ai lu mes données csv à l'aide de ceci :
d1 = pd.read_json('my.csv')
ensuite, j'ai essayer cette
d1 = pd.read_json('my.csv', sep='\t')
et cette fois c'est bon.
Donc vous pouvez essayer cette méthode si votre délimiteur n'est pas ',", parce que la valeur par défaut est ',', donc si vous ne l'indique pas clairement, il va mal.
les pandas.read_csv

Incroyable! Merci beaucoup! Il a résolu mon problème.

OriginalL'auteur ShenDu
0

Cette erreur d'analyse peut se produire pour plusieurs raisons et des solutions pour les différentes raisons qui ont été présentées ici ainsi que dans Python Pandas Erreur de segmentation des données.

J'ai posté une solution à l'une des raisons possibles de cette erreur ici: https://stackoverflow.com/a/43145539/6466550

OriginalL'auteur computerist

Vous devez vous connecter pour publier un commentaire.