Python 3 Pandas Erreur: les pandas.analyseur.CParserError: Erreur de segmentation des données. C erreur: 11 champs de la ligne 5, vu 13

J'ai vérifié cette réponse que je vais avoir un problème similaire.

Python Pandas Erreur de segmentation des données

Cependant, pour certaines raisons, TOUTES mes lignes sont ignorées.

Mon code est simple:

import pandas as pd

fname = "data.csv"
input_data = pd.read_csv(fname) 

et l'erreur que j'obtiens est:

  File "preprocessing.py", line 8, in <module>
    input_data = pd.read_csv(fname) #raw data file ---> pandas.core.frame.DataFrame type
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 465, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 251, in _read
    return parser.read()
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 710, in read
    ret = self._engine.read(nrows)
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 1154, in read
    data = self._reader.read(nrows)
  File "pandas/parser.pyx", line 754, in pandas.parser.TextReader.read (pandas/parser.c:7391)
  File "pandas/parser.pyx", line 776, in pandas.parser.TextReader._read_low_memory (pandas/parser.c:7631)
  File "pandas/parser.pyx", line 829, in pandas.parser.TextReader._read_rows (pandas/parser.c:8253)
  File "pandas/parser.pyx", line 816, in pandas.parser.TextReader._tokenize_rows (pandas/parser.c:8127)
  File "pandas/parser.pyx", line 1728, in pandas.parser.raise_parser_error (pandas/parser.c:20357)
pandas.parser.CParserError: Error tokenizing data. C error: Expected 11 fields in line 5, saw 13
Donc, quelque part, nous sommes censés à la rétro-ingénierie à partir de l'erreur de vos données qui l'a produite? S'il vous plaît poster échantillon brut d'entrée de données
Il semble que vos CSV n'ont pas le même nombre de champs de chaque ligne. Essayez de l'ouvrir dans Excel ou votre favori programme de feuille de calcul pour vérifier sa structure.
Cette description m'a amené ici et c'était le même problème que j'ai eu. +1 pour l'.
Générer dynamiquement les noms de colonne de la variable nombre de colonnes pour read_csv(): stackoverflow.com/a/52890095/1427624

OriginalL'auteur user1452494 | 2015-04-20