hdf5 fichier pandas dataframe
J'ai téléchargé un jeu de données qui est stocké dans .h5 fichiers.
J'ai besoin de garder seulement certaines colonnes et d'être capable de manipuler les données qu'il contient.
Pour ce faire, j'ai essayé de le charger dans une pandas dataframe. J'ai essayé d'utiliser:
pd.read_hdf(path)
Mais j'obtiens: No dataset in HDF5 file.
J'ai trouvé des réponses sur (lire HDF5 fichier pandas DataFrame avec des conditions) mais je n'ai pas besoin de conditions, et la réponse ajoute des conditions sur la façon dont le fichier a été écrit, mais je ne suis pas le créateur du fichier, donc je ne peux rien faire à ce sujet.
J'ai aussi essayé d'utiliser h5py:
df = h5py.File(path)
Mais ce n'est pas facilement manipulable et je n'arrive pas à obtenir les colonnes (seuls les noms des colonnes à l'aide de df.keys()
)
Aucune idée sur comment faire ?
OriginalL'auteur Graham Slick | 2016-11-07
Vous devez vous connecter pour publier un commentaire.
Pandas HDF les besoins de soutien de l'HDF fichier formaté, très précisément. Vous pouvez voir https://stackoverflow.com/a/33644128/4128030 pour plus d'info.
OriginalL'auteur drj