La conversion de hdf5 au format csv ou tsv fichiers
Je suis à la recherche d'un exemple de code qui peut convertir .h5 fichiers au format csv ou tsv.
J'ai à lire .h5 et de sortie doit être au format csv ou tsv.
Exemple de code serait très apprécié,s'il vous plaît aider comme je l'ai collé sur elle pour quelques jours.J'ai suivi les classes wrapper, mais ne savent pas comment l'utiliser.Je ne suis pas un bon programmeur donc face à beaucoup de problème.
s'il vous plaît aider
merci beaucoup à l'avance
salut avez-vous la solution ? Je travaille également sur des millions de chanson de dataset.
OriginalL'auteur Sanjay Tiwari | 2014-05-20
Vous devez vous connecter pour publier un commentaire.
Vous pouvez également utiliser
h5dump -o dset.asci -y -w 400 dset.h5
-o dset.asci
spécifie le fichier de sortie-y -w 400
indique la dimension de la taille multipliée par le nombre de postes et les espaces nécessaires pour imprimer chaque valeur. Vous devriez prendre un très grand nombre ici.dset.h5
est bien sûr le hdf5 fichier que vous souhaitez convertirCe convertit en un fichier ascii, ce qui est facile importé dans excel, à partir d'où vous pouvez facilement enregistrer en tant que
.csv
(enregistrer sous dans excel, et de spécifier le format de fichier). J'ai fait une couple de fois, et il a travaillé pour moi. sourceEst le
-y -w 400
valeur assez élevée? Il semble comme un assez énorme base de données, et le nombre peut être trop faible. Si c'est juste un simple tableau comme vous le voyez dans excel, il devrait fonctionner. Quel est le problème avec la sortie dans excel? J'ai remarqué qu'il y a plusieurs options dans Excel lors de l'importation .asques fichier, peut-être quelque chose là-bas, les dégâts de tousOui j'ai utilisé -y-w 800 et j'ai été le tester sur 377kb fichier avant de l'utiliser sur l'ensemble du jeu de données.L'entrée est dans .h5 format comme vous le savez, et je suppose que c'est sous forme de tableau.Il dispose de 52 champs.J'ai des données de l'échantillon de 20 dossiers et en comparant avec la sortie de fichier ascii,il est complètement différent(En termes de format et pas dans les données).Je suis juste l'ouverture de fichier ascii avec Excel.
OriginalL'auteur Mathias711
Exemple de HDF5 CSV conversion peut être trouvé à
https://github.com/amgreenstreet/Million-Song-Dataset-HDF5-to-CSV
Il utilise Python et la convertit en Millions de Chansons Dataset à partir d'HDF5 au format CSV.
Je recommande fortement d'utiliser Python(x,y) de la version
http://python-xy.github.io/
parce que cet exemple utilise des paquets Python comme NumPy et PyTables.
Python(x,y) a ces paquets inclus.
pip install numpy pytables
. Et Python(x,y) ont été laissés à l'abandon depuis 2015OriginalL'auteur SmallerThan
Python:
Quelques remarques:
"out.csv"
.'\t'
au lieu de','
.dataname
).Pouvez-vous juste essayer de dire
np.savetxt
dans le REPL? docs.scipy.org/doc/numpy/reference/generated/numpy.savetxt.html dit que cette fonction existe en 1.8, et il a certainement existé en 1.7. Quelque chose doit être très mal avec votre installation ou que vous avez tapé dans le mauvais.Salut Jean, je suis passé par le lien que vous avez fourni.Sry pour dire que je ne suis pas familier avec REPL langue.Je ne suis pas à obtenir ce que pourrait être la raison. Mon Code est: import numpy n import h5py fichier='C:\Users\user10\Desktop\foo' n.savetxt('example_output.csv', fichier, delimiter=',')
Le REPL est le Python interactif interprète. Lancez simplement "python" dans votre terminal, puis dire "import numpy" puis "numpy.savetxt". Que faut-il vous le dire? La fonction existe?
Il est dit "Traceback (most recent call last): File "<pyshell#46>", line 1, in <module> numpy.savetxt AttributeError: 'module' objet n'a pas d'attribut "savetxt' " je pense que le problème est avec le Paquet.Pouvez-vous me suggérer un lien où télécharger.
OriginalL'auteur John Zwinck