La sélection des colonnes à partir des pandas.HDFStore table

Comment puis-je récupérer des colonnes spécifiques à partir d'une pandas HDFStore? J'ai l'habitude de travailler avec de très grands ensembles de données qui sont trop gros pour manipuler en mémoire. Je voudrais lire dans un fichier csv de façon itérative, ajoutez chaque morceau en HDFStore objet, et ensuite travailler avec des sous-ensembles de données. J'ai lu dans un simple fichier csv et chargé dans un HDFStore avec le code suivant:

tmp = pd.HDFStore('test.h5')
chunker = pd.read_csv('cars.csv', iterator=True, chunksize=10, names=['make','model','drop'])
tmp.append('df', pd.concat([chunk for chunk in chunker], ignore_index=True))

Et la sortie:

In [97]: tmp
Out[97]:
<class 'pandas.io.pytables.HDFStore'>
File path: test.h5
/df     frame_table (typ->appendable,nrows->1930,indexers->[index])

Ma Question est comment puis-je accéder à des colonnes spécifiques de tmp['df']? La documenation fait mention d'un select() méthode et un peu de Term objets. Les exemples fournis sont appliqués à des données de Panel; cependant, et je suis trop novice pour l'étendre à la plus simple bloc de données de cas. Ma conjecture est que je dois créer un index des colonnes en quelque sorte. Merci!

OriginalL'auteur Zelazny7 | 2012-12-18