Créer un jeu à partir d'une série de pandas
J'ai un dataframe extrait de Kaggle de San Fransico Salaires: https://www.kaggle.com/kaggle/sf-salaries
et je souhaite créer un ensemble de valeurs d'une colonne, par exemple "Statut".
C'est ce que j'ai essayé, mais il apporte une liste de tous les enregistrements au lieu de l'ensemble (sf est la façon dont j'ai le nom de la trame de données).
a=set(sf['Status'])
print a
Selon cette page web, cela devrait fonctionner.
Comment construire un ensemble d'éléments de la liste en python?
Pourquoi avez-vous tsay
peut-être que j'ai utilisé le terme à tort, j'reportez-vous qu'il me donne toutes les valeurs de la colonne sans s'occuper si c'est de la pure nans par exemple
a
une liste?peut-être que j'ai utilisé le terme à tort, j'reportez-vous qu'il me donne toutes les valeurs de la colonne sans s'occuper si c'est de la pure nans par exemple
OriginalL'auteur Julio Arriaga | 2016-09-17
Vous devez vous connecter pour publier un commentaire.
Si vous avez seulement besoin d'obtenir la liste des valeurs uniques, vous pouvez simplement utiliser
unique
méthode.Si vous voulez avoir Python ensemble, puis faire
set(some_series)
Toutefois, si vous avez DataFrame, il suffit de sélectionner la série (
some_data_frame['<col_name>']
).OriginalL'auteur grechut
De grande taille avec
series
avec les doubles de laset(some_series)
des temps d'exécution va évoluer de façon exponentielle avecseries
taille.Meilleure pratique serait de
set(some_series.unique())
.Un simple exemple montrant x16 temps d'exécution.
OriginalL'auteur Adrien Pacifico