Convertir les Pandas dataframe à la faible densité de Numpy Matrice directement
Je suis entrain de créer une matrice à partir d'une Pandas dataframe comme suit:
dense_matrix = np.array(df.as_matrix(columns = None), dtype=bool).astype(np.int)
Puis dans une matrice creuse avec:
sparse_matrix = scipy.sparse.csr_matrix(dense_matrix)
Est-il un moyen d'aller d'un df droit à une matrice creuse?
Merci d'avance.
Vous devez vous connecter pour publier un commentaire.
df.values
est un tableau numpy, et l'accès à des valeurs de cette façon est toujours plus rapide quenp.array
.Vous pourriez avoir besoin de prendre la transposition d'abord, comme
df.values.T
. Dans DataFrames, les colonnes sont de l'axe 0.df.values
ne pas faire une copie.