Prédire les valeurs manquantes avec le module Imputer de scikit-learn
Je suis en train d'écrire un très programme de base pour prédire les valeurs manquantes dans un dataset à l'aide scikit-learn Imputer classe.
J'ai fait un tableau NumPy, a créé un Imputer objet avec la stratégie='moyen' et réalisée fit_transform() sur le tableau NumPy.
Lorsque j'imprime le tableau après l'exécution de fit_transform (), 'Nan restent, et je n'obtiens aucune prédiction.
Ce que je fais mal? Comment puis-je faire au sujet de prédire les valeurs manquantes?
import numpy as np
from sklearn.preprocessing import Imputer
X = np.array([[23.56],[53.45],['NaN'],[44.44],[77.78],['NaN'],[234.44],[11.33],[79.87]])
print X
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit_transform(X)
print X
source d'informationauteur xennygrimmato
Vous devez vous connecter pour publier un commentaire.
Par la documentation
sklearn.preprocessing.Imputer.fit_transform
retourne un nouveau tableauil ne modifie pas le tableau d'arguments. Le minimum à résoudre est donc: