Prédire les valeurs manquantes avec le module Imputer de scikit-learn

Je suis en train d'écrire un très programme de base pour prédire les valeurs manquantes dans un dataset à l'aide scikit-learn Imputer classe.

J'ai fait un tableau NumPy, a créé un Imputer objet avec la stratégie='moyen' et réalisée fit_transform() sur le tableau NumPy.

Lorsque j'imprime le tableau après l'exécution de fit_transform (), 'Nan restent, et je n'obtiens aucune prédiction.

Ce que je fais mal? Comment puis-je faire au sujet de prédire les valeurs manquantes?

import numpy as np
from sklearn.preprocessing import Imputer

X = np.array([[23.56],[53.45],['NaN'],[44.44],[77.78],['NaN'],[234.44],[11.33],[79.87]])

print X

imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit_transform(X)

print X

source d'informationauteur xennygrimmato

17

Par la documentationsklearn.preprocessing.Imputer.fit_transform retourne un nouveau tableauil ne modifie pas le tableau d'arguments. Le minimum à résoudre est donc:
```
X = imp.fit_transform(X)
```

Vous devez vous connecter pour publier un commentaire.