Comment traverser valider RandomForest modèle?
Je veux évaluer une forêt aléatoire en cours de formation sur certaines données. Est-il un utilitaire dans Apache Spark à faire de même ou dois-je effectuer la validation croisée manuellement?
Vous devez vous connecter pour publier un commentaire.
ML fournit
CrossValidator
classe qui peut être utilisé pour effectuer la validation croisée et les paramètres de recherche. En supposant que vos données sont déjà prétraitées vous pouvez ajouter la validation croisée comme suit:À L'Aide De PySpark:
MLUtils.kFold
est à l'aide deBernoulliCellSampler
pour déterminer split. D'autre part, le coût de l'exécution de leave-one-out cross-validation de l'Étincelle est probablement élevée de toute façon à le rendre réalisable dans la pratique.De construire sur zero323 de la grande réponse à l'aide de Random Forest Classificateur, voici un exemple similaire pour une Forêt Aléatoire Régresseur:
Évaluateur de tonnes source:
https://spark.apache.org/docs/latest/api/scala/#org.apache.spark.ml.evaluation.RegressionEvaluator