Comment calculer le taux d'erreur à partir d'un arbre de décision?
Personne ne sait comment calculer le taux d'erreur pour un arbre de décision avec R?
Je suis l'aide de la rpart()
fonction.
Vous devez vous connecter pour publier un commentaire.
Personne ne sait comment calculer le taux d'erreur pour un arbre de décision avec R?
Je suis l'aide de la rpart()
fonction.
Vous devez vous connecter pour publier un commentaire.
En supposant que vous entendez le calcul du taux d'erreur sur l'échantillon utilisé pour l'ajustement du modèle, vous pouvez utiliser
printcp()
. Par exemple, à l'aide de l'exemple,La
Root node error
est utilisé pour calculer les deux mesures de la performance prédictive, lorsque l'on considère les valeurs affichées dans larel error
etxerror
colonne, et en fonction de la complexité de paramètre (première colonne):0.76471 x 0.20988 = 0.1604973 (16.0%) est le resubstitution taux d'erreur (c'est à dire, le taux d'erreur calculé sur la formation de l'échantillon) -- c'est à peu près
0.82353 x 0.20988 = 0.1728425 (17.2%) est le validation croisée de taux d'erreur (à l'aide de 10 fois le CV, voir
xval
dansrpart.control()
; mais voir aussixpred.rpart()
etplotcp()
qui s'appuie sur ce type de mesure). Cette mesure est un indicateur plus objectif de l'exactitude de prévision.Remarque qu'il est plus ou moins en accord avec exactitude de la classification de
tree
:où
Misclassification error rate
est calculé à partir de la formation de l'échantillon.