La Faiblesse De La Classificateur
Je suis en train de mettre en œuvre une application qui utilise l'algorithme AdaBoost. Je sais que AdaBoost utilise l'ensemble de la faiblesse des classificateurs, mais je ne sais pas ce que ces faibles classificateurs sont. Pouvez-vous me l'expliquer avec un exemple et dites-moi si je dois créer mon propre faiblesse des classificateurs ou je suis suppoused d'utiliser une sorte d'algorithme?
OriginalL'auteur AjMeen | 2012-08-23
Vous devez vous connecter pour publier un commentaire.
Lorsque j'ai utilisé AdaBoost, mon faible classificateurs ont été essentiellement des seuils pour chaque attribut de données. Ces seuils doivent avoir un rendement de plus de 50%, si non il serait totalement aléatoire.
Ici est une bonne présentation sur Adaboost et la façon de calculer ces faibles classificateurs:
http://www.cse.cuhk.edu.hk/~lyu/seminar/07spring/Hongbo.ppt
Trouvé le lien ici: user.ceng.metu.edu.tr/~tcan/ceng734_f1112/Calendrier/adaboost.pdf
OriginalL'auteur marc_ferna
La faiblesse des classificateurs (ou de la faiblesse des apprenants) sont des classificateurs qui effectuent seulement légèrement mieux que de façon aléatoire un classificateur. Ce sont donc les classificateurs qui ont une certaine idée sur la façon de prédire le droit d'étiquettes, mais pas autant que la forte classificateurs ont comme, par exemple, Naive Bayes, Neurel des Réseaux ou des SVM.
L'un des plus simples faiblesse des classificateurs est le Décision De La Souche, qui est un niveau de l'Arbre de Décision. Il choisit un seuil pour une fonctionnalité et partage les données sur le seuil. AdaBoost formeront ensuite une armée de ces Souches qui chacun se concentre sur une partie des caractéristiques des données.
Depuis une décision de la souche est par définition un seul niveau, vous ne pouvez pas utiliser les deux la décision de souches l'un après l'autre. La meilleure façon de résoudre votre problème de l'OMI serait de créer un 2d décision de la souche sur la base de ces deux caractéristiques distinctes. De cette façon vous serez en prenant les deux fonctions en compte dans le (seul) décision de la souche: Permet de dire
x=size
,y=weight
, puis votre moignon serait (par exemple) un seuil de sa 2d-longueur euclidienne:if sqrt(x^2 + y^2) > 6 then return +1 else return -1
. J'ai choisi la condition> 6
au hasard, juste pour montrer le point.Quand j'ai dit que vous ne pouvez pas utiliser plus d'une décision de souche, je voulais dire "..en une seule itération". Vous devez former une seule décision de la souche sur chaque itération en adaboost.
OriginalL'auteur Sicco