Où est-il préférable d'utiliser svm avec un noyau linéaire?
Je suis actuellement à l'étude svm et je me demandais ce que l'application des svm avec noyau linéaire. À mon avis, il doit être quelque chose qui s'applique à la résolution d'un problème d'optimisation linéaire. Est-ce correct?
Je vous remercie de votre réponse!
source d'informationauteur Anna.Klee
Vous devez vous connecter pour publier un commentaire.
Plus qu'une chose à ajouter: SVM linéaire est moins enclin à le surajustement que les non-linéaire. Et vous devez décider de noyau à choisir en fonction de votre situation: si votre nombre de fonctionnalités est vraiment grand par rapport à la formation de l'échantillon, il suffit d'utiliser linéaire du noyau; si le nombre de fonctionnalités est petite, mais la formation de l'échantillon est grande, vous pouvez aussi avoir besoin linéaire du noyau, mais essayez d'ajouter plus de fonctionnalités; si votre fonction d'un nombre limité d'(10^0 - 10^3), et le numéro de l'échantillon est intermédiaire (10^1 - 10^4), utilisation noyau Gaussien sera mieux.
Autant que je sache, SVM avec noyau linéaire est généralement comparable à la régression logistique .
Linéaire du noyau a des avantages, mais probablement (à mon avis) le plus important est le fait que, généralement, est plus rapide de train en comparaison avec les non-linéaire des noyaux tels que le RBF.
Si la taille du jeu de données est en gigaoctets, vous verriez que la formation de la différence de temps est immense (en quelques minutes contre heures).
Linéaire noyaux sont les meilleurs pour les appliquer sur linéairement séparable de données. Imaginez votre jeu de données a seulement 2 fonctions, et 2 classes. Si vous tracez votre jeu de données d'échantillons dans un graphique en utilisant les 2 fonctions X et Y, vous serez en mesure de voir comment les échantillons provenant de différentes classes position par rapport à l'autre.
Si c'est facile de tracer une ligne qui sépare les deux classes, puis un linéaire du noyau est idéal pour le travail:
Bien sûr, cela fonctionne avec de nombreuses fonctionnalités, non seulement deux, le rendu multi-dimensionnelle des espaces. Toutefois, si vos données ne sont pas linéairement séparables, vous aurez besoin de votre carte d'échantillons dans une autre dimensions de l'espace, à l'aide de noyaux comme RBF, ou polynomiale.
Aussi, depuis le linéaire du noyau n'effectue pas de cartographie, il est généralement plus rapide à former votre classificateur qu'avec d'autres noyaux.
L'application d'une machine à vecteurs de support avec un noyau linéaire est d'effectuer une classification ou de régression. Il va effectuer meilleure quand il y a un linéaire de la décision de la frontière ou d'un ajustement linéaire des données, ainsi le linéaire du noyau.
SVM avec noyau linéaire est en effet l'un des plus simple des classificateurs, mais il ne sera pas surprenant si nous obtenons de très haute performance, la précision lors de la distribution des données sont linéairement séparables.
En ce sens, je pense que votre opinion est correcte. Cependant, vous avez besoin de vous rendre compte de la puissance de SVM se trouve dans l'extension avec beaucoup plus complexe et non-linéaire des noyaux (par exemple RBF).
Un lien sur le choix de classificateurs.