Pourquoi la rotation de l'invariant de réseaux de neurones ne sont pas utilisés dans les gagnants de la populaire compétition?

Comme on le sait, moderne le plus populaire de CNN (réseau de neurones à convolution): VGG/l'organisme (FasterRCNN), SSD, Yolo, Yolo v2, DenseBox, DetectNet - ne sont pas faites pivoter invariant: Sont modernes CNN (réseau de neurones à convolution) comme DetectNet tourner invariant?

Également connu, qu'il y a plusieurs réseaux de neurones avec rotation de l'invariance de la détection d'objet:

  1. Rotation De L'Invariant De Neoperceptron 2006 (PDF): https://www.researchgate.net/publication/224649475_Rotation-Invariant_Neoperceptron

  2. L'apprentissage de la rotation de l'invariant de convolution des filtres pour la texture de la classification 2016 (PDF): https://arxiv.org/abs/1604.06720

  3. RIFD-CNN: Rotation-Invariant et Discriminante de Fisher Convolutifs Réseaux de Neurones pour la Détection d'Objet 2016 (PDF): http://www.cv-foundation.org/openaccess/content_cvpr_2016/html/Cheng_RIFD-CNN_Rotation-Invariant_and_CVPR_2016_paper.html

  4. Codé Invariance dans des Réseaux de Neurones à Convolution 2014 (PDF)

  5. Rotation de l'invariant de convolution réseaux de neurones pour la galaxie de la morphologie de prédiction (PDF): https://arxiv.org/abs/1503.07077

  6. Apprentissage de Rotation de l'Invariant de Convolution des Réseaux de Neurones pour la Détection d'Objet en VHR Optique d'Images de Télédétection 2016: http://ieeexplore.ieee.org/document/7560644/

Nous le savons, que dans une telle image, détection de compétitions: IMAGE-NET, MSCOCO, PASCAL VOC - réseau utilisé des ensembles (simultanément certains réseaux neuronaux). Ou réseaux, des ensembles net unique comme l'organisme (Résiduelle des Réseaux se Comportent Comme des Ensembles de Relativement faible des Réseaux)

Mais qui sont utilisées de rotation de l'invariant de réseau, des ensembles gagnants comme MSRA, et si non, alors pourquoi? Pourquoi dans l'ensemble de la rotation-invariant réseau n'ajoute pas de précision pour détecter certains objets tels que les avions d'objets - dont les images se fait à différents angles de rotation?

Il peut être:

  • avion objets qui sont photographiés à partir du sol
    Pourquoi la rotation de l'invariant de réseaux de neurones ne sont pas utilisés dans les gagnants de la populaire compétition?

  • ou les objets au sol qui sont photographiés à partir de l'air
    Pourquoi la rotation de l'invariant de réseaux de neurones ne sont pas utilisés dans les gagnants de la populaire compétition?

Pourquoi la rotation de l'invariant de réseaux de neurones ne sont pas utilisés dans les gagnants de l'objet populaire de détection des compétitions?

  • Dans de nombreuses compétitions les gens à analyser chaque classe et ses éventuelles rotations. Une photo d'un avion dans le ciel peut avoir chaque rotation possible, mais une horizontale de l'image d'un chien de course pas. Et elles génèrent de nouvelles de la formation des images à partir de celles à l'origine avec chaque rotation possible. Peut-être que c'est plus précis qu'une rotation de l'invariant de l'algorithme. Une autre explication possible est qu'il existe très efficace bibliothèques pour exécuter CNNs sur les Gpu (je ne sais pas si il y a efficace des bibliothèques sur les Gpu pour faire pivoter l'invariant de réseaux de neurones).
  • 1. Oui, faire pivoter l'invariant de l'approche peut être utilisée que pour une transformation affine (pour détecter air-objets à partir du sol ou du rez-de-objets de l'air), mais pas pour ellastic transformation (pour détecter les animaux), et pas pour les rotations autour d'un axe de tir extérieur de l'avion. Mais tournez-invariante de CNN peut être utilisée en plus de l'ordinaire convolutifs réseau dans des ensembles. Tournez-invariante de CNN nécessite beaucoup moins d'images d'entrée et des paramètres réglables - et donc d'apprendre plus vite et plus précis (pour la plupart des objets appropriés)
  • 2. à Propos de GPU. 5.La Rotation de l'invariant de convolution réseaux de neurones pour la galaxie de la morphologie de prédiction: 7.9 Implementation ... This allowed the use of GPU acceleration without any additional effort... Networks were trained on NVIDIA GeForce GTX 680 cards. arxiv.org/pdf/1503.07077v1.pdf peut-être Aussi de faire pivoter l'invariant de cv::SURF_GPU d'une certaine façon peut être utilisé à la place de la convolution par un noyau (de la matrice).
  • En fait, la rotation de l'invariant de fonctionnalité est très utile pour la détection d'objets dans les images aériennes. Par exemple, le nouvel algorithme de [RoI Transformateur] (arxiv.org/abs/1812.00155 de DOTA.
InformationsquelleAutor Alex | 2016-12-09