Détection d'objet à l'aide de Keras : moyen simple pour accélérer la R-CNN ou YOLO

Cette question a peut-être été répondu, mais je n'ai pas trouver de réponse simple à cette. J'ai créé un convnet à l'aide de Keras de classer Les personnages de Simpsons (dataset ici).
J'ai 20 classes et en donnant une image comme entrée, je retourne le nom du personnage. C'est assez simple. Mon jeu de données contient des images avec le personnage principal dans l'image et ont seulement le nom du personnage, comme une étiquette.

Maintenant, je voudrais ajouter un objet de détection de demander, je.e tracer un cadre de sélection autour des personnages de la photo et de prédire le personnage qu'il est. Je ne veux pas utiliser une fenêtre coulissante parce que c'est vraiment lent. J'ai donc pensé à utiliser la plus rapide RCNN (dépôt github) ou YOLO (dépôt github). Devrais-je ajouter les coordonnées de la boîte englobante pour chaque photo de ma formation? Est-il un moyen de faire de la détection d'objet (et obtenir les cases dans mon test), sans donner les coordonnées de l'ensemble de la formation?

En somme, je voudrais créer un objet simple de détection de modèle, je ne sais pas si il est possible de créer un simple YOLO ou plus Rapide RCNN.

Merci beaucoup pour toute aide.

OriginalL'auteur A. Attia | 2017-06-21

12

Le but de yolo ou plus rapide rcnn est d'obtenir les boîtes englobantes. Donc, en bref, oui, vous aurez besoin d'étiqueter les données pour le train.

Prendre un raccourci:
- 1) Étiquette d'une poignée de boîtes englobantes (disons, 5 par caractère).
- 2) Former le plus rapidement rcnn ou de yolo sur le très petit jeu de données.
- 3) Exécuter votre modèle par rapport à l'ensemble des données
- 4) Il aura un peu, beaucoup de mal.
- 5) le Train le plus rapide rcnn sur ceux qui sont correctement délimitée, votre
  la formation doit être beaucoup plus grande maintenant.
- 6) répétez jusqu'à ce que vous avez votre résultat souhaité.
OriginalL'auteur Andrew Tu
3

Vous pouvez déjà avoir une bonne architecture, dans l'esprit déjà: "Maintenant, je voudrais ajouter un objet de détection de demander, je.e tracer un cadre de sélection autour des personnages de la photo et de prédire le personnage qu'il est."

Donc, vous venez de diviser la tâche en deux parties:

1. Ajouter un objet de détecteur pour la détection de personne pour retourner les boîtes englobantes

2. Classer les cases à l'aide de la convnet vous déjà formés

Pour la partie 1, vous devriez être bon d'aller en utilisant une fonction de détecteur (par exemple un convnet pré-entraîné de COCO ou Imagenet) avec un détecteur d'objets (encore YOLO et plus Rapide-RCNN) sur le dessus afin de détecter la présence de personnes.
Cependant, vous pouvez trouver que les personnes dans des "dessins animés" (disons que les Simpsons sont des gens) ne sont pas correctement reconnus parce que la fonction de détecteur n'est pas formé sur la bande dessinée basée sur des images, mais sur des images réelles. Dans ce cas, vous pourriez essayer de re-train quelques couches de la fonction détecteur de photos de dessins animés pour apprendre les fonctionnalités de dessin animé, selon le transfert de l'apprentissage méthodologie.

OriginalL'auteur Michelagio

Vous devez vous connecter pour publier un commentaire.