Détection d'objet à l'aide de Keras : moyen simple pour accélérer la R-CNN ou YOLO
Cette question a peut-être été répondu, mais je n'ai pas trouver de réponse simple à cette. J'ai créé un convnet à l'aide de Keras de classer Les personnages de Simpsons (dataset ici).
J'ai 20 classes et en donnant une image comme entrée, je retourne le nom du personnage. C'est assez simple. Mon jeu de données contient des images avec le personnage principal dans l'image et ont seulement le nom du personnage, comme une étiquette.
Maintenant, je voudrais ajouter un objet de détection de demander, je.e tracer un cadre de sélection autour des personnages de la photo et de prédire le personnage qu'il est. Je ne veux pas utiliser une fenêtre coulissante parce que c'est vraiment lent. J'ai donc pensé à utiliser la plus rapide RCNN (dépôt github) ou YOLO (dépôt github). Devrais-je ajouter les coordonnées de la boîte englobante pour chaque photo de ma formation? Est-il un moyen de faire de la détection d'objet (et obtenir les cases dans mon test), sans donner les coordonnées de l'ensemble de la formation?
En somme, je voudrais créer un objet simple de détection de modèle, je ne sais pas si il est possible de créer un simple YOLO ou plus Rapide RCNN.
Merci beaucoup pour toute aide.
OriginalL'auteur A. Attia | 2017-06-21
Vous devez vous connecter pour publier un commentaire.
Le but de yolo ou plus rapide rcnn est d'obtenir les boîtes englobantes. Donc, en bref, oui, vous aurez besoin d'étiqueter les données pour le train.
Prendre un raccourci:
la formation doit être beaucoup plus grande maintenant.
OriginalL'auteur Andrew Tu
Vous pouvez déjà avoir une bonne architecture, dans l'esprit déjà: "Maintenant, je voudrais ajouter un objet de détection de demander, je.e tracer un cadre de sélection autour des personnages de la photo et de prédire le personnage qu'il est."
Donc, vous venez de diviser la tâche en deux parties:
1. Ajouter un objet de détecteur pour la détection de personne pour retourner les boîtes englobantes
2. Classer les cases à l'aide de la convnet vous déjà formés
Pour la partie 1, vous devriez être bon d'aller en utilisant une fonction de détecteur (par exemple un convnet pré-entraîné de COCO ou Imagenet) avec un détecteur d'objets (encore YOLO et plus Rapide-RCNN) sur le dessus afin de détecter la présence de personnes.
Cependant, vous pouvez trouver que les personnes dans des "dessins animés" (disons que les Simpsons sont des gens) ne sont pas correctement reconnus parce que la fonction de détecteur n'est pas formé sur la bande dessinée basée sur des images, mais sur des images réelles. Dans ce cas, vous pourriez essayer de re-train quelques couches de la fonction détecteur de photos de dessins animés pour apprendre les fonctionnalités de dessin animé, selon le transfert de l'apprentissage méthodologie.
OriginalL'auteur Michelagio