Logo de la reconnaissance dans les images
Personne ne sait universitaires récentes travail qui a été fait sur le logo de la reconnaissance dans les images?
Merci de répondre uniquement si vous êtes familier avec ce sujet (je peux faire une recherche Google pour "le logo" moi-même, merci beaucoup).
Quelqu'un qui s'y connaît en la vision par ordinateur et a fait un travail sur la reconnaissance de l'objet est la bienvenue pour commenter ainsi.
Mise à jour:
Veuillez consulter les aspects algorithmiques (ce que l'approche que vous pensez est approprié, les papiers dans le champ, s'il doit travailler(et a été testé) pour les données du monde réel, des motifs d'efficacité) et non pas le côté technique (le langage de programmation utilisé, ou s'il est avec OpenCV...)
Les travaux sur l'indexation d'images et de contenu en fonction de l'image de récupération, vous pouvez également aider.
- Si vous pouviez nous dire ce que vous cherchez et ce que vous entendez par "sérieux", vous pouvez améliorer les chances d'obtenir une bonne réponse. J'ai travaillé dans la vision par ordinateur/objet zone de reconnaissance pour les+ de 10 ans, mais je ne suis même pas sûr de ce que tu veux dire par "logo".
- Par le logo je veux dire par exemple d'obtenir une image contenant le Coca Cola logo/marque de commerce, de détecter le logo et de le marquer comme "Coca Cola". 10 ans de travail dans le domaine du son grave pour moi.(J'étais surtout en essayant d'éviter les réponses telles que celle ci-dessous qui ne sont pas très instructif)
- Avez-vous trouver une alternative pour traiter votre problème ? Parce que le problème est qu'il y a des milliers de logos dans le monde, afin de reconnaître le logo est un peu difficile...j'ai pensé à la Proue de fonctionnalités mais ne nous ont de la classe pour chaque type de logo ?
Vous devez vous connecter pour publier un commentaire.
Vous pouvez essayer d'utiliser les fonctionnalités comme TAMISER ici:
http://en.wikipedia.org/wiki/Scale-invariant_feature_transform
Il doit fonctionner car le logo de forme est généralement constant, donc extrait les caractéristiques correspondent bien.
Le flux de travail sera comme ceci:
Détecter les coins (par exemple, Harris coin détecteur) - pour le logo de Nike, ils sont deux extrémités pointues.
Calculer des descripteurs (comme SIFT - 128D entier vecteur)
Sur la formation des stade de les rappeler; sur la mise en correspondance trouver des voisins les plus proches pour chaque entité dans la base de données obtenues au cours de la formation. Enfin, vous avez une série de matchs (certains d'entre eux sont probablement faux).
De semences de mauvaises correspondances à l'aide de RANSAC. Ainsi vous aurez la matrice qui décrit la transformation de l'idéal de l'image du logo pour un site où vous trouvez le logo. Selon les paramètres, vous pourrez vous permettre de différents types de transformations (juste la traduction, la traduction et la rotation; la transformation affine).
Szeliski livre un chapitre (4.1) sur les particularités locales.
http://research.microsoft.com/en-us/um/people/szeliski/Book/
P. S.
Je suppose que vous voulez trouver des logos, de photos, par exemple trouver tous les panneaux publicitaires de Pepsi, de sorte qu'ils pourraient être faussées. Si vous avez besoin de trouver une chaîne de TÉLÉVISION du logo sur l'écran (de sorte qu'il n'est pas en rotation et mise à l'échelle), vous pourriez le faire plus facile (la correspondance de modèle ou de quelque chose).
Classique EIPD ne considère pas les informations de couleur. Puisque les logos ont généralement des couleurs constantes (même si la couleur exacte dépend de la foudre et de la caméra), vous pourriez envisager de la couleur de l'information en quelque sorte.
Nous avons travaillé sur le logo de détection/reconnaissance dans le monde réel des images. Nous avons également créé un jeu de données FlickrLogos-32 et mis à la disposition du public, y compris les données de réalité de terrain et de l'évaluation des scripts.
Dans notre travail, nous avons traité le logo de la reconnaissance en tant que problème de récupération de simplifier multi-classe de la reconnaissance et de permettre à de tels systèmes pour être facilement adaptable à de nombreux (par exemple, des milliers) logo de classes.
Récemment, nous avons développé un regroupement technique appelée Bundle min-Hachage qui regroupe les configurations spatiales de plusieurs caractéristiques locales en très caractéristique distinctive des bundles. Le bundle de la représentation est utilisable pour les deux d'extraction et de reconnaissance. Voir l'exemple suivant cartes de chaleur pour le logo de détections:
Vous trouverez plus de détails sur les opérations internes, les applications potentielles de l'approche, des expériences sur ses performances et bien sûr aussi de nombreuses références à des travaux connexes dans les documents [1][2].
Travaillé sur: la Marque de correspondance et de récupération dans les sports en vidéo les bases de données
obtenir une version PDF de l'article: http://scholar.google.it/scholar?cluster=9926471658203167449&hl=fr&as_sdt=2000
Nous avons utilisé EIPD à titre de marque de commerce et de l'image de descripteurs, et un seuil normalisé correspondant à calculer la distance entre les modèles et les images. Dans notre dernier travail, nous avons été en mesure de réduire considérablement le calcul à l'aide de méta-modèles, créés à l'évaluation de la pertinence de l'EIPD points qui sont présents dans les différentes versions de la même marque.
Je dirais qu'en général, travailler avec des vidéos est plus difficile que de travailler sur les photos à cause de la très mauvaise qualité visuelle de la TÉLÉVISION normes actuellement utilisées.
Marco
J'ai travaillé sur un projet où nous avons eu à faire quelque chose de très similaire. J'ai d'abord essayé à l'aide de Haar techniques de Formation à l'aide de ce logiciel
OpenCV
Il a travaillé, mais n'était pas une solution optimale pour nos besoins. Notre source d'images (où nous étions à la recherche pour le logo) ont une taille fixe et ne contient que le logo. De ce fait, nous avons été en mesure d'utiliser cvMatchShapes avec un bon match et de comparer la valeur retournée à considérer qu'un bon match.