Python + OpenCV: ROC de la Segmentation d'Images

Je suis en train de faire de l'OCR à partir de ce jouet exemple de Recettes. À l'aide de Python 2.7 et OpenCV 3.1.

En niveaux de gris + Flou + Bord Externe de Détection + Segmentation de chaque secteur dans les Recettes (par exemple "Catégorie" à voir plus tard ce qui est marqué dans le cas présent de trésorerie).

Je trouve compliqué lorsque l'image est "biaisée" pour être en mesure de transformer et puis "automatiquement" segment de chaque segment de recettes.

Exemple:

Python + OpenCV: ROC de la Segmentation d'Images

Toute suggestion?

Le code ci-dessous est un exemple pour se rendre jusqu'à la détection de bord, mais lors de la réception, c'est comme la première image. Mon problème n'est pas l'Image au texte. Est le pré-traitement de l'image.

Toute aide plus apprécié! 🙂

import os;
os.chdir() # Put your own directory

import cv2 
import numpy as np

image = cv2.imread("Rent-Receipt.jpg", cv2.IMREAD_GRAYSCALE)

blurred = cv2.GaussianBlur(image, (5, 5), 0)

#blurred  = cv2.bilateralFilter(gray,9,75,75)

# apply Canny Edge Detection
edged = cv2.Canny(blurred, 0, 20)

#Find external contour

(_,contours, _) = cv2.findContours(edged, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)

InformationsquelleAutor donpresente | 2016-11-05

17

Un tutoriel sur la première étape que vous avez décrit est disponible à pyimagesearch (et ils ont beaucoup de tutoriels en général)

En bref, comme décrit par Ella, vous devez utiliser cv2.CHAIN_APPROX_SIMPLE. Un peu plus robuste que la méthode serait d'utiliser cv2.RETR_LIST au lieu de cv2.RETR_EXTERNAL et puis trier les domaines, comme il se doit décemment de travail, même dans un fond blanc/si la page inscrit une plus grande forme à l'arrière-plan, etc.

Venir à la deuxième partie de votre question, un bon moyen de segmenter les caractères serait d'utiliser le au Maximum stable extrémal région extracteur disponible dans OpenCV. Une mise en œuvre complète en RPC ici dans un projet que j'avais en aidant à récemment. Le Python de la mise en œuvre permettrait d'aller le long de la lignes de Code ci-dessous fonctionne pour OpenCV 3.0+. Pour le OpenCV 2.x la syntaxe, consultez en ligne)
```
import cv2

img = cv2.imread('test.jpg')
mser = cv2.MSER_create()

#Resize the image so that MSER can work better
img = cv2.resize(img, (img.shape[1]*2, img.shape[0]*2))

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
vis = img.copy()

regions = mser.detectRegions(gray)
hulls = [cv2.convexHull(p.reshape(-1, 1, 2)) for p in regions[0]]
cv2.polylines(vis, hulls, 1, (0,255,0)) 

cv2.namedWindow('img', 0)
cv2.imshow('img', vis)
while(cv2.waitKey()!=ord('q')):
    continue
cv2.destroyAllWindows()
```
Cela donne le résultat sous la forme

Maintenant, pour éliminer les faux positifs, vous pouvez simplement faire défiler les points de coques, et calculer le périmètre (somme de la distance entre tous les points adjacents dans des enveloppes[i], où les coques[i] est une liste de tous les points dans un convexHull). Si le périmètre est trop grand, le classer comme pas un personnage.

La diagnol à travers les lignes de l'image sont à venir, car la frontière de l'image est en noir. cela peut être tout simplement supprimé par l'ajout de la ligne suivante dès que l'image est en lecture (en dessous de la ligne 7)
```
img = img[5:-5,5:-5,:]
```
qui donne à la sortie
- Merci @R. S. Nikhil Krishna !! Si j'utilise le code de l'image (pas de travers) de la réception (voir ci-dessus dans la question). Je ne suis pas d'obtenir une bonne segmentation. Question. quels paramètres dois-je tune? L'enveloppe convexe? Merci à l'avance!
- J'ai apporté les modifications. La raison pour laquelle il n'était pas détecter les personnages est parce que la taille de l'image était trop petite. MSER nécessite d'importantes espacement entre les caractères. Qui peut être atteint simplement en redimensionnant les images
- Nikhil Krishna. Je pense que nous avons un gagnant! 🙂 tout autre avis sur la segmentation? Parce qu'un "fait main" modèle pourrait nécessiter de divde chaque personnage individuellement à droite? Dois-je la force d'une grille sur le texte?
- Par une main de modèle, entendez-vous régler manuellement les paramètres? Et une grille peut être légèrement problématique parce que les personnages ne sont pas de taille égale.
InformationsquelleAutor R. S. Nikhil Krishna
6

L'option sur le haut de ma tête nécessite l'extraction des 4 coins de l'image inclinée. Ceci est fait en utilisant cv2.CHAIN_APPROX_SIMPLE au lieu de cv2.CHAIN_APPROX_NONE lors de la recherche de contours. Par la suite, vous pouvez utiliser cv2.approxPolyDP et j'espère rester avec les 4 coins de la réception (Si toutes vos images sont comme celui-ci alors il n'ya aucune raison pourquoi il ne devrait pas travailler).

Maintenant utiliser cv2.findHomography et cv2.wardPerspective de rectifier l'image en fonction de la source des points qui sont les 4 points extraites de l'image inclinée et les points de destination qui doit avoir la forme d'un rectangle, par exemple la pleine dimension de l'image.

Vous trouverez ici des exemples de code et plus d'informations:
OpenCV-Transformations Géométriques des Images

Aussi cette réponse peut être utile - AFIN de Détecter et de corriger le texte d'inclinaison

EDIT: Corrigé de la deuxième chaîne env à cv2.CHAIN_APPROX_NONE.
- merci! et puis, comment pouvez-vous partager le texte dans la rectification de l'image? (c'est la partie de la question)
- Vous avez écrit "Mon problème n'est pas l'Image au texte. Est le pré-traitement de l'image." De toute façon, je ne suis pas capable de contribuer beaucoup dans le ROC de la partie.
- pré-traitement pour moi serait d'inclure la segmentation d'images. Je pense que le système va envoyer les 50 points si pas de réponse supplémentaire. Question, si vous n'avez pas de contour, comment votre solution fonctionne?
- Pré-traitement n'incluent généralement pas de la segmentation d'images. Dans ce cas précis, la segmentation d'images est la principale étape de traitement. Grande réponse @Elia!
InformationsquelleAutor Elia

Prétraitement de l'image en convertissant le texte souhaité dans l'avant-plan à noir en tournant de fond indésirable à blanc peut aider à améliorer la précision de l'OCR. En outre, en supprimant les lignes horizontales et verticales peuvent améliorer les résultats. Voici l'image prétraitée après la suppression des bruits indésirables tels que les lignes horizontales et verticales. Remarque la disparition de la frontière et de la table de lignes de

Python + OpenCV: ROC de la Segmentation d'Images

import cv2
# Load in image, convert to grayscale, and threshold
image = cv2.imread('1.jpg')
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
# Find and remove horizontal lines
horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (35,2))
detect_horizontal = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel, iterations=2)
cnts = cv2.findContours(detect_horizontal, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
for c in cnts:
cv2.drawContours(thresh, [c], -1, (0,0,0), 3)
# Find and remove vertical lines
vertical_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (1,35))
detect_vertical = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, vertical_kernel, iterations=2)
cnts = cv2.findContours(detect_vertical, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
for c in cnts:
cv2.drawContours(thresh, [c], -1, (0,0,0), 3)
# Mask out unwanted areas for result
result = cv2.bitwise_and(image,image,mask=thresh)
result[thresh==0] = (255,255,255)
cv2.imshow('thresh', thresh)
cv2.imshow('result', result)
cv2.waitKey()

InformationsquelleAutor nathancy

Vous devez vous connecter pour publier un commentaire.