Contenuto principale

La traduzione di questa pagina non è aggiornata. Fai clic qui per vedere l'ultima versione in inglese.

Rilevamento e riconoscimento del testo

Rilevare e riconoscere il testo utilizzando il rilevamento e la descrizione delle feature dell'immagine, il Deep Learning e l'OCR

Il rilevamento e il riconoscimento del testo nelle immagini è un'attività comune nelle applicazioni di visione artificiale. Ad esempio, è possibile acquisire il video di una scena stradale da un veicolo in movimento, riconoscere i segnali stradali nella scena acquisita e avvisare il conducente della presenza dei segnali.

È possibile combinare il rilevamento e il riconoscimento in un processo a due fasi, in cui la prima fase individua le regioni che contengono testo e la seconda riconosce il testo all'interno delle regioni.

Input image showing an accessible parking sign, connected to a detector, which outputs an image with predicted bounding boxes overlaid on the sign text, connected to a recognizer that outputs a list of the words recognized on the sign.

Gli algoritmi di rilevamento del testo utilizzano le feature locali dell'immagine, il Machine Learning o il Deep Learning per localizzare o segmentare il testo all'interno di un'immagine. Gli esempi contenuti in Computer Vision Toolbox™ dimostrano come utilizzare, ai fini di rilevamento del testo, l'analisi delle macchie, il rilevatore di feature delle regioni estremali stabili massimamente (MSER) e il modello di Deep Learning consapevolezza delle regioni dei caratteri per il rilevamento del testo (CRAFT).

Una volta rilevato il testo, i modelli di riconoscimento del testo, basati su Machine Learning o Deep Learning, elaborano le regioni di testo per restituire il testo previsto. La funzione ocr utilizza modelli linguistici preaddestrati per riconoscere il testo in più lingue. È inoltre possibile addestrare un modello linguistico personalizzato utilizzando la funzione trainOCR. Per ulteriori informazioni, vedere Getting Started with OCR.

App

Image LabelerLabel images for computer vision applications

Funzioni

espandi tutto

ocrRecognize text using optical character recognition
ocrTextStore OCR results
visionSupportPackagesStart Installer to download, install, or uninstall Computer Vision Toolbox data
trainOCRTrain OCR model to recognize text in image (Da R2023a)
evaluateOCREvaluate OCR results against ground truth (Da R2023a)
ocrMetricsStore OCR quality metrics (Da R2023a)
ocrTrainingOptionsOptions for training OCR model (Da R2023a)
ocrTrainingDataCreate training data for OCR from ground truth (Da R2023a)
quantizeOCRQuantize OCR model (Da R2023a)
detectTextCRAFTDetect texts in images by using CRAFT deep learning model (Da R2022a)
detectMSERFeaturesDetect MSER features
vision.BlobAnalysisProperties of connected regions
extractHOGFeaturesExtract histogram of oriented gradients (HOG) features

Argomenti

Come iniziare

Esempi in primo piano