La traduzione di questa pagina non è aggiornata. Fai clic qui per vedere l'ultima versione in inglese.

Rilevamento e riconoscimento del testo

Rilevare e riconoscere il testo utilizzando il rilevamento e la descrizione delle feature dell'immagine, il Deep Learning e l'OCR

Il rilevamento e il riconoscimento del testo nelle immagini è un'attività comune nelle applicazioni di visione artificiale. Ad esempio, è possibile acquisire il video di una scena stradale da un veicolo in movimento, riconoscere i segnali stradali nella scena acquisita e avvisare il conducente della presenza dei segnali.

È possibile combinare il rilevamento e il riconoscimento in un processo a due fasi, in cui la prima fase individua le regioni che contengono testo e la seconda riconosce il testo all'interno delle regioni.

Input image showing an accessible parking sign, connected to a detector, which outputs an image with predicted bounding boxes overlaid on the sign text, connected to a recognizer that outputs a list of the words recognized on the sign.

Gli algoritmi di rilevamento del testo utilizzano le feature locali dell'immagine, il Machine Learning o il Deep Learning per localizzare o segmentare il testo all'interno di un'immagine. Gli esempi contenuti in Computer Vision Toolbox™ dimostrano come utilizzare, ai fini di rilevamento del testo, l'analisi delle macchie, il rilevatore di feature delle regioni estremali stabili massimamente (MSER) e il modello di Deep Learning consapevolezza delle regioni dei caratteri per il rilevamento del testo (CRAFT).

Una volta rilevato il testo, i modelli di riconoscimento del testo, basati su Machine Learning o Deep Learning, elaborano le regioni di testo per restituire il testo previsto. La funzione ocr utilizza modelli linguistici preaddestrati per riconoscere il testo in più lingue. È inoltre possibile addestrare un modello linguistico personalizzato utilizzando la funzione trainOCR. Per ulteriori informazioni, vedere Getting Started with OCR.

App

Image Labeler

Label images for computer vision applications

Funzioni

espandi tutto

Riconoscimento del testo

`ocr`	Recognize text using optical character recognition
`ocrText`	Store OCR results
`visionSupportPackages`	Start Installer to download, install, or uninstall Computer Vision Toolbox data

Addestramento e valutazione

`trainOCR`	Train OCR model to recognize text in image (Da R2023a)
`evaluateOCR`	Evaluate OCR results against ground truth (Da R2023a)
`ocrMetrics`	Store OCR quality metrics (Da R2023a)
`ocrTrainingOptions`	Options for training OCR model (Da R2023a)
`ocrTrainingData`	Create training data for OCR from ground truth (Da R2023a)

Quantizzazione

quantizeOCR Quantize OCR model (Da R2023a)

Rilevamento del testo

`detectTextCRAFT`	Detect texts in images by using CRAFT deep learning model (Da R2022a)
`detectMSERFeatures`	Detect MSER features
`vision.BlobAnalysis`	Properties of connected regions
`extractHOGFeatures`	Extract histogram of oriented gradients (HOG) features

Argomenti

Come iniziare

Getting Started with OCR
Detect and recognize text in multiple languages, train OCR models to recognize custom text.
Train Custom OCR Model
Train an optical character recognition (OCR) model to recognize custom text.
Install OCR Language Data Files
Support files for optical character recognition (OCR) languages.
Local Feature Detection and Extraction
Learn the benefits and applications of local feature detection and extraction.
Point Feature Types
Choose functions that return and accept points objects for several types of features.