La traduzione di questa pagina non è aggiornata. Fai clic qui per vedere l'ultima versione in inglese.

Riconoscimento, rilevamento dell'oggetto e segmentazione semantica

Riconoscimento, classificazione, segmentazione semantica dell'immagine, segmentazione dell'istanza, rilevamento dell'oggetto tramite feature e rilevamento di oggetti di Deep Learning tramite CNN, YOLO e SSD

Computer Vision Toolbox™ supporta diversi approcci per la classificazione dell'immagine, il rilevamento dell'oggetto, la segmentazione semantica, la segmentazione dell'istanza e il riconoscimento, tra cui:

Deep Learning e reti neurali convoluzionali (CNN)
Pacchetto di feature
Corrispondenza dei template
Analisi delle macchie
Algoritmo di Viola-Jones

Una CNN è un'architettura di Deep Learning diffusa che apprende automaticamente le rappresentazioni di feature utili direttamente dai dati dell'immagine. Il pacchetto di feature codifica le feature dell'immagine in una rappresentazione compatta adatta alla classificazione e al recupero di immagini. La corrispondenza dei template utilizza un'immagine piccola, o template, per trovare regioni corrispondenti in un'immagine più grande. L'analisi delle macchie utilizza la segmentazione e le proprietà della macchia per identificare gli oggetti di interesse. L'algoritmo di Viola-Jones utilizza feature simili a quelle di Haar e una cascata di classificatori per identificare gli oggetti, compresi volti, nasi e occhi. È possibile addestrare questo classificatore affinché riconosca altri oggetti.

Argomenti in evidenza

Categorie

Rilevamento dell’oggetto
Eseguire la classificazione, il rilevamento dell'oggetto, il Transfer learning utilizzando le reti neurali convoluzionali (CNN o ConvNet), creare rilevatori personalizzati
Segmentazione semantica
Segmentazione semantica dell'immagine
Segmentazione dell'istanza
Eseguire la segmentazione dell'istanza utilizzando reti di Deep Learning preaddestrate e addestrare le reti utilizzando il Transfer learning su dati personalizzati
Classificazione della categoria dell'immagine
Creare un classificatore di immagini con trasformatore visivo o con pacchetto di parole visive
Ispezione visiva automatizzata
Automatizzare le attività di controllo della qualità utilizzando metodi di rilevamento e localizzazione delle anomalie
Rilevamento e riconoscimento del testo
Rilevare e riconoscere il testo utilizzando il rilevamento e la descrizione delle feature dell'immagine, il Deep Learning e l'OCR
Rilevamento dei punti chiave
Rilevare i punti chiave negli oggetti utilizzando le reti neurali convoluzionali (CNN)
Classificazione video
Eseguire la classificazione dei video e il riconoscimento delle attività utilizzando il Deep Learning