Riconoscimento, rilevamento dell'oggetto e segmentazione semantica
Computer Vision Toolbox™ supporta diversi approcci per la classificazione dell'immagine, il rilevamento dell'oggetto, la segmentazione semantica, la segmentazione dell'istanza e il riconoscimento, tra cui:
Deep Learning e reti neurali convoluzionali (CNN)
Pacchetto di feature
Corrispondenza dei template
Analisi delle macchie
Algoritmo di Viola-Jones
Una CNN è un'architettura di Deep Learning diffusa che apprende automaticamente le rappresentazioni di feature utili direttamente dai dati dell'immagine. Il pacchetto di feature codifica le feature dell'immagine in una rappresentazione compatta adatta alla classificazione e al recupero di immagini. La corrispondenza dei template utilizza un'immagine piccola, o template, per trovare regioni corrispondenti in un'immagine più grande. L'analisi delle macchie utilizza la segmentazione e le proprietà della macchia per identificare gli oggetti di interesse. L'algoritmo di Viola-Jones utilizza feature simili a quelle di Haar e una cascata di classificatori per identificare gli oggetti, compresi volti, nasi e occhi. È possibile addestrare questo classificatore affinché riconosca altri oggetti.
Categorie
- Rilevamento dell’oggetto
Eseguire la classificazione, il rilevamento dell'oggetto, il Transfer learning utilizzando le reti neurali convoluzionali (CNN o ConvNet), creare rilevatori personalizzati
- Segmentazione semantica
Segmentazione semantica dell'immagine
- Segmentazione dell'istanza
Eseguire la segmentazione dell'istanza utilizzando reti di Deep Learning preaddestrate e addestrare le reti utilizzando il Transfer learning su dati personalizzati
- Classificazione della categoria dell'immagine
Creare un classificatore di immagini con trasformatore visivo o con pacchetto di parole visive
- Ispezione visiva automatizzata
Automatizzare le attività di controllo della qualità utilizzando metodi di rilevamento e localizzazione delle anomalie
- Rilevamento e riconoscimento del testo
Rilevare e riconoscere il testo utilizzando il rilevamento e la descrizione delle feature dell'immagine, il Deep Learning e l'OCR
- Rilevamento dei punti chiave
Rilevare i punti chiave negli oggetti utilizzando le reti neurali convoluzionali (CNN)
- Classificazione video
Eseguire la classificazione dei video e il riconoscimento delle attività utilizzando il Deep Learning