Rilevamento dell’oggetto
Il rilevamento dell'oggetto è una tecnica di visione artificiale che consente di localizzare istanze di oggetti in immagini o video. Gli algoritmi di rilevamento dell'oggetto sfruttano solitamente il Machine Learning o il Deep Learning per produrre risultati significativi. Quando si guardano immagini o video, gli esseri umani possono riconoscere e localizzare gli oggetti di interesse in pochi istanti. L'obiettivo del rilevamento dell'oggetto è replicare questa intelligenza utilizzando un computer. L'approccio migliore per il rilevamento dell'oggetto dipende dall'applicazione e dal problema che si sta cercando di risolvere.
Le tecniche di Deep Learning richiedono un gran numero di immagini di addestramento etichettate; pertanto, si consiglia l'utilizzo di una GPU per ridurre il tempo necessario all'addestramento di un modello. Gli approcci al rilevamento dell'oggetto basati su Deep Learning utilizzano reti neurali convoluzionali (CNN o ConvNets), come R-CNN e YOLO, oppure il rilevamento a singolo scatto (SSD). È possibile addestrare un rilevatore di oggetti personalizzato o utilizzare un rilevatore di oggetti preaddestrato sfruttando il Transfer learning, un approccio che consente di iniziare con una rete preaddestrata e quindi sincronizzarla per l'applicazione. Le reti neurali convoluzionali richiedono Deep Learning Toolbox™. L'addestramento e la previsione sono supportati da una GPU con capacità CUDA®. L'utilizzo di una GPU è consigliato e richiede Parallel Computing Toolbox™. Per ulteriori informazioni, vedere Preferenze Computer Vision Toolbox e Parallel Computing Support in MathWorks Products (Parallel Computing Toolbox).
Le tecniche di Machine Learning per il rilevamento dell'oggetto comprendono le feature del canale aggregato (ACF), la classificazione con macchine a vettori di supporto (SVM) che utilizzano le feature degli istogrammi del gradiente orientato (HOG) e l'algoritmo di Viola-Jones per il rilevamento del volto umano o della parte superiore del corpo. È possibile scegliere se iniziare con un rilevatore dell'oggetto preaddestrato o se creare un rilevatore dell'oggetto personalizzato per l'applicazione.
App
Image Labeler | Label images for computer vision applications |
Video Labeler | Label video for computer vision applications |
Funzioni
Blocchi
Deep Learning Object Detector | Detect objects using trained deep learning object detector (Da R2021b) |
Argomenti
Come iniziare
- Get Started with Object Detection Using Deep Learning
Perform object detection using deep learning neural networks such as YOLOX, YOLO v4, and SSD. - Choose an Object Detector
Compare object detection deep learning models, such as YOLOX, YOLO v4, RTMDet, and SSD. - Local Feature Detection and Extraction
Learn the benefits and applications of local feature detection and extraction. - Get Started with Cascade Object Detector
Train a custom classifier. - Point Feature Types
Choose functions that return and accept points objects for several types of features. - Getting Started with OCR
Detect and recognize text in multiple languages, train OCR models to recognize custom text. - Image Classification with Bag of Visual Words
Use the Computer Vision Toolbox™ functions for image category classification by creating a bag of visual words. - Sistemi di coordinate
Specificare gli indici dei pixel, le coordinate spaziali e i sistemi di coordinate in 3D
Dati di addestramento per il rilevamento dell'oggetto e la segmentazione dell'istanza
- Get Started with the Image Labeler
Interactively label rectangular ROIs for object detection, pixels for semantic segmentation, polygons for instance segmentation, and scenes for image classification. - Get Started with the Video Labeler
Interactively label rectangular ROIs for object detection, pixels for semantic segmentation, polygons for instance segmentation, and scenes for image classification in a video or image sequence. - Datastores for Deep Learning (Deep Learning Toolbox)
Learn how to use datastores in deep learning applications. - Training Data for Object Detection and Semantic Segmentation
Create training data for object detection or semantic segmentation using the Image Labeler or Video Labeler. - Get Started with Image Preprocessing and Augmentation for Deep Learning
Preprocess data for deep learning applications with deterministic operations such as resizing, or augment training data with randomized operations such as random cropping.
Come iniziare a utilizzare il Deep Learning
- Deep Learning in MATLAB (Deep Learning Toolbox)
Scoprire le capacità del Deep Learning in MATLAB® utilizzando le reti neurali convoluzionali per la classificazione e la regressione, incluse le reti preaddestrate e il transfer learning, nonché l’addestramento su GPU, CPU, cluster e cloud. - Reti neurali profonde preaddestrate (Deep Learning Toolbox)
Apprendere come scaricare e utilizzare le reti neurali convoluzionali preaddestrate per la classificazione, il transfer learning e l’estrazione di feature.