Computer Vision Toolbox™ fornisce algoritmi, funzioni e app per la progettazione e il test di sistemi di visione artificiale, visione 3D e di elaborazione video. È possibile eseguire rilevamento e tracking di oggetti, nonché rilevamento, estrazione e confronto di feature. È possibile automatizzare i workflow di calibrazione per fotocamere singole, stereo e fisheye. Per la visione 3D, il toolbox supporta lo SLAM visivo e con nuvole di punti, la visione stereo, la struttura dal movimento e l'elaborazione di nuvole di punti. Le app di visione artificiale automatizzano i workflow di calibrazione di fotocamere ed etichettatura di verità di base (ground truth).
È possibile addestrare rilevatori di oggetti personalizzati utilizzando algoritmi di Deep Learning e Machine Learning come YOLO v2, SSD e ACF. Per la segmentazione semantica e delle istanze, è possibile utilizzare algoritmi di Deep Learning come U-Net e Mask R-CNN. Il toolbox fornisce algoritmi di segmentazione e rilevamento degli oggetti per analizzare le immagini che sono troppo grandi per essere messe in memoria. I modelli pre-addestrati consentono di rilevare volti, pedoni e altri oggetti comuni.
È possibile velocizzare gli algoritmi eseguendoli su GPU e processori multicore. Gli algoritmi del toolbox supportano la generazione di codice C/C++ per l’integrazione con il codice esistente, la prototipazione desktop e la distribuzione su sistemi di visione embedded.
Inizia ora:
Guarda come gli altri utilizzano Computer Vision Toolbox
Rilevamento e riconoscimento di oggetti
Addestra, valuta e distribuisci rilevatori di oggetti come YOLO v2, Faster R-CNN, ACF e Viola-Jones. Esegui il riconoscimento oggetti con Bag of Visual Words e OCR. Utilizza modelli pre-addestrati per rilevare volti, pedoni e altri oggetti comuni.
Segmentazione semantica
Segmenta le immagini e i volumi 3D classificando i singoli pixel e voxel tramite reti quali SegNet, FCN, U-Net e DeepLab v3+. Utilizza la segmentazione delle istanze per generare mappe di segmentazione e rilevare istanze uniche di oggetti.
Etichettatura di verità di base (ground truth)
Automatizza l’etichettatura per il rilevamento di oggetti, la segmentazione semantica, la segmentazione delle istanze e la classificazione delle scene tramite le app Video Labeler e Image Labeler.
Calibrazione di fotocamere singole
Automatizza il rilevamento della scacchiera e calibra le fotocamere pinhole e fisheye con l’app Camera Calibrator.
Calibrazione di fotocamere stereo
Calibra coppie stereo per calcolare la profondità e ricostruire scene in 3D.
SLAM visivo e odometria visiva
Estrai la struttura a partire dal movimento e dall’odometria visuale.
Visione stereo
Stima la profondità e ricostruisci scene 3D utilizzando coppie di fotocamere stereo.
Elaborazione di nuvole di punti 3D e LIDAR
Segmenta, raggruppa, esegui il downsample, rimuovi il rumore, registra e adatta le forme geometriche con dati di nuvole di punti 3D o LIDAR. Lidar Toolbox™ fornisce ulteriori funzionalità per progettare, analizzare e testare i sistemi di elaborazione LIDAR.
I/O nuvole di punti e LIDAR
Leggi, scrivi e visualizza le nuvole di punti da file, sistemi LIDAR e sensori RGB-D.
Registrazione di nuvole di punti
Registra le nuvole di punti 3D con gli algoritmi Normal-Distributions Transform (NDT), Iterative Closest Point (ICP) e Coherent Point Drift (CPD).
Segmentazione e fitting di forme
Segmenta le nuvole di punti in cluster e adatta le forme geometriche alle nuvole di punti. Segmenta l’impianto di terra in dati LIDAR per applicazioni di guida automatizzata e di robotica.
Rilevamento, estrazione e confronto di feature
Rileva, estrai e confronta feature interessanti quali blob, contorni e angoli su più immagini.
Registrazione di immagini basata sulle feature
Confronta le feature in più immagini per stimare le trasformate geometriche tra immagini e registra le sequenze di immagini.
Tracking di oggetti
Traccia le traiettorie degli oggetti da un frame all’altro nelle sequenze video.
Stima del movimento
Stima il movimento tra frame video con il flusso ottico, il confronto di blocchi e il confronto di modelli.
Generazione di codice
Genera il codice C/C++, codice CUDA e funzioni MEX per funzioni di toolbox, classi, system object e blocchi.