Main Content

Segmentazione dell'istanza

Eseguire la segmentazione dell'istanza utilizzando reti di Deep Learning preaddestrate e addestrare le reti utilizzando il Transfer learning su dati personalizzati

La segmentazione delle istanze è una tecnica di visione artificiale che svolge un ruolo cruciale nelle attività che richiedono una precisa localizzazione degli oggetti e l'identificazione delle singole istanze dell'oggetto come, ad esempio, nell'imaging medico e nella guida autonoma. Combinando i principi del rilevamento dell'oggetto e della segmentazione semantica, la segmentazione dell'istanza fornisce una comprensione maggiormente raffinata dei dati visivi, identificando le singole istanze dell'oggetto e delineandone i confini pixel per pixel. Utilizzare la segmentazione dell'istanza per identificare, classificare e separare con precisione i singoli oggetti all'interno di un'immagine.

È possibile eseguire l'inferenza su un'immagine utilizzando una rete di Deep Learning preaddestrata oppure addestrare una rete utilizzando il Transfer learning. Il Transfer learning è un approccio che consente di partire da una rete preaddestrata e di addestrarla su un set di dati personalizzato per l'applicazione. È possibile generare in modo interattivo i dati di verità per l'addestramento utilizzando l'applicazione Image Labeler, Video Labeler o Ground Truth Labeler (Automated Driving Toolbox) per etichettare i pixel ed esportare i dati delle etichette. La segmentazione dell'istanza richiede Deep Learning Toolbox™. Supporto per l'addestramento e l'inferenza di GPU con capacità CUDA®. L'utilizzo di una GPU è consigliato e richiede Parallel Computing Toolbox™. Per ulteriori informazioni, vedere Parallel Computing Support in MathWorks Products (Parallel Computing Toolbox).

Instance segmentation using SOLOv2: Left — segmented and labeled road scenario using a sample modified RGB image from the CamVid data set, Right — segmented image of PVC pipe connectors

Funzioni

espandi tutto

Configurazione della rete di segmentazione dell'istanza

solov2Segment objects using SOLOv2 instance segmentation network (Da R2023b)
maskrcnnDetect objects using Mask R-CNN instance segmentation (Da R2021b)

Esecuzione dell'inferenza

segmentObjectsSegment objects using Mask R-CNN instance segmentation (Da R2021b)
segmentObjectsSegment objects using SOLOv2 instance segmentation (Da R2023b)

Caricamento dei dati di addestramento

boxLabelDatastoreDatastore for bounding box label data (Da R2019b)
groundTruthGround truth label data
imageDatastoreDatastore for image data
combineCombine data from multiple datastores

Addestramento delle reti di segmentazione dell'istanza

trainSOLOV2Train SOLOv2 network to perform instance segmentation (Da R2023b)
trainMaskRCNNTrain Mask R-CNN network to perform instance segmentation (Da R2022a)

Aumento e pre-elaborazione dei dati di addestramento

poly2maskConvert region of interest (ROI) polygon to region mask
bwboundariesTrace object boundaries in binary image
balanceBoxLabelsBalance bounding box labels for object detection (Da R2020a)
bboxcropCrop bounding boxes (Da R2019b)
bboxeraseRemove bounding boxes (Da R2021a)
bboxresizeResize bounding boxes (Da R2019b)
bboxwarpApply geometric transformation to bounding boxes (Da R2019b)
bbox2pointsConvert rectangle to corner points list
imwarpApply geometric transformation to image
imcropCrop image
imresizeResize image
randomAffine2dCreate randomized 2-D affine transformation (Da R2019b)
centerCropWindow2dCreate rectangular center cropping window (Da R2019b)
randomWindow2dRandomly select rectangular region in image (Da R2021a)
insertObjectMask Insert masks in image or video stream (Da R2020b)
insertObjectAnnotationAnnotate truecolor or grayscale image or video
insertShapeInsert shapes in image or video
showShapeDisplay shapes on image, video, or point cloud (Da R2020b)
evaluateInstanceSegmentationEvaluate instance segmentation data set against ground truth (Da R2022b)
instanceSegmentationMetricsInstance segmentation quality metrics (Da R2022b)
metricsByAreaEvaluate instance segmentation across object mask size ranges (Da R2023b)
posemaskrcnnPredict object pose using Pose Mask R-CNN pose estimation (Da R2024a)
predictPoseEstimate object pose using Pose Mask R-CNN deep learning network (Da R2024a)
trainPoseMaskRCNNTrain Pose Mask R-CNN network to perform pose estimation (Da R2024a)

Argomenti

Come iniziare

Dati di addestramento per la segmentazione dell'istanza