Contenuto principale

La traduzione di questa pagina non è aggiornata. Fai clic qui per vedere l'ultima versione in inglese.

Segmentazione dell'istanza

Eseguire la segmentazione dell'istanza utilizzando reti di Deep Learning preaddestrate e addestrare le reti utilizzando il Transfer learning su dati personalizzati

La segmentazione delle istanze è una tecnica di visione artificiale che svolge un ruolo cruciale nelle attività che richiedono una precisa localizzazione degli oggetti e l'identificazione delle singole istanze dell'oggetto come, ad esempio, nell'imaging medico e nella guida autonoma. Combinando i principi del rilevamento dell'oggetto e della segmentazione semantica, la segmentazione dell'istanza fornisce una comprensione maggiormente raffinata dei dati visivi, identificando le singole istanze dell'oggetto e delineandone i confini pixel per pixel. Utilizzare la segmentazione dell'istanza per identificare, classificare e separare con precisione i singoli oggetti all'interno di un'immagine.

È possibile eseguire l'inferenza su un'immagine utilizzando una rete di Deep Learning preaddestrata oppure addestrare una rete utilizzando il Transfer learning. Il Transfer learning è un approccio che consente di partire da una rete preaddestrata e di addestrarla su un set di dati personalizzato per l'applicazione. È possibile generare in modo interattivo i dati di verità per l'addestramento utilizzando l'applicazione Image Labeler, Video Labeler o Ground Truth Labeler (Automated Driving Toolbox) per etichettare i pixel ed esportare i dati delle etichette. La segmentazione dell'istanza richiede Deep Learning Toolbox™. Supporto per l'addestramento e l'inferenza di GPU con capacità CUDA®. L'utilizzo di una GPU è consigliato e richiede Parallel Computing Toolbox™. Per ulteriori informazioni, vedere Parallel Computing Support in MathWorks Products (Parallel Computing Toolbox).

Instance segmentation using SOLOv2: Left — segmented and labeled road scenario using a sample modified RGB image from the CamVid data set, Right — segmented image of PVC pipe connectors

Funzioni

espandi tutto

Configurazione della rete di segmentazione dell'istanza

solov2Segment objects using SOLOv2 instance segmentation network (Da R2023b)
maskrcnnDetect objects using Mask R-CNN instance segmentation (Da R2021b)

Esecuzione dell'inferenza

segmentObjectsSegment objects using Mask R-CNN instance segmentation (Da R2021b)
segmentObjectsSegment objects using SOLOv2 instance segmentation (Da R2023b)

Caricamento dei dati di addestramento

boxLabelDatastoreDatastore for bounding box label data
groundTruthGround truth label data
imageDatastoreDatastore for image data
combineCombine data from multiple datastores

Addestramento delle reti di segmentazione dell'istanza

trainSOLOV2Train SOLOv2 network to perform instance segmentation (Da R2023b)
trainMaskRCNNTrain Mask R-CNN network to perform instance segmentation (Da R2022a)

Aumento e pre-elaborazione dei dati di addestramento

poly2maskConvert region of interest (ROI) polygon to region mask
bwboundariesTrace object boundaries in binary image
balanceBoxLabelsBalance bounding box labels for object detection
bboxcropCrop bounding boxes
bboxeraseRemove bounding boxes (Da R2021a)
bboxresizeResize bounding boxes
bboxwarpApply geometric transformation to bounding boxes
bbox2pointsConvert rectangle to corner points list
imwarpApply geometric transformation to image
imcropCrop image
imresizeResize image
randomAffine2dCreate randomized 2-D affine transformation
centerCropWindow2dCreate rectangular center cropping window
randomWindow2dRandomly select rectangular region in image (Da R2021a)
insertObjectMask Insert masks in image or video stream
insertObjectAnnotationAnnotate truecolor or grayscale image or video
insertShapeInsert shapes in image or video
showShapeDisplay shapes on image, video, or point cloud
evaluateInstanceSegmentationEvaluate instance segmentation data set against ground truth (Da R2022b)
instanceSegmentationMetricsInstance segmentation quality metrics (Da R2022b)
metricsByAreaEvaluate instance segmentation across object mask size ranges (Da R2023b)
posemaskrcnnPredict object pose using Pose Mask R-CNN pose estimation (Da R2024a)
predictPoseEstimate object pose using Pose Mask R-CNN deep learning network (Da R2024a)
trainPoseMaskRCNNTrain Pose Mask R-CNN network to perform pose estimation (Da R2024a)

Argomenti

Come iniziare

Dati di addestramento per la segmentazione dell'istanza

Esempi in primo piano