Contenuto principale

Rilevamento, estrazione e corrispondenza di feature

Rilevare punti di interesse, estrarre descrittori di feature, trovare corrispondenze tra le feature, registrare e recuperare immagini

Le feature locali e i relativi descrittori costituiscono i blocchi costitutivi di molti algoritmi di visione artificiale. Tra le loro applicazioni figurano la registrazione delle immagini, il rilevamento e la classificazione degli oggetti, il tracking, la stima del movimento e il recupero di immagini basato sul contenuto (CBIR). Questi algoritmi utilizzano feature locali per gestire meglio le variazioni di scala, la rotazione e l'occlusione. Gli algoritmi Computer Vision Toolbox™ includono i rilevatori di angoli FAST, Harris e Shi & Tomasi, nonché i rilevatori di blob SIFT, SURF, KAZE e MSER. La toolbox include i descrittori SIFT, SURF, FREAK, BRISK, LBP, ORB e HOG. È possibile combinare i rilevatori e i descrittori in base ai requisiti dell'applicazione.

App

Registration EstimatorRegister 2-D grayscale images

Funzioni

espandi tutto

detectBRISKFeaturesDetect BRISK features
detectFASTFeaturesDetect corners using FAST algorithm
detectHarrisFeaturesDetect corners using Harris–Stephens algorithm
detectKAZEFeaturesDetect KAZE features
detectMinEigenFeaturesDetect corners using minimum eigenvalue algorithm
detectMSERFeaturesDetect MSER features
detectORBFeaturesDetect ORB keypoints
detectSIFTFeaturesDetect scale invariant feature transform (SIFT) features (Da R2021b)
detectSURFFeaturesDetect SURF features
extractFeaturesExtract interest point descriptors
extractLBPFeaturesExtract local binary pattern (LBP) features
extractHOGFeaturesExtract histogram of oriented gradients (HOG) features
matchFeaturesFind matching features
matchFeaturesInRadiusFind matching features within specified radius
estgeotform2dEstimate 2-D geometric transformation from matching point pairs (Da R2022b)
estgeotform3dEstimate 3-D geometric transformation from matching point pairs (Da R2022b)
imwarpApply geometric transformation to image
imblendBlend two images (Da R2024b)
vision.BlockMatcherEstimate motion between images or video frames
vision.TemplateMatcherLocate template in image
insertMarkerInsert markers in image or video
insertShapeInsert shapes in image or video
showMatchedFeaturesDisplay corresponding feature points
showShapeDisplay shapes on image, video, or point cloud
insertObjectAnnotationAnnotate truecolor or grayscale image or video
insertObjectKeypointsInsert object keypoints in image (Da R2023b)
insertTextInsert text in image or video
imshowDisplay image
imshowpairCompare differences between images
vision.ChromaResamplerDownsample or upsample chrominance components of images
binaryFeaturesObject for storing binary feature vectors
BRISKPointsObject for storing BRISK interest points
cornerPointsObject for storing corner points
KAZEPointsObject for storing KAZE interest points
MSERRegionsObject for storing MSER regions
ORBPointsObject for storing ORB keypoints
SIFTPointsObject for storing SIFT interest points (Da R2021b)
SURFPointsObject for storing SURF interest points
rigidtform2d2-D rigid geometric transformation (Da R2022b)
simtform2d2-D similarity geometric transformation (Da R2022b)
affinetform2d2-D affine geometric transformation (Da R2022b)
projtform2d2-D projective geometric transformation (Da R2022b)
rigidtform3d3-D rigid geometric transformation (Da R2022b)
simtform3d3-D similarity geometric transformation (Da R2022b)

Creazione di un database di riconoscimento

bagOfFeaturesBag of visual words object
invertedImageIndexSearch index that maps visual words to images

Recupero delle immagini

retrieveImagesSearch image set for similar image
imageDatastoreDatastore for image data
evaluateImageRetrievalEvaluate image search results

Recupero delle immagini utilizzando la rete CLIP

clipNetworkCreate pretrained CLIP deep learning neural network for vision-language tasks (Da R2026a)
extractImageEmbeddingsExtract feature embeddings from image using CLIP network image encoder (Da R2026a)
extractTextEmbeddingsExtract text embeddings from search text using CLIP network text encoder (Da R2026a)

Argomenti

Esempi in primo piano