Riconoscimento di regioni
Nella visione artificiale, il Rilevamento Blob (in inglese: Blob detection) o riconoscimento di regioni è una tecnica che ha come obiettivo di rilevare punti e/o regioni in una immagine che differisce in proprietà come luminosità o colore comparata con l'ambiente. Ci sono due classici rilevatori di blob: metodi differenziali basati su espressioni derivative e metodi basati sugli estremi locali nell'intensità del paesaggio. La recente terminologia li definisce come operatori puntuali e operatori regionali.
I rilevatori blob si studiano e sviluppano per fornire informazione complementare sulle regioni, che non è possibile ottenere dai Riconoscimento dei contorni o riconoscimento degli angoli. Nel lavoro di preparazione il rilevamento blob è usato per ottenere regioni di interesse per ulteriori processi di lavoro. Queste regioni possono segnalare la presenza di oggetti o parti di oggetti nel dominio dell'immagine con l'applicazione di riconoscimento di oggetti e/o tracciamento di oggetti. In altri domini, come nell'analisi dell'istogramma, i descrittori blob possono essere usati per il rilevamento di picchi con applicazione nella segmentazione. Un altro uso si trova come primitive principali nell'analisi e riconoscimento di texture.
Blob a livelli di grigio
[modifica | modifica wikitesto]Un approccio naturale per rilevare blob è di associare un blob luminoso (o scuro) con ogni massimo locale nell'intensità del paesaggio. Un problema fondamentale con questo tipo di approccio, sebbene, è che gli estremi locali sono molto sensibili al rumore. Per indirizzare questo problema Lindeberg (1993, 1994) studiò il problema di rilevare i massimi locali con estensioni multiscala nella scala spaziale. Una regione con una estensione spaziale definita da un analogo spartiacque è associato con ogni massimo locale, come un contrasto locale definito dal cosiddetto punto di saddle delimitante. Un locale estremo definito in questa maniera viene chiamato blob a livello di grigio. Un albero di blob a livelli di grigio fu definito per prendere la struttura topologica innestata di insiemi di livello nell'intensità del paesaggio, in una maniera invariante per deformazioni affini nel dominio dell'immagine e per trasformazioni di intensità monotone. Studiando come queste strutture evolvono con l'incremento delle scale, fu introdotta la nozione di blob per scala di spazio.
Laplaciana di una gaussiana
[modifica | modifica wikitesto]Uno dei rilevatori blob più comuni è basato sulla laplaciana del filtro gaussiano Data un'immagine in ingresso , questa immagine è una convoluzione di una convoluta gaussiana.
ad una certa scala per dare una rappresentazione di scala spaziale . Quindi, il risultato di applicare un operatore lapaciano:
è calcolato, che di solito dà risultati fortemente positivi per blob scuri di misura e risposte negative forti per blob luminosi di grandezza simile. Il problema principale quando applichiamo questo operatore ad una singola scala, sebbene, la risposta dell'operatore è dipendente fortemente sulla relazione tra la grandezza delle strutture blob nel dominio dell'immagine e la grandezza del kernel gaussiano usato per il pre-appiattimento (pre-smoothing). Per prendere automaticamente blob di grandezza diversa nel dominio dell'immagine, è quindi necessario un approccio multiscala.
Determinante di Hesse
[modifica | modifica wikitesto]Considerando il determinante normalizzato per la scala di Hessian, anche riferito come operatore Monge–Ampère.
dove denota la Matrice di Hesse di e dopo il rilevamento massimo di scala spaziale di questo operatore che ottiene un altro rilevatore blob differenziale con la selezione di scala automatica che risponde anche ai "saddles" (Lindeberg 1994, 1998)
- .
I punti blob e le scale sono anche definite da definizioni geometriche differenziali operazionali che guidano i descrittori blob che sono covarianti con traslazioni, rotazioni, e riscalature nel dominio dell'immagine. In termini di selezione di scala, i blob definiti dagli estremi della scala spaziale del determinante dell'Hessian (DoH) hanno anche proprietà di selezione di scala migliore sotto le trasformazioni affini non-euclidee che il più comune operazione laplaciano (Lindeberg 1994, 1998). In forma semplificata il determinante normalizzato dis cata dell'Hessian calcolato da delle wavelet Haar è usato come operatore punto di interesse basilare nel descrittore SURF (Bay et al. 2006) per il riconoscimento d'oggetto e l'incrocio di immagini (image matching).
Bibliografia
[modifica | modifica wikitesto]- Christopher Evans, Notes on the OpenSURF library, in Research into Robust Visual Feature Detection. URL consultato il 20 dicembre 2015 (archiviato dall'url originale il 3 novembre 2015).
- H. Bay, T. Tuytelaars and L. van Gool, SURF: Speeded Up Robust Features, in Proceedings of the 9th European Conference on Computer Vision, Springer LNCS volume 3951, part 1, 2006, pp. 404–417.
- L. Bretzner and T. Lindeberg, Feature Tracking with Automatic Selection of Spatial Scales (abstract), in Computer Vision and Image Understanding, vol. 71, n. 3, 1998, pp. 385–392, DOI:10.1006/cviu.1998.0650.
- T. Lindeberg, Detecting Salient Blob-Like Image Structures and Their Scales with a Scale-Space Primal Sketch: A Method for Focus-of-Attention (abstract), in International Journal of Computer Vision, vol. 11, n. 3, 1993, pp. 283–318, DOI:10.1007/BF01469346.
- T. Lindeberg, Scale-Space Theory in Computer Vision, Springer, 1994, ISBN 0-7923-9418-6.
- T. Lindeberg, Feature detection with automatic scale selection (abstract), in International Journal of Computer Vision, vol. 30, n. 2, 1998, pp. 77–116, DOI:10.1023/A:1008045108935.
- T. Lindeberg and J. Garding, Shape-adapted smoothing in estimation of 3-{D} depth cues from affine distortions of local 2-{D} structure, in Image and Vision Computing, vol. 15, 1997, pp. 415–434, DOI:10.1016/S0262-8856(97)01144-X.
- T. Lindeberg, Scale-Space, in Scale-space, Encyclopedia of Computer Science and Engineering (Benjamin Wah, ed), John Wiley and Sons, IV, 2008, pp. 2495–2504, DOI:10.1002/9780470050118.ecse609, ISBN 0-470-05011-X.
- D. G. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, in International Journal of Computer Vision, vol. 60, n. 2, 2004, pp. 91–110, DOI:10.1023/B:VISI.0000029664.99615.94.
- J. Matas, O. Chum, M. Urban and T. Pajdla, Robust wide baseline stereo from maximally stable extremum regions (PDF), in British Machine Vision Conference, 2002, pp. 384–393.
- K. Mikolajczyk, K. and C. Schmid, Scale and affine invariant interest point detectors (PDF), in International Journal of Computer Vision, vol. 60, n. 1, 2004, pp. 63–86, DOI:10.1023/B:VISI.0000027790.02288.f2.