The what and where in visual object recognition

J.R.R. Uijlings

The what and where in visual object recognition

Authors	J.R.R. Uijlings
Supervisors	A.W.M. Smeulders
Cosupervisors	R.J.H. Scha
Award date	07-12-2011
ISBN	9789461820471
Number of pages	126
Organisations	Faculty of Science (FNWI) - Informatics Institute (IVI)
Abstract	Sinds kort zijn de technieken om objecten in beelden te herkennen nauwkeurig genoeg om te gebruiken in zoektaken, zoals bijvoorbeeld in Google Image search. Toch blijft het voor computers lastig om objecten te herkennen in een foto. Jasper Uijlings deed onderzoek naar het zogenaamde Bag-of-Words-model en leverde een bijdrage aan de versnelling van het algoritme. Bij het Bag-of-Words- model wordt het beeld opgedeeld in kleine stukjes. Ieder stukje wordt toegekend aan categorieën zoals hoekig, strepig, of egaal blauw. Vervolgens wordt aan het aantal stukjes hoekig en strepig bepaald of er bijvoorbeeld een koe in het plaatje staat. Wat vreemd is aan deze Bag-of-Words-representatie is dat de locatie van een object volledig wordt genegeerd. Uijlings concludeert dat het goed zou zijn om de objectlocatie weer terug te brengen. Daartoe ontwikkelde hij een methode die de objectlocatie op een efficiënte manier kan representeren. Hiermee is het mogelijk om meerdere objecten in een beeld te identificeren, in plaats van alleen individuele beelden.
Document type	PhD thesis
Note	ASCI dissertation series no. 245 Research conducted at: Universiteit van Amsterdam
Language	English
Downloads	Thesis Cover Title pages Contents 1: Introduction 2: Real-time visual concept classification 3: The visual extent of an object 4: Structured sampling for object recognition 5: The windows that tell the story of an image 6: Conclusion Bibliography Samenvatting Dankwoord
Permalink to this page

Back

UvA-DARE

Digital Academic Repository

The what and where in visual object recognition