The what and where in visual object recognition

Open Access
Authors
Supervisors
Cosupervisors
Award date 07-12-2011
ISBN
  • 9789461820471
Number of pages 126
Organisations
  • Faculty of Science (FNWI) - Informatics Institute (IVI)
Abstract
Sinds kort zijn de technieken om objecten in beelden te herkennen nauwkeurig genoeg om te gebruiken in zoektaken, zoals bijvoorbeeld in Google Image search. Toch blijft het voor computers lastig om objecten te herkennen in een foto. Jasper Uijlings deed onderzoek naar het zogenaamde Bag-of-Words-model en leverde een bijdrage aan de versnelling van het algoritme. Bij het Bag-of-Words- model wordt het beeld opgedeeld in kleine stukjes. Ieder stukje wordt toegekend aan categorieën zoals hoekig, strepig, of egaal blauw. Vervolgens wordt aan het aantal stukjes hoekig en strepig bepaald of er bijvoorbeeld een koe in het plaatje staat. Wat vreemd is aan deze Bag-of-Words-representatie is dat de locatie van een object volledig wordt genegeerd. Uijlings concludeert dat het goed zou zijn om de objectlocatie weer terug te brengen. Daartoe ontwikkelde hij een methode die de objectlocatie op een efficiënte manier kan representeren. Hiermee is het mogelijk om meerdere objecten in een beeld te identificeren, in plaats van alleen individuele beelden.
Document type PhD thesis
Note ASCI dissertation series no. 245 Research conducted at: Universiteit van Amsterdam
Language English
Downloads
Permalink to this page
cover
Back