The UvA-LINKER will give you a range of other options to find the full text of a publication (including a direct link to the full-text if it is located on another database on the internet).
De UvA-LINKER biedt mogelijkheden om een publicatie elders te vinden (inclusief een directe link naar de publicatie online als deze beschikbaar is in een database op het internet).

Search results

Record: oai:ARNO:340830

AuthorA. Noulas
TitleAudiovisual fusion for speaker diarization
PromotorF.C.A. Groen
Co-promotorB.J.A. Kröse
Date19-05-2010
Year2010
Pagesvii, 167
ISBN90-75691-06-8
FacultyFaculty of Science
Institute/dept.FNWI: Informatics Institute (II)
KeywordsDeep Belief Networks; Dynamic Bayesian Networks; audiovisual fusion; speaker diarization
AbstractSpraaksynthese en spraakherkenning zijn goed genoeg voor alledaagse applicaties. Toch is een scenario waarbij we een natuurlijke discussie met een machine aangaan nog steeds futuristisch. Dit komt doordat computers niet kunnen bepalen wie wanneer spreekt, en wie aangesproken wordt. Athanasios Noulas onderzocht hoe we machines dergelijke capaciteiten, die in de literatuur bekend staan als speaker diarization, kunnen geven. Hij ontwikkelde daarvoor een probabilistisch model dat computers in staat stelt om informatie uit camera's en microfoons, en vooral uit de synchronie tussen de twee, te combineren. Dit model kan speaker diarization toepassen op een breed scala aan opnames, van vergaderzalen tot films, en kan gebruikt worden om een hoogwaardige transcriptie te maken, waarbij een associatie wordt gemaakt tussen een gezicht en de bijhorende stem, en tussen verschillende opnames van dezelfde persoon. Daarnaast bedacht Noulas een model dat automatisch leert hoe het gezicht en de stem van een persoon in synchronie zijn tijdens het spreken. Het model leert dit uit video-opnames van personen die de camera toespreken. Met dit model kan een machine bepalen wie in een discussie aan het spreken is, en of er überhaupt iemand aan het spreken is.
LanguageEnglish
NoteASCI dissertation series no. 197
Document typeDissertation
Download
Document finderUvA-Linker