Decomposing and regenerating syntactic trees

Authors
Supervisors
Cosupervisors
Award date 12-01-2012
ISBN
  • 9789057762345
Number of pages 187
Publisher Amsterdam: Institute for Logic, Language and Computation
Organisations
  • Faculty of Humanities (FGw)
  • Interfacultary Research - Institute for Logic, Language and Computation (ILLC)
Abstract
Federico Sangati onderzocht het leren van syntactische boomstructuren aan de hand van generalisaties over geannoteerde corpora. Hij richtte zich op verschillende probabilistische modellen, met drie verschillende representaties. Sangati formuleerde een algemeen kader (framework) voor het definiƫren van generatieve modellen van syntaxis. In elk model vallen de syntactische bomen uiteen in elementaire constructies die opnieuw gecombineerd kunnen worden om nieuwe syntactische structuren te genereren. Voor het leren van zinsstructuren introduceert Sangati een nieuwe methode van Data-Georiƫnteerd Ontleden (Data-Oriented Parsing). Hierbij worden constructies van willekeurige grootte gebruikt als bouwstenen van het model. Om de grammatica te beperken tot een kleine, maar representatieve verzameling van constructies worden echter alleen constructies die meerdere keren voorkomen gebruikt als verzameling van voorbeelden.
Document type PhD thesis
Note ILLC dissertation series no. DS 2012-01 Research conducted at: Universiteit van Amsterdam
Language English
Permalink to this page
Back