Research Areas
I apply data-intensive, statistical methods to linguistic questions, with a focus on the syntax-semantics interface and lexical-semantic phenomena. As a main challenge of my work I consider the linguistic and cognitive plausibility of the approaches with respect to the tasks.The topics of my research include grammar development, corpus-based lexical acquisition, and the application to lexicography; the automatic induction of semantic classifications, the compositionality of German multi-word expressions, the evaluation of corpus-based semantic knowledge, and cognitive feedback (mainly with respect to associations) to semantic relations.
Since October 2011, I work as PI on Distributional Approaches to Semantic Relatedness, funded by a DFG Heisenberg Fellowship plus Research Grant. The project is described here.
Also in October 2011, I took over the SFB project on
Lexical-Semantic Factors in Event Interpretation as PI,
formerly headed by Sebastian Padó. The project is described here.
Milestones
- Habilitation:
Theoretical Adequacy, Human Data and Classification Approaches in Modelling Word Properties, Word Relatedness and Word Classes
Philosophische Fakultät, Universität des Saarlandes, June 2009. [Habilitation homepage]
- PhD Thesis:
Experiments on the Automatic Induction of German Semantic Verb Classes
Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, June 2003.
Published as AIMS Report 9(2). [PhD homepage]
Collaboration
- Gemma Boleda Torrent (Universitat Pompeu Fabra, Barcelona): automatic acquisition and evaluation of lexical classes
- Katrin Erk (Linguistics Department, University of Texas at Austin) and Sebastian Padó (Institut für Computerlinguistik, Heidelberg): semantic verb classifications
- Alissa Melinger (School of Psychology, University of Dundee) and Andrea Weber (Max Planck Institute for Psycholinguistics, Nijmegen): properties of association norms and their usage for NLP
- Annamaria Guida and Alessandro Lenci (Dipartimento di Linguistica, Università di Pisa): analyses of association norms
- Susanne Borgwaldt (Institut für Germanistik, Technische Universität Braunschweig): associations and compositionality of German compound nouns
- Daniela Briem and Miriam Butt (Fachbereich Sprachwissenschaft, Universität Konstanz): light verbs
Supervision
Interested in supervision? Have a look at potential topics.Former and current students:
- Gemma Boleda Torrent,
Universitat Pompeu Fabra, Barcelona
PhD (2007): Automatic Acquisition of Semantic Classes for Adjectives.
- Caren Brinckmann, Institut für Computerlinguistik und Phonetik, Universität des Saarlandes, Saarbrücken
(now: Institut für Deutsche Sprache, Mannheim)
Diplomarbeit (2005): The `Kiel Corpus of Read Speech' as a Resource for Speech Synthesis.
- Anna Brzezicka, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
Studienarbeit (2009, in German): Kompositionalität von Partikelverben in Bezug auf Assoziationen und Korpus-Kookkurrenz.
- Iryna Geib, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
Diplomarbeit (2010, in German): Evaluierung eines Verb-Clustering-Modells mit Selektionspräferenzen gegen Goldstandard-Klassen.
- Silvana Hartmann, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
(now: Technische Universität Darmstadt)
Studienarbeit (2008, in German): Einfluss syntaktischer und semantischer Subkategorisierung auf die Kompositionalität von Partikelverben.
- Kremena Ivanova, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
Studienarbeit (2008, in German): Entwicklung und Evaluierung einer Grammatik für die Extraktion deutscher Kollokationen mit der Sketch Engine.
- Ronny Jauch, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
Diplomarbeit (current): Empirical Analyses of Associations and Models of Compositionality for German Noun Compounds.
- Natalie Kühner, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
Studienarbeit (2010, in German): Automatische Bestimmung der Kompositionalität von deutschen Partikelverben auf der Basis von Cluster-Modellen: Vergleich von LSC und PAC.
- Michaela Regneri,
Institut für Computerlinguistik und Phonetik, Universität des Saarlandes, Saarbrücken
Bachelor thesis (2006, in German): VerbOzean: Maschinelles Lernen von semantischen Relationen zwischen deutschen Verben.
- Michael Roth,
Institut für Computerlinguistik und Phonetik, Universität des Saarlandes, Saarbrücken
(now: University of Heidelberg)
Bachelor thesis (2006, in German): Relationen zwischen Nomen und ihren Assoziationen.
- Christian Scheible, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
Studienarbeit (2009): Evaluating a Verb-Clustering Model using Pseudo-Disambiguation.
- Sylvia Springorum, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
Diplomarbeit (2011, in German): Untersuchungen zur automatische Klassifikation von Partikelverben mit 'an'.
- Yueshan Wang, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
Studienarbeit (2010, in German): Automatische Bestimmung der Kompositionalität von deutschen Partikelverben auf der Basis von Cluster-Modellen: Vergleich von LSC und LSCpref.