Oesterreichisches Forschungsinstitut fuer Artificial Intelligence (OeFAI) Schottengasse 3, A-1010 Wien Tel.: +43-1-5336112, Fax: +43-1-5320652, Email: sec@ai.univie.ac.at ------------------------------------------------------------------------- VORTRAG ******* Mag.Brigitte KRENN Institut fuer Computerlinguistik Universitaet des Saarlandes, Saarbruecken und Oesterreichisches Forschungsinstitut fuer Artificial Intelligence METHODEN UND WERKZEUGE ZUR AUTOMATISCHEN EXTRAKTION VON KOLLOKATIONEN AUS ROHTEXT Kollokationen, lexikalische Kookkurrenzen wie z.B. "zur Verfuegung stellen", "den Anschein erwecken" aber auch "Hut aufsetzen" versus "Jacke anziehen" etc., stellen ein wesentliches Merkmal des Sprachgebrauchs dar und sind entsprechend fuer eine anwendungs- ortientierte, realitaetsnahe Sprachverarbeitung von Interesse. Im Vortrag werden computerlinguistische Methoden und Werkzeuge zur automatischen Extraktion von Kollokationen aus beliebigem, maschinenlesbaren Text vorgestellt. Korpora werden anhand flacher Verarbeitung (Tokenisierung, Part-of-Speech Tagging, Phrase Chunking) mit rudimentaerer syntaktischer Information versehen, wodurch der Zugriff auf im Text vorhandene lexikalische Kookkurrenzen unterstuetzt wird. Des weiteren werden Methoden zur Abgrenzung von Kollokationen von lexikalisch nicht konventionalisierten Wortkombinationen diskutiert, wobei im besonderen rein frequenzbasierte statistische Ansaetze hybriden linguistisch motivierten Ansaetzen gegenuebergestellt werden. Zeit: Freitag, 4.Dezember 1998, 18:30 Uhr pktl. Ort: OeFAI, Schottengasse 3, 1010 Wien 1. OESTERREICHISCHES FORSCHUNGSINSTITUT FUER ARTIFICIAL INTELLIGENCE o.Univ.-Prof.Dr.Robert Trappl