LOGON
Leksikon, ordsemantikk, grammatikk og oversettelse for norsk. 2003 - 2007
LOGON er et samarbeidsprosjekt mellom datalingvistiske miljøer ved universitetene i Oslo, Bergen og Trondheim, finansiert av NFR under KUNSTI-programmet. Prosjektets hovedmål er å utvikle en demonstrator for maskinoversettelse av turistrelaterte tekster fra norsk til engelsk, på grunnlag av et utviklingskorpus som består av tekster om turmål og turruter i Jotunheimen. Arbeidet tar utgangspunkt i omfattende komputasjonelle grammatikker for de to språkene. Den norske, NorGram (i LFG-format), er utviklet ved UiB, mens den engelske, ERG (i HPSG-format), er utviklet ved Stanford i USA. Grammatikkene avleder semantiske representasjoner av setninger i formatet Minimal Recursion Semantics (MRS). Blant modulene inngår forøvrig kraftige språkanalysesystemer fra Palo Alto Research Center og fra Stanford i California. Arbeidet i prosjektet omfatter bl.a. videreutvikling av grammatikkene, og særlig av den semantiske analysen, utvikling av en morfologisk analysekomponent, bl.a. med egennavngjenkjenning og kompositumanalyse, utvikling av en transfermodul og en transfergrammatikk som knytter sammen norske og engelske MRS-representasjoner, utvikling og inkorporering av statistiske metoder for parse-seleksjon og rangering av alternative oversettelser, og programvareutvikling for å inkorporere de ulike modulene i ett system. Andre oppgaver omfatter bl.a. arbeid med tospråklige tekstkorpora, metoder for entydiggjøring av flertydige ord i kontekst, arbeid med leksikalsk semantikk i et tospråklig perspektiv, og innarbeidelse av "grunne" og "robuste" analysemetoder med sikte på effektiv analyse, og på analyse av mindre velformet tekst.
Web-demo av den norske analysen:
http://decentius.aksis.uib.no/logon/xle.xml
Prosjektsider
Prosjektleder
Helge Dyvik
Kontaktperson
Helge Dyvik / Helge.Dyvik@lili.uib.no
Prosjektmedarbeidere
Paul Meurer
Victoria Rosén

