Parallellstilling av setninger

2005 - 2006

I 2005 ble det satt i gang arbeid med å lage en ny utgave av programmet som parallellstiller setninger fra en original tekst med setninger i en oversatt tekst (original skrevet til ENPC i 1994-7) Tekstene som skal parallellstilles er kodet i XML.og inndelt i setninger Programmet gjør bruk av en liten tospråklig ordliste (ankerord) og utnytter også egennavn, tall og ord som ligner på hverandre i de to tekstene. Setningene som sammenstilles presenteres i to kolonner og det er mulig å interaktivt gjøre forandringer i det automatiske forslaget. Det er laget et opplegg for konvertering av filer i Word-format via HTML til XML. Programmet for inndeling av tekst i setninger er blitt forbedret. Det er laget programmer for å vise de sammenstilte tekstene i HTML-format og å klargjøre tekstene for søk i Corpus WorkBench via et web-grensesnitt. Programmene har blitt brukt av en Multilingua-forsker til å sammenstille engelske og spanske tekster.

Prosjektsider

 

Prosjektleder

Knut Hofland

Kontaktperson

Knut Hofland / knut.hofland@uni.no

Prosjektmedarbeidere

Øystein Reigem

Side-alternativer