Norsk aviskorpus
Uni Digital har samlet inn et omfattende tekstmateriale bestående av norske avistekster. Materialet omfatter p.t. ca. 700 millioner ord og består av ubehandlede tekster på bokmål og nynorsk. Prosjektet har som målsetting å gjennomføre nødvendig videreutvikling og kvalitetssikring av tekstkorpuset og gjøre det tilgjengelig og anvendelig. Arbeidet innebærer å bygge opp en samling dataverktøy for automatisert nettbasert innhenting, bearbeiding og annotasjoner av avistekster, samt klargjøre selve korpuset for språkvitenskapelig forskning og språkteknologisk utviklingsarbeid. Prosjektet er finansiert av Norges Forskningsråd gjennom programmet Avansert vitenskapelig utstyr (AVIT).
Tekstinnsamlingen har foregått siden 1998. I prosjektet bygges det også opp en nyordsdatabase som vokser i omfang hver dag. Dagsaktuelle nyordslister klassifiseres automatisk og gjøres tilgjengelig for forskere og leksikografer. Både tekstkorpus og nyordlister er søkbare på prosjektets nettside.
Prosjektsider
Prosjektleder
Kontaktperson
Knut Hofland / knut.hofland@uni.no
Prosjektmedarbeidere
Tone Merete Bruvik
Eksterne medarbeidere
Ruth Vatvedt Fjeld, ILN, UiO
Boye Wangensteen, ILN, UiO
Kristin Hagen, Tekstlaboratoriet, UiO
Anders Nøklestad, Tekstlaboratoriet, UiO
Lars Nygaard, Kaldera språkteknologi AS

