|
|
Norsk aviskorpusUni Digital har samlet inn et omfattende tekstmateriale bestående av norske avistekster. Materialet omfatter p.t. ca. 700 millioner ord og består av ubehandlede tekster på bokmål og nynorsk. Prosjektet har som målsetting å gjennomføre nødvendig videreutvikling og kvalitetssikring av tekstkorpuset og gjøre det tilgjengelig og anvendelig. Arbeidet innebærer å bygge opp en samling dataverktøy for automatisert nettbasert innhenting, bearbeiding og annotasjoner av avistekster, samt klargjøre selve korpuset for språkvitenskapelig forskning og språkteknologisk utviklingsarbeid. Prosjektet er finansiert av Norges Forskningsråd gjennom programmet Avansert vitenskapelig utstyr (AVIT). Tekstinnsamlingen har foregått siden 1998. I prosjektet bygges det også opp en nyordsdatabase som vokser i omfang hver dag. Dagsaktuelle nyordslister klassifiseres automatisk og gjøres tilgjengelig for forskere og leksikografer. Både tekstkorpus og nyordlister er søkbare på prosjektets nettside.
|
|
