COLT - The Bergen Corpus of London Teenage Language
1993 - 2003
COLT er et talespråkskorpus basert på spontane samtaler mellom 13–17-åringer i London. Korpuset utgjør omtrent 472.000 ord og materialet består av transkribert tekst av ca. 55 timer lydopptak med tilhørende digitaliserte lydfiler. Tekstene finnes også i et tagget format der hvert ord har fått en ordklassekode. Det er laget et web-sted hvor brukere kan søke i materialet og spille av lyd. Det er også mulig å bla kronologisk i filene og spille av tilhørende lydsegment. Et sett med tre CD-plater, som kan kjøpes gjennom Aksis, gjør det mulig for brukeren ved hjelp av et installasjonsprogram å installere materialet på sin lokale maskin. Det er dermed mulig å få rask tilgang på tekst i flere formater og lyd i mp3-format uten bruk av nettverk.

