PAROLE-materialet

Det textmaterial som här går under namnet Parole är insamlat inom ramen för EU-projektet PAROLE (avslutat 1997 och inriktat på att bygga upp ett europeiskt nätverk av språkliga resurser).

Varje partner i nätverket byggde på nationell nivå upp en blandad textkorpus och ett mindre lexikon med uppgifter om böjning och syntax.

Institutionen för svenska språket vid Göteborgs universitet var en av dessa partners. Projektledare var Daniel Ridings som också med hjälp av en statistisk taggare gjorde grammatiska sökningar i materialet möjliga.

Textmaterialet omfattar ca 19 till 19,4 miljoner löpande ord (beroende på vad man räknar som ord) . Texterna är i huvudsak insamlade inom Språkbanken och är fördelade enligt följande:

Textmaterial i PAROLE-materialet

Textkategori Texter Tid Textomfång
Romaner Bonniers Grafiska Industrier 1976—1981 4.4 milj. löpord
Dagstidningar Dagens Nyheter
Svenska Dagbladet
Göteborgs-Posten
Arbetet
1976—1997 13.6 milj. löpord
Tidskrifter Forskning och Framsteg 1995—1996 0.4 milj. löpord
Övrigt Webb-texter 1997 1 milj. löpord

Förutom dessa övergripande uppgifter om texttyper finns för närvarande inga källupgifter knutna till enskilda konkordansrader.


Martin Gellerstam





Uppdaterad av Torgny Rasmark.