Webbkarta

SUC Romaner (StorSUC)

Information

Licens Egen: http://k2xx.spraakdata.gu.se/stb/om/suc-license.pdf
Antal tokens: 4653743

Sök

Korp
Web service
Statistics
Old web interface (via Glossa)

Nedladdning

XML (citat)

Metadata

metadata as xml metadata as json

Stockholm-Umeå-korpus (SUC) är en samling svenska texter från 1990-talet, med totalt en miljon ord. Korpusen är balanserad, vilket betyder att den innehåller olika text typer och texter med olika stilnivåer. Texterna har märkts upp med ordklasstaggar, morfologisk analys och lemma, samt viss strukturell och funktionell information.

Version 1.0 utvecklades i samarbete mellan Gunnel Källgren vid Stockholms Universitet och Eva Ejerhed vid Umeå universitet och gjordes tillgängligt 1997 av institutionen för lingvistik på Stockholms universitet. Version 2.0 gjordes tillgänglig 2006 av Sofia Gustafson-Capková och Britt Hartmann vid institutionen för lingvistik på Stockholms universitet. Den innehåller samma texter som SUC 1.0 men är utökad med viss annotering. Dessutom innehåller SUC 2.0 två bonusmaterial. TigerSUC är SUC 2.0 konverterad till TIGER-XML av Martin Volk. StorSUC är ytterligare SUC-material om fyra miljoner ord.

SUC är fritt tillgänglig för forskning, men kräver att varje användare tecknar en individuell licens med institutionen för lingvistik vid Stockholms universitet. Från och med den 1/12 2008 är licensieringen av SUC delegerad till Språkbanken vid Göteborgs universitet.

SUC-licensen (i pdf-format) ska skrivas ut, skrivas under och sedan skickas till

SUC-licens
SprĂĄkbanken
Institutionen för svenska språket
Göteborgs universitet
Box 200
405 30 Göteborg

Ytterligare information

© Göteborgs universitet 2009, Box 100, 405 30 Göteborg
Tel +46 31 786 0000, Kontakt

Om webbplatsen

X
Loading