Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

SAOB1950

Citering Information

Språkbanken Text (2023). SAOB1950 (uppdaterad: 2023-11-30). [Data set]. Språkbanken Text. https://doi.org/10.23695/zph6-en76
BibTeX Ytterligare sätt att citera datamängden.
Skannade böcker från 1950 till 2007 som används som källmaterial för att uppdatera SAOB, med ett urval som speglar det svenska ordförrådet under 1900-talet.

SAOB1950 har skapats för att fungera som kompletterande undersökningsmaterial för uppdateringen av Svenska Akademiens ordbok (SAOB). Den innehåller böcker från 1950 till 2007 som lånats från Lunds universitetsbibliotek och skannats in på Svenska Akademiens ordboksredaktion i Lund. Verken är utvalda för att tillsammans ge en representativ bild av det svenska ordförrådet framför allt under 1900-talets senare hälft. Ungefär hälften av verken har valts ut – antingen från Nationalbiografin eller från Lunds universitetsbiblioteks katalog – med ambitionen att täcka in många olika ämnesområden och få en någorlunda jämn fördelning vad gäller författarnas kön. För korpusens andra hälft har ett mer slumpmässigt urval gjorts, så att böcker med viss placering i bibliotekets magasin har infogats i korpusen (utan hänsyn till ämnesområde eller författarnas kön).

För samtliga verk finns uppgift om utgivningsår, författare och titel. I många fall anges även författarens kön (med M eller K) och ämnesområde genom bibliotekssignum (en uttydning av dessa signum återfinns här: https://libris.kb.se/subjecttree.jsp).

Fil Storlek Modifierad Licens
saob-bocker.xml.bz2
this file contains a scrambled version of the corpus Information (XML)
1006.14 MB 2023-11-30 CC BY 4.0
attribution
stats_saob-bocker.csv
Ordstatistik: Information (CSV)
367.54 MB 2023-12-01 CC BY 4.0
attribution

Typ

  • Korpus

Språk

svenska

Storlek

Meningar: 3 773 042
Token: 50 285 466

Updaterad

2023-11-30

Kontakt

Språkbanken
sb-info@svenska.gu.se