Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Press 65

Citering Information

Språkbanken Text (2017). Press 65 (uppdaterad: 2017-03-14). [Data set]. Språkbanken Text. https://doi.org/10.23695/vpc3-wc18
BibTeX Ytterligare sätt att citera datamängden.
Svensk press 1965

Korpusen består av artiklar insamlade från fem morgontidningar år 1965, nämligen :

Göteborgs Handels- och Sjöfartstidning (GHT)
Svenska Dagbladet (SvD)
Stockholmstidningen (ST)
Dagens Nyheter (DN)
Sydsvenska Dagbladet - Snällposten (SDS)

Materialet omfattar något över en miljon ord. Syftet med insamlingen var främst att utföra kvantitativa undersökningar av svenskans vokabulär. Resultaten av undersökningarna finns redovisade i detalj i Nusvensk frekvensordbok (NFO) 1 - 4 (1970 - 1980), av vilka delarna 1 och 2 ägnas åt orden, del 3 åt ordförbindelser (flerordsuttryck) och del 4 åt ordleden (morfemen).

Materialet insamlades under fem fjortondagarsperioder per tidning och inskränktes till sådana artiklar som fanns tillgängliga på hålremsa och därmed var maskinläsbara i 1960-talets teknik. Därvid uteslöts på förhand anonyma artiklar, artiklar från nyhetsbyråer, artiklar från sportsidorna, kåserier, insändare och annonser. I efterhand uteslöts även artiklar med metaspråkligt innehåll, artiklar med utländsk författare samt artiklar innehållande längre citat. Syftet med uteslutningarna var att göra materialet mer homogent. Det slutliga urvalet omfattade noga räknat 1 000 669 löpande ord i 1 387 artiklar av 569 författare. En fullständig förteckning över författare och artiklar, med angivande av publiceringsdatum, internt författarnummer m.m., finns i appendix till NFO 4.

Materialet indelades med avseende på typ av källa i tre s.k. genrer:

U utrikeskorrespondenters rapporter
K kulturartiklar jämte recensioner
A allmänt reportage

Med avseende på innehåll indelades materialet även i sex ämnesområden, nämligen :

Na (naturvetenskap etc.)
Ku (kulturvetenskap etc.)
Po (politik och samhälle)
(näringsliv och samfärdsel)
(människa och miljö)
Ko (konstnärlig verksamhet).

Materialets fördelning över tidningar, genrer och ämnen finns beskriven i inledningen till NFO 1.

I konkordansen identifieras raderna med en kombination av förkortningarna för Tidning och Ämne, enligt mönstren SvDKu eller DN_Mä.
OBS att meningsgränser är särskilt markerade genom tillägg av plustecken "+" efter s.k. stort skiljetecken.

Jerker Järborg

Tillgänglig via

Ladda ned

Fil Storlek Modifierad Licens
press65.xml.bz2
this file contains a scrambled version of the corpus Information (XML)
20.88 MB 2017-03-14 CC BY 4.0
attribution
stats_PRESS65.txt
Ordstatistik: Information (CSV)
6.71 MB 2017-03-19 CC BY 4.0
attribution

Del av samling

Typ

  • Korpus

Språk

svenska

Storlek

Meningar: 53 624
Token: 1 119 449

Updaterad

2017-03-14

Kontakt

Språkbanken
sb-info@svenska.gu.se