Skip to main content
Språkbanken Text is a department within Språkbanken.

Press 65

Citation Information

Språkbanken Text (2017). Press 65 (updated: 2017-03-14). [Data set]. Språkbanken Text. https://doi.org/10.23695/vpc3-wc18
BibTeX Additional ways to cite the dataset.
Swedish press 1965

Korpusen består av artiklar insamlade från fem morgontidningar år 1965, nämligen :

Göteborgs Handels- och Sjöfartstidning (GHT)
Svenska Dagbladet (SvD)
Stockholmstidningen (ST)
Dagens Nyheter (DN)
Sydsvenska Dagbladet - Snällposten (SDS)

Materialet omfattar något över en miljon ord. Syftet med insamlingen var främst att utföra kvantitativa undersökningar av svenskans vokabulär. Resultaten av undersökningarna finns redovisade i detalj i Nusvensk frekvensordbok (NFO) 1 - 4 (1970 - 1980), av vilka delarna 1 och 2 ägnas åt orden, del 3 åt ordförbindelser (flerordsuttryck) och del 4 åt ordleden (morfemen).

Materialet insamlades under fem fjortondagarsperioder per tidning och inskränktes till sådana artiklar som fanns tillgängliga på hålremsa och därmed var maskinläsbara i 1960-talets teknik. Därvid uteslöts på förhand anonyma artiklar, artiklar från nyhetsbyråer, artiklar från sportsidorna, kåserier, insändare och annonser. I efterhand uteslöts även artiklar med metaspråkligt innehåll, artiklar med utländsk författare samt artiklar innehållande längre citat. Syftet med uteslutningarna var att göra materialet mer homogent. Det slutliga urvalet omfattade noga räknat 1 000 669 löpande ord i 1 387 artiklar av 569 författare. En fullständig förteckning över författare och artiklar, med angivande av publiceringsdatum, internt författarnummer m.m., finns i appendix till NFO 4.

Materialet indelades med avseende på typ av källa i tre s.k. genrer:

U utrikeskorrespondenters rapporter
K kulturartiklar jämte recensioner
A allmänt reportage

Med avseende på innehåll indelades materialet även i sex ämnesområden, nämligen :

Na (naturvetenskap etc.)
Ku (kulturvetenskap etc.)
Po (politik och samhälle)
(näringsliv och samfärdsel)
(människa och miljö)
Ko (konstnärlig verksamhet).

Materialets fördelning över tidningar, genrer och ämnen finns beskriven i inledningen till NFO 1.

I konkordansen identifieras raderna med en kombination av förkortningarna för Tidning och Ämne, enligt mönstren SvDKu eller DN_Mä.
OBS att meningsgränser är särskilt markerade genom tillägg av plustecken "+" efter s.k. stort skiljetecken.

Jerker Järborg

File Size Modified Licence
press65.xml.bz2
this file contains a scrambled version of the corpus Information (XML)
20.88 MB 2017-03-14 CC BY 4.0
attribution
stats_PRESS65.txt
Word statistics: Information (CSV)
6.71 MB 2017-03-19 CC BY 4.0
attribution

Collection

Type

  • Corpus

Language

Swedish

Size

Sentences: 53,624
Tokens: 1,119,449

Updated

2017-03-14

Contact

Språkbanken
sb-info@svenska.gu.se