Hoppa till huvudinnehåll

Hur fångar vi upp svenskans nya ord med hjälp av Kubord?

Inlagt av Emma Sköldberg 2022-11-28

Krympflation, sugardejting, teckentolka och tyngdtäcke är några av alla de ord vilkas betydelser och användningar just nu analyseras av oss som ingår i forskningsprojektet Svenska Akademiens samtidsordböcker vid Språkbanken Text. Analyserna ska ligga till grund för innehållet i framtida ordboksartiklar i de två samtidsordböckerna Svenska Akademiens ordlista (SAOL) och Svensk ordbok utgiven av Svenska Akademien (SO). På senare tid har den relativt nyskapade datamängden Kubord, som finns tillgänglig via Språkbanken Texts samlingar och via forskningsverktyget Korps Kubordläge, kommit att spela en mycket viktig roll inom en pågående metodutveckling. Denna ska bidra till att förbättra den vetenskapliga kvaliteten på ordboksarbetet i allmänhet och urvalet av uppslagsord i synnerhet. 

Inom projektet Svenska Akademiens samtidordböcker pågår en ständig jakt efter nya svenska ord. Med nya ord menas här i korthet bl.a. ord som skapats och spridits i svenska texter på senare år, och och därmed kan sägas ingå i svenskan. Ett exempel på ett sådant ord är det relativt nybildade substantivet vaccinpass som plötsligt började användas runt årsskiftet 2020/2021. Men med nya ord avses också sådana ord som ökat i användning på senare tid, t.ex. redan nämnda teckentolka som återfinns i svenska texter sedan åtminstone 1973. Dessutom är vi i projektet intresserade av äldre ord som av någon anledning inte fångats upp och införlivats i tidigare upplagor av samtidsordböckerna, t.ex. lagervara, som är belagt i svenska tidningar åtminstone sedan 1870-talet.  

Nya ord i svenskan kan antingen bli uppslagsord i kommande upplagor av ordböckerna eller fungera som språkexempel, då i form av sammansättningar eller avledningar i den aktuella ordboken. Men nyare ord intresserar även andra språkvetare, språkteknologer, historiker och samhällsvetare, eftersom ett språks ordförråd och dess utveckling säger en hel del om det omkringliggande samhället och hur det förändras. 

Innehållet i olika slags referensmaterial har, som redan antytts, sedan länge spelat en avgörande roll för att utarbeta listor med nyordskandidater, dvs. ord som kan komma att behandlas i ordböckerna. För att upptäcka nyare ord, behöver vi i projektet ha tillgång till modernare referensmaterial, men regler kring upphovsrätt skapar en hel del begränsningar i arbetet.  KB-labb (vid Kungliga biblioteket) och Språkbanken Text har emellertid tagit sig an utmaningen att utarbeta datasamlingar, baserade på modern tidningstext, som kan stödja den här typen av ordforskning utan att för den sakens skull inkräkta på upphovsrätten.  

Resultatet är Kubord, som består av frekvenstabeller för ord som berikats med de språkteknologiska standardanalyser som Språkbanken Texts språkteknologiska analysverktyg Sparv erbjuder. För att man automatiskt ska kunna bestämma exempelvis ett ords grundform, ordklass och betydelse krävs det en språklig kontext. När vi gjort den här analysen, behövs dock inte kontexten längre, utan vi kan göra en rik orddatasamling allmänt tillgänglig, en orddatasamling som inte riskerar att strida mot upphovsrätten. 

Kubord består idag av ca 80 delsamlingar med innehåll från bl.a. Dagens Nyheter från perioden 2000–2021 och Svenska Dagbladet, Aftonbladet och Expressen från perioden 2010–2021.  

Kubords utformning begränsar visserligen användningsområdena inom ordforskningen, som inte sällan behöver ha tillgång till ordens språkliga kontext. Trots det räcker Kubord mer än väl till för att undersöka likheter och skillnader i ordförrådet mellan exempelvis två årgångar av en och samma tidning.   

Vidare går det att jämföra ordförrådet i ovan nämnda tidningstexter med innehållet i andra slags texter i Språkbanken Texts samlingar, till exempel Poeter.se, som innehåller mer skönlitterära alster. 

För att vaska fram nyordskandidater, har vi, baserat på bland annat Kubord, utarbetat en metod som tar fram nyordskandidater som inte redan finns beskrivna i samtidsverken SAOL och SO. Metodutvecklingen är i sin linda, men den har redan idag gett mycket värdefulla bidrag till ordboksarbetet. 

En jämförelse mellan innehållet i Göteborgs-Posten från 2019 och 2020 visar, inte helt förvånande, att bruket av många pandemirelaterade ord, exempelvis coronavirus, korttidspermittering, lockdown, vaccinsamordnare och smittbärarpenning, ökade lavinartat. Andra ord som minnesrum streetrace, palettblad, strömningstjänst och powerbank ökade också i användning mellan de två årgångarna. Flera av dessa ord kommer med största sannolikhet att beskrivas i kommande upplagor av ordböckerna.   

Exempel på ord som kommit starkt under än senare tid, åren 2020–2021, är:  

barnfridsbrott, charkbricka, freeskiing, fucking, gastropub, glamping, hjärndimma, höghöjdsbana, incel, intimitetskoordinator, jätteloka, kakuro, klassikerskydd, kulturtolk, magnetfiskare, mikrostat, minoritetsstress, miso, mockumentär, mobildata, mobilitetshus, nagelsalong, naturhus, nettonollutsläpp, näringsterapeut, parallellsamhälle, powerwalk, preklinisk, prosecco, reduktionsplikt, rättspsyk, röstassistent, salsiccia, sexsomni, skidalpinism, skills, skyddsperson, sportswashing, streetfood, syrah, trygghetspension, uppläggningskostnad, utsläppssiffra, verkställighetshinder, villkorstrappa, yes.  

Onekligen säger många av dessa ord, som huvudsakligen är substantiv, något om hur svenska ord bildas. De säger även något om vår samtid, t.ex. om våra matvanor och fritidsintressen. 

Flera väletablerade, men ofta mer informella, svenska ord har inte minst dykt upp genom jämförelser mellan Kubord och Poeter.se. Exempel är bokmärka, extraslag, healer, lost, photoshoppa, repeat och vänförfrågan. I arbetet med en ordbok som t.ex. SO, vilken har till uppgift att beskriva modern svenska, är det viktigt att också mer vardagliga ord lyfts fram så att även de eventuellt kan få en plats i ordböckerna. Om så är fallet kommer de, liksom alla andra ord som väljs ut, att förses med uppgifter om böjning, uttal, betydelse m.m. 

Sammanfattningsvis har samarbetet mellan KB-labb och Språkbanken Text legat till grund för lexikografisk metodutveckling på en generell nivå. Mer konkret har det också genererat ett stort antal nyordskandidater till Svenska Akademiens ordboksprojekt. Kubord har fungerat som en viktig vitamininjektion i arbetet, och målet är att det pågående samarbetet mellan KB-labb och Språkbanken Text ska generera ytterligare metodutveckling, samt olika slags hjälpmedel för det praktiska lexikografiska arbetet.

I nuläget sträcker sig, som redan framgått, Kubord-materialen fram till och med 2021. Kubord kommer därför att behöva kompletteras allt eftersom. Snart kommer vi i projektet att kunna se vilka svenska ord som tillkommit eller vunnit terräng under år 2022 och som därför kan göra anspråk på en plats i Svenska Akademiens ordböcker.