Hoppa till huvudinnehåll

Trevlig sommar – och ordvektorer

Inlagt av Staffan Melin 2024-06-23

Nu går de flesta av oss på semester! Det betyder att många av oss på Språkbanken Text kan vara svåra att nå. Det går bra att försöka på vår gemensamma e-post men även det svaret kan dröja.

Som en liten sommargåva vill vi berätta om den nya datasamlingen kubord-fasttext, en samling fasttext-modeller tränade på moderna tidningstexter från Kungliga biblioteket. Modellerna har tagits fram i ett samarbete mellan KB-labb och Språkbanken Text.

Vi bestämmer oss för att studera ordet sommar i textsamlingen GP 2013-2022.

Här är ordbilden för sommar (framtagen med vår ordforskningsplattform Korp):
Ordbild för ordet sommar

som ger en överblick över vilka ord som står i syntaktisk relation till sommar i GP 2013-2022.

Med hjälp av ordvektorer kan vi studera vilka ord som liknar varandra på så vis att de har en liknande språklig kontext. Eller uttryckt annorlunda, som har ordbilder som liknar varandra.

Låt oss nu plocka fram ordvektorn för sommar, tränad på exakt samma material som ordbilden, och plocka fram de topp tjugofem närmaste ordvektorsgrannarna:

Ordvektor för ordet sommar.

sommar och midsommar återfinns alltså relativt ofta i liknande sammanhang. Men höst ligger först!

Men innan hösten är här, så önskar vi er alla en trevlig och lugn sommar!

Språkbanken Text
genom Markus Forsberg och Staffan Melin
 

Etiketter