Skip to main content

News

LIVE and LEARN Festschrift

I samband med Lars Borin 65-årsdag har vi sammanställt en festskrift bestående av 30 artiklar. Artiklarna kommer från vänner och kollegor runt om i världen och handlar om ämnen som på ett eller annat sätt har inspirerats av Lars arbete. Ett gemensamt tema för artiklarna är det ständiga behovet av att lära, vilket anspelas på volymens titel: LIVE and LEARN.

Volymen är nu tillgänglig elektroniskt: https://gupea.ub.gu.se/handle/2077/74254

”Mormor Karl” ska göra personuppgifter anonyma

Texter som används som forskningsdata får inte innehålla personuppgifter som kan avslöja riktiga personer, något som i dag ofta hindrar forskare från att fritt använda textmaterialet. Forskningsmiljön ”Mormor Karl är 27 år” har getts nästan 18 miljoner kronor i bidrag från Vetenskapsrådet för att utveckla språkteknologiska algoritmer som automatiskt byter personuppgifter till en pseudonym i texter.

- I dag finns det risk att personer som nämns i ord i olika textmassor går att identifiera. Det kan vara med namn eller yrke, men också annan känslig information som politiska åsikter, berättar Elena Volodina, forskare vid Språkbanken Text vid Institutionen för svenska, flerspråkighet och språkteknologi.  

Elena Volodina är huvudsökande till Vetenskapsrådet för forskningsmiljön Mormor Karl är 27 år: automatisk pseudonymisering av forskningsdata som i november getts 17,6 miljoner kronor i bidrag. Under de sex kommande åren ska gruppen systematiskt studera pseudonymer i större textmassor. Målet är att skapa språkteknologiska algoritmer som kan upptäcka personuppgifter och känslig information i stora textmassor och automatiskt ersätta orden med lämpliga pseudonymer. På så sätt kan personuppgifter skyddas och alla texter användas i olika slags forskning. 

Läs hela nyheten om projektet här >>

Läs mer om projektet här >>

Symposium för Lars Borin

Torsdag den 17 November 2022 anordnades ett symposium för att hylla Lars Borin på sin 65-årsdag. Evenemanget ägde rum i Chalmersska huset och hade 60 deltagare.

Programmet bestod av en blandning av vetenskapliga och lättsamma, roliga föredrag till Lars för att hedra hans framstående nationella och internationella insatser för forskning och forskningsinfrastruktur inom språkteknologi.

Länk till programmet

Vi förberedde också en Festschrift som vi gav Lars i samband med evenemanget.

Programmet klart för årets Höstworkshop!

Hur gör vi arkivdata tillgängliga för forskning? Det är temat på årets Höstworkshop, 17 oktober i Uppsala. Nu kan du ta del av programmet.

På höstworkshoppen presenterar vi flera projekt som utforskar nya metoder och verktyg för forskning i arkivdata. Dagen inleds med en gästföreläsning av Anna Foka, föreståndare för Centrum för digital humaniora vid Uppsala universitet. Vi presenterar även dialekt- och folkminnesarkivet i Uppsala och avslutar med mingel.

Varmt välkommen!

Program och anmälan>>

Tid: Måndag den 17 oktober kl 13-17 med efterföljande mingel.
Plats: Institutet för språk och folkminnen i Uppsala, Von Kraemers allé 19, 2:a våningen. 

”Nya vägar till det förflutna – kulturarv och digitaliseringens möjligheter” lördag 24 september på Bokmässan

Under Bokmässan 2022 kan du lyssna på Nina Tahmasebi, docent i språkteknologi, Språkbanken Text, Göteborgs universitet prata om kulturarv och digitaliseringens möjligheter.

Lördag 24 september kl. 14:30-14:50
Monter B-hallen, B07:74

Medverkande: Cecilia Lindhé, föreståndare Centrum för digital humaniora, Nina Tahmasebi, ledare för forskningsprogrammet Change is Key!, och Mats Malm, föreståndare Litteraturbanken.
Samtalsledare: David Anthin, doktor i litteraturvetenskap. 
Arrangör: Göteborgs universitet i samarbete med Litteraturbanken och Folkuniversitetet

Mer information och monterprogram >>
--

Göteborgs universitets monter finner du B-hallen, B07:74. 
 

Valmanifest 2022 – En språkteknologisk snabbanalys

En dryg vecka innan valet var äntligen alla riksdagspartiernas valmanifest på plats.
Vi tänkte det vore intressant att göra några enkla analyser av texten och se vad vi kan ta reda på med språkteknologiska verktyg. Det första vi gjorde var att köra dokumenten genom Språkbankens annotationsverktyg Sparv. Detta gav oss bland annat läsbarhetsvärden och attitydanalys. Genomsnittslängden på manifesten är ca 6.000 ord, men varierar en hel del, från Kristdemokraternas 1.623 ord till Moderaternas 11.139. Antal ord LIX NK OVIX POS NEG C … Fortsätt läsa ”Valmanifest 2022 – En språkteknologisk snabbanalys”