Skip to main content

News

Doctoral student in Natural Language Processing

Språkbanken Text (Gothenburg, Sweden) has an open position for a doctoral student in Natural Language Processing. Applications must be received by: Thursday, 29th of September, 2022. The application deadline is midnight (24.00).

See the full announcement here (note a link to detailed instructions under the Section "Application"): 

English: Göteborgs universitet | Doctoral student in Natural Language Processing (reachmee.com)

Swedish: Göteborgs universitet | Doktorandplats i språkvetenskaplig databehandling (reachmee.com)

Månadens profil: Maria Skeppstedt

Maria Skeppstedt är forskare inom språkteknologi. På Språkbanken Sam arbetar hon med teknisk infrastruktur för att samla in och tillgängliggöra termer för forskning och utveckling, till exempel via Eurotermbank. Hon har även tagit fram annoterings- och textminingverktyg, till exempel Topics2Themes som nu används i ett forskningsprojekt om klimatdiskussioner.

Läs intervjun med Maria Skeppstedt på språkbanken.se

Under vinjetten Månadens profil på språkbanken.se presenteras personer vars arbete har anknytning till Nationella språkbanken.

Nu digitaliserar vi hela det svenska trycket: men hur, när och varför?

Under Bokmässan 2022 kan du lyssna på Nina Tahmasebi, docent i språkteknologi, Språkbanken Text, Göteborgs universitet prata om varför man skulle vilja och behöva digitalisera det svenska trycket.

Torsdag 22 september kl. 15:15-15:45 
Forskartorget i B-hallen, monter B05:72

Nu digitaliserar vi hela det svenska trycket: men hur, när och varför?

Kungliga biblioteket och de fem stora universitetsbiblioteken har tagit på sig uppdraget att digitalisera allt som har tryckts i Sverige ända från 1400-talet och fram till i dag. Men hur ska det gå till, när blir det klart och vem ska betala kalaset?
Medverkande: Nina Tahmasebi, docent i språkteknologi, Göteborgs universitet, Lars Burman, överbibliotekarie, Uppsala universitetsbibliotek, Karin Byström, Uppsala universitetsbibliotek och Lars Ilshammar, biträdande riksbibliotekarie, KB.
Arrangör: Kungliga biblioteket
--
Göteborgs universitet medverkar med flertalet programpunkter på Forskartorget under Bokmässan 2022. Du finner Forskartorget vid den lugna oasen i B-hallen, monter B05:72. Läs mer här.
 

Sparv 5 är släppt

Nu finns det en sprillans ny version av Språkbankens textanalysverktyg Sparv med efterlängtade nya funktioner och många förbättringar!

Nytt är bland annat att man kan mata in dokument från ordbehandlingsprogram som Word (.docx och .odt-filer) och att det finns stöd för att analysera texter skrivna på fornsvenska och svenska från 1800-talet. Ytterligare två nya funktioner som har efterfrågats av våra användare är att Sparv nu stödjer XML-filer som innehåller namnrymder (namespaces) och en mer flexibel korpusstatistik-export.

Sparv har också blivit bättre på att ge återkoppling till användaren och verktyget har nu en mycket snabbare uppstartstid. Dessutom har Sparv blivit snällare mot ens hårddisk eftersom arbetsfiler komprimeras och tar upp mindre plats än förut.

För en komplett översikt över alla nya funktioner, förbättringar och buggfixar, se changeloggen här.

All information om hur man installerar och använder Sparv finns på https://spraakbanken.gu.se/sparv.

Månadens profil: Marie Mattson

Marie Mattson, språkvetare på Språkbanken Sam, har precis börjat en tjänst som samordnare för minoritetsspråk och språkteknologi i Norden. Tanken är att bidra till projekten European Language Equality (ELE) och Små språk i Norden, vars mål är att alla språk inom EU ska vara digitalt jämlika på nätet 2030.

Läs intervjun med Marie Mattson på språkbanken.se

 

Under vinjetten Månadens profil på språkbanken.se presenteras personer vars arbete har anknytning till Nationella språkbanken.

RaPID-2022: en workshop för forskare som arbetar med bearbetning, analys och tolkning av olika slags data, t.ex. text, tal, ögonrörelse- och sensormätningar...

Den 25 juni 2022 organiserar Språkbanken Text i samarbete med AgeCap, RaPID-4, som är en heldagsworkshop för forskare som arbetar med kognitiva funktionsförmågor. Det är den fjärde upplagan av workshopen och i år hålls den i Marseille inom ramen för den internationella konferensen LREC (the Language Resources and Evaluation Conference).

RaPID-4 är en heldagsworkshop för forskare som arbetar med bearbetning, analys och tolkning av olika slags data (t.ex. text, tal, ögonrörelse- och sensormätningar osv.) producerad av personer med olika former av mentala, kognitiva, neuropsykiatriska eller neurodegenerativa funktionsnedsättningar, såsom afasi, demens, autism, Parkinsons sjukdom eller schizofreni.  

Bearbetning och analys av sådana data kan användas för att identifiera, utvinna, korrelera och utvärdera olika språkliga eller multimodala fenotyper och mätningar, som kan användas för att underlätta diagnos, övervaka utvecklingen eller identifiera individer i riskzonen för olika typer av kognitiva, psykiatriska eller neurologiska sjukdomar. Ett centralt syfte är att studera samband mellan olika nivåer av språkliga, paralingvistiska och extralingvistiska observationer. 

I samband med RaPID-4 organiseras också en vetenskaplig tävling, s.k. challenge "Post-Stroke Speech Transcription" (PSST Challenge). Tävlingen är i samarbete med Oregon Health and Science University and Portland State University, USA. 
 
Mer information om LREC, RaPID-4, PSST och AgeCap finns här: 
 LREC: https://lrec2022.lrec-conf.org/en/ 
 RaPID-4: https://spraakbanken.gu.se/en/rapid-2022 
 PSST: https://psst.study/ 
 AgeCap: https://www.gu.se/en/agecap/ 

 

RaPID - Resources and ProcessIng of linguistic, para-linguistic and extra-linguistic Data from people with various forms of cognitive/psychiatric/developmental impairments

AgeCap - Centrum för åldrande och hälsa

LREC - the Language Resources and Evaluation Conference

Välkommen till Nationella språkbankens höstworkshop, måndag 17 oktober i Uppsala

Temat för årets workshop är arkivdata. I arkiven på svenska minnesinstitutioner finns väldiga material i text och tal med information av stort värde för humanistisk och samhällsvetenskaplig forskning. Dock är det svårt och resurskrävande att orientera i källorna. Nya metoder och verktyg för att göra arkivdata tillgängligt är därför av stort intresse.

På höstworkshoppen presenterar vi flera projekt som utforskar nya metoder och verktyg för forskning i arkivdata. Dagen inleds med en gästföreläsning av Anna Foka, föreståndare för Centrum för digital humaniora vid Uppsala universitet. Vi visar även dialekt- och folkminnesarkivet i Uppsala och avslutar med mingel och tilltugg.

Tid: Måndag den 17 oktober kl 13-18 med efterföljande mingel.
Plats: Institutet för språk och folkminnen i Uppsala, Von Kraemers allé 19, 2:a våningen.

I augusti återkommer vi med ett fullständigt program, men du kan anmäla dig redan idag. Varmt välkommen!

Läs mer och anmäl dig på Nationella språkbankens webbplats >>

Tidigare höstworkshoppar >>

Lövet

Månadens profil: Susanna Karlsson

Susanna Karlsson är docent i nordiska språk och universitetslektor vid Institutionen för svenska, flerspråkighet och språkteknologi vid Göteborgs universitet. Hon forskar, undervisar i sociolingvistik, språkpolitik och samtalsanalys och svarar på språkfrågor i programmet Språket i P1. I alla sina yrkesroller använder hon verktyget Korp.

Läs intervjun med Susanna Karlsson på språkbanken.se

Utforska Korp

Under vinjetten Månadens profil på språkbanken.se presenteras personer vars arbete har anknytning till Nationella språkbanken.