Skip to main content

News archive

Fula ordboken i Karp

Nu finns Bengt G Dagrins "Fula ordboken" sökbar hos Språkbanken.

Nu finns Bengt G Dagrins "Fula ordboken" sökbar i Språkbankens lexikonverktyg Karp. Lexikonet finns än så länge här, i en förhandsvisning av nästa version av Karp.

"Fula Ordboken är ett försök att presentera ofta försummade och baktalade ord, sådana ord som det stått strid om, som omskrivits eller uteslutits, som stämplats som vulgära, obscena och fula och som därför få ordforskare velat befatta sig med." (fulaordboken.se)

Nytt inlägg på bloggen

Zipfs lag, uppkallad efter den amerikanske lingvisten George Kingsley Zipf, säger att ett ords frekvens är omvänt proportionellt mot dess plats i en frekvenslista. Vad innebär det?

Niklas Zechner skriver i senaste inlägget i Språkbanksbloggen under rubriken "Zipfs lag på svenska".

Till bloggen

 

 

 

Ny version av SKBL (Svenskt kvinnobiografiskt lexikon)

En ny version har släppts av Svenskt kvinnobiografiskt lexikon.

https://skbl.se/sv

Det som är nytt är följande:

  • Cirka 240 nya kvinnor i databasen
  • Ny interaktiv karta som visar var olika kvinnor har befunnit sig under sina liv
  • Ny kronologi som ger en bättre överblick över vilka kvinnor som har levt under en viss tidsperiod
  • Det finns nu tre olika quiz där man kan testa sina kvinnohistoriska kunskaper

Läs mer om SKBL. 

Databasen har utvecklats av Språkbanken och den förvaltas av Swe-Clarin.

 

Automatiska metoder för att studera språkförändringar - pågående shared task

Automatisk identifiering av lexikosemantiska förändringar, alltså möjligheten att med datorers hjälp hitta när ord förändrar sina betydelser över tid, är ett aktivt forskningsfält inom språkteknologi. Towards Computational Lexical Semantic Change Detection är ett forskningsprojekt som knyter an till fältet. Projektet, som startade i januari 2019, finansieras av Vetenskapsrådet och leds av Nina Tahmasebi, docent vid Språkbanken Text, Institutionen för svenska språket på Göteborgs universitet.

Ett av de stora problemen inom fältet rör bristen på öppna testdata av god kvalité som bidrar till jämförbara metoder. Språkbanken är med i en shared task (forskningstävling) som syftar till att jämföra modeller på öppna data med en gemensamt satt standard med hjälp av hög-kvalitativa, manuellt annoterade datamängder för engelska, svenska, tyska och latin. Tävlingen, som organiseras under SemEval2020-flagg, drog igång den 19 februari 2020 och kör i ytterligare en månad.

I nu läget har vi släppt testdata för samtliga språk (de svenska delkorpusarna bygger på Kubhist2 och finnas att hitta här: https://zenodo.org/record/3672950), samt ett gäng med testord som skall klassificeras. Efter tävlingens slut kommer vi även att släppa ground truth (alltså resultaten baserat på den manuella uppmärkning som gjorts under hösten och vintern) för vidare utveckling och andra uppgifter.

Den som vill delta i tävlingen, eller ladda ner data för de andra språken, kan hitta mer information på SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection. De officiella resultaten presenteras på SemEval2020 workshopen under Coling2020 i Barcelona i år.  

Mer information om projektet Towards Computational Lexical Semantic Change Detection finns på https://languagechange.org/.

Postdoktor i språkvetenskaplig databehandling med koppling till forskningsinfrastrukturen Swe-Clarin

Humlab söker en postdoktor för forskning inom infrastrukturprojekt kopplat till Swe-Clarin.

Humlab är en enhet och en forskningsinfrastruktur vid Humanistisk fakultet på Umeå universitet. Humlab söker nu en postdoktor för forskning inom infrastrukturprojekt kopplat till Swe-Clarin som är en nationell nod i europeiska CLARIN (Common Language Resources and Technology Infrastructure) – ett ESFRI-initiativ för att bygga upp en infrastruktur för e-vetenskap inom humaniora och samhällsvetenskap. 

Forskare på KTH omvandlar text till tal, och tvärtom. Nu ska ett av världens största mediearkiv bli sökbart.

Att omvandla text till tal, och tvärtom. Det är vad KTH-forskaren Jens Edlund (föreståndare för Språkbanken Tal) med kollegor fått drygt 20 miljoner kronor i anslag för att jobba med. Det handlar bland annat om att ta fram teknik som klarar av att lyssna igenom Kungliga bibliotekets mediearkiv och göra det sökbart.

Att omvandla text till tal, och tvärtom. Det är vad KTH-forskaren Jens Edlund (föreståndare för Språkbanken Tal) med kollegor fått drygt 20 miljoner kronor i anslag för att jobba med. Det handlar bland annat om att ta fram teknik som klarar av att lyssna igenom Kungliga bibliotekets mediearkiv och göra det sökbart.

Nina Tahmasebi ny docent inom växande forskningsfält

När Nina Tahmasebi började forska kring automatiska metoder för att studera språkförändringar var hon en av få inom fältet. 

– I år höll vi vår första internationella workshop och fick över 50 inskickade artiklar. Att få vara med om detta känns enormt roligt!

Nu har Nina Tahmasebi antagits som docent vid Institutionen för svenska språket på Göteborgs universitet.