Hoppa till huvudinnehåll

Alla nyheter

Underhållsarbete under påsk

För påskhelgen planeras underhållsarbete på Språkbanken Texts servrar. Arbetet påbörjas på skärtorsdagskvällen den 14 april. Hur lång tid det kommer att ta är svårt att förutse, men det förutsätts vara klart senast under annandagen den 18 april.

Arbetet består främst i att starta om och automatiskt undersöka system inför framtida uppgraderingar.

Under arbetet kan Språkbankens tjänster vara instabila, och vi föreslår att användande skjuts upp till efter helgen.

Känslor om vaccination…

”Vaccin är ett fult o lömskt ord för att kunna lura friska människor till att injicera sjukdomar och död.” Vaccinskepsis Redan år 2019 listade Världshälsoorganisationen vaccintvekan som ett av de tio största hoten mot global hälsa.
Trots att vaccinationer bevisligen är en av de viktigaste insatserna för folkhälsan, skapar vaccintvekan och vaccinmotstånd allvarliga bekymmer för en betydande del av befolkningen i många länder, inklusive Sverige. Vaccinoro, såsom den kommer till uttryck i sociala medier – där vacciners bristande säkerhet och effektivitet, samt … Fortsätt läsa ”Känslor om vaccination…”

Samarbetsavtal mellan SLS och språkbankerna i Sverige och Finland

Svenska litteratursällskapet i Finland (SLS) har som syfte att samla, bearbeta och offentliggöra kunskapen om den svenska kulturens uppkomst och utveckling i Finland och att främja forskning rörande svenska språket och litteraturen i Finland.

Ett betydande resultat av SLS verksamhet är digitalt svenskt språkmaterial (text, ljud och video). 
För SLS är det viktigt att detta material blir så brett och så öppet tillgängligt som möjligt för ny forskning, vilket idag är synonymt med att det går att finna och hämta över internet, men SLS har inte ambitionen att själva bygga upp och underhålla den e-infrastruktur som detta skulle kräva.

Nationella språkbanken i Sverige, Språkbanken i Finland och SLS har därför slutit ett samarbetsavtal som innebär att de två språkbankerna åtar sig att tillgängliggöra delar av SLS digitala svenska språkmaterial för forskning och utbildning och möjligaste mån även för den intresserade allmänheten.

För de båda språkbankerna kommer avtalet att innebära ett betydande tillskott till deras finlandssvenska resurser. Materialet kommer från:
- SLS arkiv, som i sin verksamhet kontinuerligt insamlar nytt språkmaterial i digital form och digitaliserar äldre språkmaterial ur arkivets samlingar,
- SLS forskningsverksamhet som finansierar forskare och forskningsprojekt med villkor om att det material som uppkommer i forskningen ska tillgängliggöras och kunna användas av senare forskning och
- SLS utgivning som publicerar digitala utgåvor av författarskap eller andra materialhelheter och som digitaliserar SLS tryckta utgivning.
 

Synchronic and Diachronic Aspects of Kanashi

Boken Synchronic and Diachronic Aspects of Kanashi som kom ut i mars är ett resultat av två projektsamarbeten mellan Språkbanken Text, Uppsala universitet och University of California Santa Barbara.

Boken finns fritt tillgänglig att ladda ner på nätet (open access): 
https://doi.org/10.1515/9783110703245
Författare: Anju Saxena, Uppsala universitet och Lars Borin, Göteborgs universitet

Kanashi är ett sinotibetanskt språk som talas av knappt 2000 personer i en enda by, Malana i Kullu-distriktet i delstaten Himachal Pradesh i norra Indiens bergsområden. Byn är omgiven av byar där olika indoariska språk talas. Forskare har länge spekulerat om Kanashis historia: hur kommer det sig att språket talas i enbart en enda by, helt avskuret från sina närmaste språkliga släktingar?

Synchronic and Diachronic Aspects of Kanashi presenterar resultaten av synkroniska och diakroniska studier av Kanashi samt dess besläktade språk och kontaktspråk. Forskningsresultaten bygger till en del på automatisk bearbetning av fältarbetesdata som har samlats in i projekten.

Postdoc position: Researcher in Natural Language Processing / Data science at Språkbanken Text, Gothenburg, Sweden

Språkbanken Text, Department of Swedish, Multilinguality, Language Technology, University of Gothenburg invites applications for a postdoc position.

The work will be carried out within “Change is Key!”, a research program funded by Riksbankens Jubileumsfond (RJ) and within the research project “Towards computational lexical semantic change detection” (funded by a grant from the Swedish Research Council).

The deadline for application is 2022-05-04.
The starting date for the position is 2022-08-01 or by agreement.

Announcement and instructions how to apply >> 

Språkbanken Text och KB-labb lanserar ny datasamling: Kubord

Språkbanken Text och KB-labb samarbetar runt att skapa nya forskningsdata för humanistisk och samhällsvetenskaplig forskning. Som ett första resultat av samarbetet lanserar vi nu datasamlingen Kubord, som består av strax under en miljard ord från det senaste decenniet av moderna dagstidningar. Dessa har tagits fram hos KB-labb genom att mata in tidningstexter i Språkbanken Texts språkteknologiska analyskedja Sparv. På så sätt har texterna delats upp i ord, så kallad tokenisering, och utökats med lingvistiska särdrag såsom ordklasser, betydelser och sammansättningsinformation.

Kubord innehåller upphovsrättsskyddat material och därför är orden inte försedda med kontextuell information, till skillnad från många andra datasamlingar inom Språkbanken. Trots detta är den här samlingen av stort värde för forskare som vill studera ordens förändring över modern tid. Kubord används bland annat i ordboksarbetet som pågår på Institutionen för svenska, flerspråkighet och språkteknologi. För ordboksredaktionen är det viktigt att kunna ta reda på hur vanliga orden är i modernt språk för att lättare kunna identifiera nyord och ord som inte används längre.

Kubord innehåller idag ord från Dagens Nyheter, Göteborgs-Posten och Svenska Dagbladet från åren 2010-2020, men samlingen kommer utökas löpande med nya tidningar och årgångar.

Kubord finns fritt tillgänglig för nedladdning från Språkbanken Texts hemsida och kan även utforskas i Språkbanken Texts forskningsverktyg Korp.