Meny

Nyheter

Sida 1

Nu finns det en ny korpus i Korp som innehåller nyhetsartiklar från svt.se. Artiklarna är från 2004 till september 2021.
Korpusen innehåller omkring 200 miljoner tokens, vilket är ett ganska stort material, och den är rik på metadata. Det finns bland annat information om publiceringsdatum, kategori, nyckelord och en länk till artikeln på svt.se.

Materialet är efterlängtat då det både är aktuellt och innehåller modernt och vårdat språk. Planen är att korpusen ska uppdateras två gånger per år. Vid nästa uppdatering kommer korpusen att delas upp årsvis, för att förenkla vissa typer av sökningar.

Korpusen heter SVT Nyheter och finns här: 
https://spraakbanken.gu.se/korp/#?cqp=%5B%5D&corpus=svt

Materialet är nedladdningsbart dels som meningsmängder och dels som ordfrekvenser:


Korp är Språkbanken Texts korpusverktyg med vilket man kan söka i stora mängder text från bland annat dagstidningar, skönlitteratur och sociala medier. Läs mer om verktyget Korp här: https://spraakbanken.gu.se/verktyg/korp

 

Korp korpus SVT Nyheter

 

Två nya nationella forskningsinfrastrukturer ska hjälpa forskare att hitta och använda digitala resurser samt att visualisera och analysera vetenskapliga data. Läs nyheten på gu.se >>

Eukalyptus contains almost 100 thousand tokens of written, contemporary Swedish of different text types/genres (novels, news texts, Wikipedia articles, blog texts and Europarl proceedings). Texts have been manually annotated with lemmata, word senses, parts of speech, multi-word units, and syntactic structure (constituents with grammatical functions).

The treebank – source texts and annotations – is released under a CC BY-SA 4.0 license, and is currently distributed in the TIGER-XML format.
 

For download details, please visit:
https://spraakbanken.gu.se/en/resources/eukalyptus

The download archive also contains documentation and publications related to the design of Eukalyptus.

We hope you find Eukalyptus useful in your work.

HUMINFRA ska göra det lättare för forskare att enkelt hitta de digitala resurser och expertis som finns utspridda på olika ställen i landet. Infrastrukturen leds av Humanistlaboratoriet vid Lunds universitet och omfattar tolv lärosäten och enheter, varav två vid Göteborgs universitet (Språkbanken Text och Centrum för digital humaniora), och är en del i att stärka svensk humanistisk forskning och göra den internationellt konkurrenskraftig. Infrastrukturen blir fritt tillgänglig och erbjuder en gemensam ingång till datasamlingar, verktyg, och expertis. HUMINFRA finansieras av Vetenskapsrådet.

Läs hela nyheten här: Miljonregn från VR ska underlätta för humanister att forska digitalt

Gloria Gagliardi (universitetet i Bologna, Italien), Dimitrios Kokkinakis (Göteborgs universitet) och Jon Andoni Dunabeitia (universitetet i Nebrija, Spanien och Norges arktiska universitet) har varit gästredaktörer för ett specialnummer av den i ansedda tidskriften Frontiers med tema ”Digital Linguistic Biomarkers: Beyond Paper and Pencil Tests". 

Länk till artikeln “Digital Linguistic Biomarkers: beyond paper and pencil tests”: https://www.frontiersin.org/articles/10.3389/fpsyg.2021.752238/full

Deltagande tidskrifter: Frontiers in Psychology, Frontiers in Neuropsychology, Frontiers in Human Neuroscience, Frontiers in Digital Health and Frontiers in Communication.

Those interested in astronomy may have noticed that Jupiter is currently in opposition.

But what does that mean? And what does ”Jupiter” mean? And what does all of this have to do with corpus linguistics, Elizabeth Taylor, and Tuesdays?

Till Språkbanksbloggen
Nu kan du som talar svenska som andraspråk eller du som är lärare/forskare/bedömare/kursboksförfattare inom svenska som andraspråk hjälpa till att ta reda på detta.

Som ett delprojekt i projektet Utveckling av lexikala och grammatiska kompetenser i invandrarsvenska (L2P) vill man se om andraspråkstalares intuitioner om ordens svårighetsgrad motsvarar lärares/forskares bedömning. 

Testet går ut på att jämföra grupper av fyra ord, och välja vilket som är det lättaste ordet att förstå, och vilket som är det svåraste ordet bland dessa fyra alternativ. Det finns inget rätt eller fel svar och det är bäst att försöka svara fort, inom 30 sekunder/uppgift. Mer information finns i guidelines. Experimentet är öppet till den 5 oktober 2021.

Guidelines

Fyll i samtycke och gör testet

 

Ansvariga forskare och deltagande universitet:
Göteborgs universitet, Sverige: Elena Volodina 
Helsingfors universitet, Finland: Therese Lindström Tiedemann
Université catholique de Louvain, Belgien: David Alfter 

 

Sök en doktorandtjänst hos oss.

Sista ansökningsdag: 2021-10-01

Läs mer på sökandeportalen >>

The Language Technology research group (Språkbanken Text) in the  Department of Swedish at the University of Gothenburg, Sweden, invites applications for one (or more) fully funded four-year PhD position(s) in Natural language processing.

Språkbanken has conducted research in NLP and neighboring fields for over 40 years. At present, our  work focuses on language technology methodologies for the Swedish language, and the development of linguistic resources and tools for a wide range of genres representing all historical stages of Swedish, in a number of internally and externally funded research projects. A recent but increasingly important area of interest is the application of language technology as a research tool in the humanities and social sciences (digital humanities). In particular, Språkbanken is the national coordinator for the Swedish node of the European CLARIN ERIC and one of the three divisions of a new national research infrastructure.

The deadline for applications is 1st October 2021. The starting date for the position(s) is 1st February, 2022 (or as soon as possible after this date as per agreement).

Announcement >> 

Announcement in Swedish >>

Practical instructions >>

See further information for applicants at: <https://spraakbanken.gu.se/eng/phd-program>.
 

Sida 1