Meny

L2 profiler för svenska

Fullständiga titeln: Utveckling av lexikala och grammatiska kompetenser i invandrarsvenska, RJ, 2018-2020 (-2021)

Bakgrund

Fler invandrare söker sig till Sverige och det blir alltmer viktigt att kunna lära ut svenska som andraspråk (eller främmande språk) (L2) på bästa möjliga sätt. Detta betyder att det finns ett större behov än någonsin av att lära ut svenska och att testa kunskapsnivåer i svenska. Dessutom finns det förstås ett behov av att förstå och enas om vad olika nivåer betyder. De senaste åren har sett nya metoder för att studera språkutvecklingen inom L2 bl.a. med hjälp av inlärarkorpusar.

Allmän beskrivning

För svenska finns det ytterst få sådana studier, men Språkbanken har en inlärarkorpus med uppsatser och en kursbokskorpus (för L2 svenska) som lämpar sig för sådana studier. Texterna i korpusarna är kopplade till det ramverk för språkkvalifikationer som EU antog för ett drygt decennium sedan. I detta projekt vill vi med hjälp av de två korpusarna titta på hur många ord och uttryck som studenter av L2 svenska kan förstå och producera. Hur ändrar sig studenters språk grammatiskt när deras språk utvecklar sig? Hur överensstämmer studenternas utveckling med utvecklingen i kursböckerna? Projektet kommer även att bidra med kunskap kring hur vi undervisar vokabulär och grammatik i L2 svenska utifrån vår studie av textbokstexter. Vi har dessutom förhoppningar om att kunna se hur inlärningsmönstren påverkas av läroböckerna och hur de faktiska inlärningsmönstren i korpusarna överensstämmer med tidigare konstaterade inlärningsgångar inom andraspråksforskning.

Institutioner/organisationer

Finansiering

Projektet finansieras av Riksbankens Jubileumsfond under 2018-2020 via anslaget P17-0716:1

Visioner och planer

2018 

  • Lexikala profiler: ordbetydelse-baserade ordlistor SenSVALex, SenSweLLex
  • Resurs-förberedande arbete: transkribering och anonymisering av SweLL-piloten
  • Experiment med nivålänkning (Flerordsenheter, L2 engelska)

2019

  • Legato verktyg för den lexikografiska annotering
  • Lexikografiska annotering (guidelines, praktiskt arbete med assistenter/lexikografer)
  • Storskalig experiment med nivålänkning  (Flerordsenheter, L2 svenska), inkl kapitel i en bok
  • Pilotstudie om bestämdhet på olika utvecklingsnivåer (som ett förberedande steg inför storskaligt arbete med grammatiska profiler)
  • Manuell kontroll av (automatiska) annoteringskvalitén (SweLL-pilot & COCTAILL)

2020

  • Grammatiska profiler: receptiv, produktiv
  • Internationell workshop om CEFR-baserade grammatiska profiler (criterial features)
  • Fokus för grammatiska profiler: bestämdhet, passiv, prepositioner, verb fraser, nominala fraser, ...
  • Lexicala profiler - avsluta annotering viaLegato
  • Analys av lexikala profiler med hjälp av komplexa nätverk
  • Empirisk analys och utvärdering av lexikala profiler
  • Användargränssnitt för lexikala profiler
  • Nivå-länkning
  • Internationell CEFRLex workshop,
  • Integrering av projektets resultat till Reference Level Descriptions (EU generic initiative) (?)

2021 

  • Utvärdering med användare
  • Integrering av parsningsalgoritmer som en del av L2-specifika sökningar inom Korp och Strix 
  • Användargränssnitt för grammatiska profiler
  • Visualisering av CA(F) modell (?)

Presentationer

  • Elena Volodina, Therese Lindström Tiedemann (September, 2019) L2 profiler: Halvvägs rapport [slides]
  • David Alfter. (September, 2019) The LEGATO annotation tool. Presentation at Språkbanken's kick-off. Gothenburg, Sweden. [slides]
  • David Alfter. (March, 28, 2019). Idiomaticity and complexity - An L2-oriented perspective. A regular talk at Språkbanken-Text, Göteborg, Sverige.
  • Therese Lindström Tiedemann. 2019. Konferenspresentation. Prepositionernas frekvens i L2 svenska – utvecklingen över CEFR-nivåer, Svenskans beskrivning 37, Åbo akademi, Åbo (Turku), Finland [Book of abstracts]
  • Elena Volodina (April,11, 2019). Crowdsourcing for language learning: looking for potential. A regular research seminar at Språkbanken-Text, Gothenburg, Sweden.
  • Elena Volodina (April, 3, 2019). Crowdsourcing for language learning: looking for potential. Louvain-la-Neuve, Belgium, guest talk. [pdf]
  • Jaka Čibej (March, 14, 2019). MWEs and crowdsourcing. Outline and results. Lisbon, Portugal, A talk at enet-Collect annual meeting, Work Group 1. [pdf]
  • Eeva-Liisa Nyqvist & Therese Lindström Tiedemann. 2019, 30 jan., Forskningsseminariet i nordiska språk, Åbo universitet. Hur behärskar finska språkbadselever passiv i åk 6 (12 år) och åk 9 (15 år)? [Abstract]
  • Elena Volodina (December, 6, 2018) Introduction to the pre-workshop MWE experiment [slides]
  • Jaka Čibej & David Alfter (December 6, 2018) Experiment set up and results of the MWE experiment [Slides Jaka] [Slides David]
  • Eeva-Liisa Nyqvist & Therese Lindström Tiedemann. 2018, 28 nov., Forskningsseminariet i nordiska språk och svensk översättning, Helsingfors universitet. Hur behärskar finska språkbadselever passiv i åk 6 (12 år) och åk 9 (15 år)?
  • Eeva-Liisa Nyqvist & Therese Lindström Tiedemann. 2018, May, 15. Hur behärskar finska språkbadselever passiv i åk 6 (12 år) och åk 9 (15 år)? Oslo, Gramino conference. [abstract] [slides]
  • Therese Lindström Tiedemann. 2018, May 3. Profiling L2 Swedish: need-to-know and good-to-know competences. Presentation at a work-in-progress seminar on first-language and second-language writing. In connection to Symposium on language learning and use. Uppsala, Sweden.
  • Therese Lindström Tiedemann. 2018, February. A linguist’s use of L2 corpora – The Swedish passive, a case study. SB-talk, University of Gothenburg [Slides]
  • Therese Lindström Tiedemann. 2017, December. Case study: Studying the Swedish passive. Clarin workshop on Interoperability of L2 resources and tools, Gothenburg. [Slides]
  • Therese Lindström Tiedemann. 2017, October. Att bli aktiv i svenska med passiva verb. Svenskans Beskrivning 2017, Uppsala [abstract]
  • Therese Lindström Tiedemann. 2017, May. När passiv lärs in. Svenskan i Finland. [abstracts]

Publikationer

2019

  • David Alfter and Johannes Graën. 2019. Interconnecting lexical resources and word alignment: How do learners get on with particle verbs? Proceedings of Nodalida 2019, Turku, Finland. LiUP Press.
  • David Alfter and Elena Volodina. 2019. From river to bank: The importance of sense-based graded word lists. Proceedings of EuroCALL 2019
  • David Alfter, Therese Lindström Tiedemann and Elena Volodina. 2019. LEGATO: A flexible lexicographic annotation tool. Nodalida 2019, Turku, Finland. LiUP Press.
  • David Alfter, Lars Borin, Ildikó Pilán, Therese Lindström Tiedemann, Elena Volodina. 2019. From Language Learning Platform to Infrastructure for Research on Language Learning. CLARIN-2018 post-conference volume. LiUP Press. [pdf]
  • Stemle Egon W, Boyd Adrian, Janssen Maarten, Lindström Tiedemann Therese, Mikelić Preradović Nives, Rosen Alexandr, Rosén Dan & Volodina, Elena. (2019) Working together towards an ideal infrastructure for language learner corpora. 4th Learner Corpus Research Conference. Post-conference volume.

2018

  • David Alfter and Elena Volodina. (2018). Is the whole greater than the sum of its parts? A corpus-based pilot study of the lexical complexity in multi-word expressions. Proceedings of SLTC, Stockholm, November 2018.
  • Lindström Tiedemann, Therese, Lenardic Jakob & Fiser Darja. (2018). L2 learner corpus survey – towards improved verifiability, reproducibility and inspiration in learner corpus research. Annual Clarin 2018.
  • Alfter, David, & Volodina, Elena (2018) Towards Single Word Lexical Complexity Prediction. In Proceedings of the Thirteenth Workshop on Innovative Use of NLP for Building Educational Applications (pp. 79-88) at NAACL-2018 [pdf]

Projektrelaterade evenemang

  • Internt möte med Dr. Thomas Francois, om aspekterna av CEFR-baserad lexikal profilering, följt av inbjudet föredrag på 8th NLP4CALL workshop. September, 29 - Oktober 2, 2019.
  • Internt workshop med Prof. Jan Hustijn, med fokus på projektets mäl (grammatiska aspekter) och BLC (Basic Language Cognition Model), följt av ett inbjudet föredrag på 7th NLP4CALL workshop. November, 6-7, 2018.
  • Internationell workshop (och ett storskaligt experiment) om länkning av flerordsuttryck till L2 färdighetsnivåer. Juni-december 2018. [Webbsida]

Relaterade länkar

 

Publikationer

Laddar...