Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Mink

Vad är Mink?

Språkbanken Text är en forskningsinfrastruktur för språkdata. Vi tillgängliggör digital textdata för forskning och utvecklar analysverktyg baserat på språkteknologi.

Med Mink kan du mata in egen textdata i våra verktyg.

Använd Mink på spraakbanken.gu.se/mink

Vem kan använda Mink?

Alla med Edugain-konto kan använda det för att logga in i Mink. Det har de flesta som har en anknytning till ett universitet eller liknande.

Andra användare kan skapa ett EduID-konto vilket i sig är kopplat till Edugain.

Vi arbetar på att tillhandahålla en "demoversion" av Mink som ska kunna användas utan inloggning.

Vi vill också gärna utöka inloggninslösningen för att stödja andra identifieringsmetoder, som BankID, Google eller epost.

Vad kan Mink göra?

Denna första version av Mink är gjort för ett särskilt arbetsflöde:

  1. Skapa en korpus av uppladdade textfiler
  2. Köra automatisk annotering
  3. Använda resultaten i Korp och Strix, eller som xml/csv-filer

Textformat som stöds är:

  • ren text (.txt)
  • xml
  • Microsoft Word (.docx)
  • Open Document (.odt)
  • pdf

Analysen innefattar:

  • Ordklasstaggar
  • Grundform (lemma)
  • Morfosyntaktiska taggar (msd)
  • Dependencies
  • Sentimentanalys

Kommande funktioner

Några målsättningar för utvecklingen kring Mink är utökade annotationsinställningar, delning och publicering, samt arbetsflöden för andra typer av språkdata såsom lexikon.