Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Analyser

Sök bland våra analyser. Du kan klicka på en rad för att se en utökad beskrivning.
Analys Sortera fallande Samling Uppgift Enhet Språk
sbx-eng-dependency-stanza
Dependensparsning med Stanzas standardmodell för engelska
dependensparsning token engelska
sbx-eng-lemmatization-stanza
Lemmatisering med Stanzas standardmodell för engelska
lemmatisering token engelska
sbx-eng-msd-stanza-ufeats
Morfologisk analys för engelska med universal features (UD) baserad på Stanza
morfosyntaktisk taggning token engelska
sbx-eng-namedentity-stanza
Namnigenkänning (NER) med Stanzas standardmodell för engelska
namnigenkänning engelska
sbx-eng-pos-stanza
Annotering av ordklasser (Penn Treebank-taggar) med Stanzas standardmodell för engelska
ordklasstaggning token engelska
sbx-eng-pos-stanza-upos
Annotering av UD-ordklasser (universal dependencies) med Stanzas standardmodell för engelska
ordklasstaggning token engelska
sbx-eng-sentence-stanza
Meningssegmentering med Stanzas standardmodell för engelska
meningssegmentering mening engelska
sbx-eng-tokenization-stanza
Tokenisering med Stanzas standardmodell för engelska
tokensiering token engelska
sbx-mul-paragraph-sparv-blanklines
Segmenterar text i stycken utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokensiering stycke
sbx-mul-paragraph-sparv-linebreaks
Segmenterar text i stycken utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
styckessegmentering stycke
sbx-mul-paragraph-sparv-whitespace
Segmenterar text i stycken utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
styckessegmentering stycke
sbx-mul-sentence-sparv-blanklines
Segmenterar text i meningar utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokensiering mening
sbx-mul-sentence-sparv-linebreaks
Segmenterar text i meningar utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
meningssegmentering mening
sbx-mul-sentence-sparv-punctuation
Segmenterar text i meningar utifrån skiljetecken med hjälp av NLTKs RegexpTokenizer
meningssegmentering mening
sbx-mul-sentence-sparv-whitespace
Segmenterar text i meningar utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
meningssegmentering mening
sbx-mul-tokenization-sparv-blanklines
Tokeniserar text utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokensiering token
sbx-mul-tokenization-sparv-linebreaks
Tokeniserar text utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
tokensiering token
sbx-mul-tokenization-sparv-whitespace
Tokeniserar text utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
tokensiering token
sbx-swe-compound-sparv-saldolemgram
Analys av sammansatta SALDO-lemgram inklusive sannolikhetsrankning
sbx-swe-mink_analyses, sbx-swe-standard_analyses sammamsättningsanalys token svenska
sbx-swe-compound-sparv-saldowords
Analys av sammansatta SALDO-ordformer
sbx-swe-mink_analyses, sbx-swe-standard_analyses sammamsättningsanalys token svenska
sbx-swe-dependency-malt-treebank
Svensk dependensparsning tränad på Svensk trädbank baserad på MaltParser
dependensparsning token svenska
sbx-swe-dependency-stanza-stanzasynt
Svensk dependensparsning tränad på Svensk trädbank med Stanza
sbx-swe-mink_analyses, sbx-swe-standard_analyses dependensparsning token svenska
sbx-swe-geotagcontext-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
sbx-swe-standard_analyses geotaggning text svenska
sbx-swe-geotagmetadata-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
geotaggning text svenska
sbx-swe-lemgram-sparv-saldo
Uppslagning som ger SALDO-lemgram
sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala uppslag token svenska
sbx-swe-lemmatization-sparv-saldo
Fullformsuppslagning som ger SALDO-grundformer
lemmatisering token svenska
sbx-swe-lemmatization-sparv-saldo2
SALDO-grundformer plus analys av sammansättningar bestående av SALDO-ingångar
sbx-swe-mink_analyses, sbx-swe-standard_analyses lemmatisering token svenska
sbx-swe-lemmatization-stanza-stanzalem
Annotering av grundformer (lemman) med Stanza för svenska tränat på SUC3
lemmatisering token svenska
sbx-swe-lexical_classes_text-sparv-blingbring
Lexikala klasser från Blingbring på textnivå
sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala klasser text svenska
sbx-swe-lexical_classes_text-sparv-swefn
Lexikala klasser från SweFN på textnivå
sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala klasser text svenska
sbx-swe-lexical_classes_token-sparv-blingbring
Lexikala klasser från Blingbring på tokennivå
sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala klasser token svenska
sbx-swe-lexical_classes_token-sparv-swefn
Lexikala klasser från SweFN på tokennivå
sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala klasser token svenska
Samling
sbx-swe-mink_analyses
Samling av analyser som används i Mink
svenska
sbx-swe-msd-hunpos-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för svenska
morfosyntaktisk taggning token svenska
sbx-swe-msd-hunpos-suc3-1800
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för 1800-talssvenska
morfosyntaktisk taggning token svenska
sbx-swe-msd-stanza-stanzamorph-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Stanza för svenska
sbx-swe-mink_analyses, sbx-swe-standard_analyses morfosyntaktisk taggning token svenska
sbx-swe-msd-stanza-stanzamorph-ufeats
Morfologisk analys för svenska med universal features (UD) baserad på Stanza
sbx-swe-mink_analyses, sbx-swe-standard_analyses morfosyntaktisk taggning token svenska
sbx-swe-namedentity-swener
Namnigenkänning känner igen och förser namn och namnliknande uttryck (s.k. entiteter) i löpande text med fördefinierade etiketter, som organisation, person eller plats.
sbx-swe-mink_analyses, sbx-swe-standard_analyses namnigenkänning svenska
sbx-swe-phrasestructure-sparv
Svensk frasstrukturparsning baserad på Mamba-Dep dependensanalys
frasstrukturparsning svenska
sbx-swe-pos-hunpos-suc3
Annotering av SUC-ordklasser med Hunpos för svenska
ordklasstaggning token svenska
sbx-swe-pos-hunpos-suc3-1800
Annotering av SUC-ordklasser med Hunpos för 1800-talssvenska
ordklasstaggning token svenska
sbx-swe-pos-stanza-stanzamorph
Annotering av SUC-ordklasser med Stanza för svenska
sbx-swe-mink_analyses, sbx-swe-standard_analyses ordklasstaggning token svenska
sbx-swe-readability-sparv-lix
Annotering av svenska texter med LIX-värden som indikerar hur lätt eller svår en text är att läsa
sbx-swe-mink_analyses, sbx-swe-standard_analyses läsbarhetsvärden text svenska
sbx-swe-readability-sparv-nk
Annotering av svenska texter med NK-värden som indikerar hur lätt eller svår en text är att läsa
sbx-swe-mink_analyses, sbx-swe-standard_analyses läsbarhetsvärden text svenska
sbx-swe-readability-sparv-ovix
Annotering av svenska texter med OVIX-värden som indikerar hur lätt eller svår en text är att läsa
sbx-swe-mink_analyses, sbx-swe-standard_analyses läsbarhetsvärden text svenska
sbx-swe-sense-sparv
Ordbetydelsedisambiguering baserad på annotering i SALDO
sbx-swe-mink_analyses, sbx-swe-standard_analyses betydelsedisambiguering token svenska
sbx-swe-sense-sparv-saldo
Uppslagning som ger SALDO-identifierare
lexikala uppslag token svenska
sbx-swe-sentence-sparv-storsuc
Meningssegmenterar text, specialanpassad för svenska
sbx-swe-mink_analyses, sbx-swe-standard_analyses meningssegmentering mening svenska
sbx-swe-sentiment-sparv-sensaldo
Sentimentanalys via uppslag i SenSALDO-lexikonet
sbx-swe-mink_analyses, sbx-swe-standard_analyses sentimentanalys token svenska
Samling
sbx-swe-standard_analyses
Samling av Sparv-analyser för modern svenska
svenska
sbx-swe-tokenization-sparv-betterword
Tokeniserar text, specialanpassad för svenska
sbx-swe-mink_analyses, sbx-swe-standard_analyses tokensiering token svenska