Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Analyser

Här kan du söka bland våra analyser. Du klickar på en rad för att få fram mer information.
Analys Sortera fallande Samlingar Uppgift Enhet Språk
Samling
mink-analyses
Samling av analyser som används i Mink
svenska
sbx-eng-dependency-stanza
Dependensparsning med Stanzas standardmodell för engelska
dependency parsing token engelska
sbx-eng-lemmatization-stanza
Lemmatisering med Stanzas standardmodell för engelska
lemmatization token engelska
sbx-eng-msd-stanza-ufeats
Morfologisk analys för engelska med universal features (UD) baserad på Stanza
morphosyntactic tagging token engelska
sbx-eng-namedentity-stanza
Namnigenkänning (NER) med Stanzas standardmodell för engelska
named entity recognition engelska
sbx-eng-pos-stanza
Annotering av ordklasser (Penn Treebank-taggar) med Stanzas standardmodell för engelska
part-of-speech tagging token engelska
sbx-eng-pos-stanza-upos
Annotering av UD-ordklasser (universal dependencies) med Stanzas standardmodell för engelska
part-of-speech tagging token engelska
sbx-eng-sentence-stanza
Meningssegmentering med Stanzas standardmodell för engelska
sentence segmentation sentence engelska
sbx-eng-tokenization-stanza
Tokenisering med Stanzas standardmodell för engelska
tokenization token engelska
sbx-mul-paragraph-sparv-blanklines
Segmenterar text i stycken utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokenization paragraph
sbx-mul-paragraph-sparv-linebreaks
Segmenterar text i stycken utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
paragraph segmentation paragraph
sbx-mul-paragraph-sparv-whitespace
Segmenterar text i stycken utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
paragraph segmentation paragraph
sbx-mul-sentence-punctuation
Segmenterar text i meningar utifrån skiljetecken med hjälp av NLTKs RegexpTokenizer
sentence segmentation sentence
sbx-mul-sentence-sparv-blanklines
Segmenterar text i meningar utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokenization sentence
sbx-mul-sentence-sparv-linebreaks
Segmenterar text i meningar utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
sentence segmentation sentence
sbx-mul-sentence-sparv-whitespace
Segmenterar text i meningar utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
sentence segmentation sentence
sbx-mul-tokenization-sparv-blanklines
Tokeniserar text utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokenization token
sbx-mul-tokenization-sparv-linebreaks
Tokeniserar text utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
tokenization token
sbx-mul-tokenization-sparv-whitespace
Tokeniserar text utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
tokenization token
sbx-swe-compound-sparv-saldolemgram
Analys av sammansatta SALDO-lemgram inklusive sannolikhetsrankning
compound analysis token svenska
sbx-swe-compound-sparv-saldowords
Analys av sammansatta SALDO-ordformer
compound analysis token svenska
sbx-swe-dependency-malt-treebank
Svensk dependensparsning tränad på Svensk trädbank baserad på MaltParser
dependency parsing token svenska
sbx-swe-dependency-stanza-stanzasynt
Svensk dependensparsning tränad på Svensk trädbank med Stanza
dependency parsing token svenska
sbx-swe-geotagcontext-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
geotagging text svenska
sbx-swe-geotagmetadata-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
geotagging text svenska
sbx-swe-lemgram-sparv-saldo
Uppslagning som ger SALDO-lemgram
lexical lookup token svenska
sbx-swe-lemmatization-sparv-saldo
Fullformsuppslagning som ger SALDO-grundformer
lemmatization token svenska
sbx-swe-lemmatization-sparv-saldo2
SALDO-grundformer plus analys av sammansättningar bestående av SALDO-ingångar
lemmatization token svenska
sbx-swe-lemmatization-stanza-stanzalem
Annotering av grundformer (lemman) med Stanza för svenska tränat på SUC3
lemmatization token svenska
sbx-swe-lexical_classes_text-sparv-blingbring
Lexikala klasser från Blingbring på textnivå
lexical classes text svenska
sbx-swe-lexical_classes_text-sparv-swefn
Lexikala klasser från SweFN på textnivå
lexical classes text svenska
sbx-swe-lexical_classes_token-sparv-blingbring
Lexikala klasser från Blingbring på tokennivå
lexical classes token svenska
sbx-swe-lexical_classes_token-sparv-swefn
Lexikala klasser från SweFN på tokennivå
lexical classes token svenska
sbx-swe-msd-hunpos-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för svenska
morphosyntactic tagging token svenska
sbx-swe-msd-hunpos-suc3-1800
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för 1800-talssvenska
morphosyntactic tagging token svenska
sbx-swe-msd-stanza-stanzamorph-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Stanza för svenska
morphosyntactic tagging token svenska
sbx-swe-msd-stanza-stanzamorph-ufeats
Morfologisk analys för svenska med universal features (UD) baserad på Stanza
morphosyntactic tagging token svenska
sbx-swe-namedentity-swener
Namnigenkänning känner igen och förser namn och namnliknande uttryck (s.k. entiteter) i löpande text med fördefinierade etiketter, som organisation, person eller plats.
named entity recognition svenska
sbx-swe-phrasestructure-sparv
Svensk frasstrukturparsning baserad på Mamba-Dep dependensanalys
phrase structure parsing svenska
sbx-swe-pos-hunpos-suc3
Annotering av SUC-ordklasser med Hunpos för svenska
part-of-speech tagging token svenska
sbx-swe-pos-hunpos-suc3-1800
Annotering av SUC-ordklasser med Hunpos för 1800-talssvenska
part-of-speech tagging token svenska
sbx-swe-pos-stanza-stanzamorph
Annotering av SUC-ordklasser med Stanza för svenska
part-of-speech tagging token svenska
sbx-swe-readability-sparv-lix
Annotering av svenska texter med LIX-värden som indikerar hur lätt eller svår en text är att läsa
readability measures text svenska
sbx-swe-readability-sparv-nk
Annotering av svenska texter med NK-värden som indikerar hur lätt eller svår en text är att läsa
readability measures text svenska
sbx-swe-readability-sparv-ovix
Annotering av svenska texter med OVIX-värden som indikerar hur lätt eller svår en text är att läsa
readability measures text svenska
sbx-swe-sense-sparv-saldo
Uppslagning som ger SALDO-identifierare
lexical lookup token svenska
sbx-swe-sense-wsd
Ordbetydelsedisambiguering baserad på annotering i SALDO
sense disambiguation token svenska
sbx-swe-sentence-punkt-storsuc
Meningssegmenterar text, specialanpassad för svenska
sentence segmentation sentence svenska
sbx-swe-sentiment-sparv-sensaldo
Sentimentanalys via uppslag i SenSALDO-lexikonet
sentiment analysis token svenska
sbx-swe-tokenization-sparv-betterword
Tokeniserar text, specialanpassad för svenska
tokenization token svenska
Samling
standard-analyses-swe
Samling av Sparv-analyser för modern svenska
svenska
swe-sbx-ocr-correction-viklofg-sweocr
Annotering av OCR-korrigeringar.
ocr-correction
swe-sbx-word-prediction-kb-bert
Annotering av ord-predikation för varje text i en text.
word-prediction token