Hoppa till huvudinnehåll

Analyser

Sök bland våra analyser. Du kan klicka på en rad för att se en utökad beskrivning.
Analys Sortera fallande Typ Samling Uppgift Enhet Språk
sbx-eng-dependency-stanza
Dependensparsning med Stanzas standardmodell för engelska
Analys dependensparsning token engelska
sbx-eng-lemmatization-stanza
Lemmatisering med Stanzas standardmodell för engelska
Analys lemmatisering token engelska
sbx-eng-msd-stanza-ufeats
Morfologisk analys för engelska med universal features (UD) baserad på Stanza
Analys morfosyntaktisk taggning token engelska
sbx-eng-namedentity-stanza
Namnigenkänning (NER) med Stanzas standardmodell för engelska
Analys namnigenkänning engelska
sbx-eng-pos-stanza
Annotering av ordklasser (Penn Treebank-taggar) med Stanzas standardmodell för engelska
Analys ordklasstaggning token engelska
sbx-eng-pos-stanza-upos
Annotering av UD-ordklasser (universal dependencies) med Stanzas standardmodell för engelska
Analys ordklasstaggning token engelska
sbx-eng-sentence-stanza
Meningssegmentering med Stanzas standardmodell för engelska
Analys meningssegmentering mening engelska
sbx-eng-tokenization-stanza
Tokenisering med Stanzas standardmodell för engelska
Analys tokensiering token engelska
sbx-mul-paragraph-sparv-blanklines
Segmenterar text i stycken utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
Analys tokensiering stycke
sbx-mul-paragraph-sparv-linebreaks
Segmenterar text i stycken utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
Analys styckessegmentering stycke
sbx-mul-paragraph-sparv-whitespace
Segmenterar text i stycken utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
Analys styckessegmentering stycke
sbx-mul-sentence-sparv-blanklines
Segmenterar text i meningar utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
Analys tokensiering mening
sbx-mul-sentence-sparv-linebreaks
Segmenterar text i meningar utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
Analys meningssegmentering mening
sbx-mul-sentence-sparv-punctuation
Segmenterar text i meningar utifrån skiljetecken med hjälp av NLTKs RegexpTokenizer
Analys meningssegmentering mening
sbx-mul-sentence-sparv-whitespace
Segmenterar text i meningar utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
Analys meningssegmentering mening
sbx-mul-tokenization-sparv-blanklines
Tokeniserar text utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
Analys tokensiering token
sbx-mul-tokenization-sparv-linebreaks
Tokeniserar text utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
Analys tokensiering token
sbx-mul-tokenization-sparv-whitespace
Tokeniserar text utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
Analys tokensiering token
sbx-swe-compound-sparv-saldolemgram
Analys av sammansatta SALDO-lemgram inklusive sannolikhetsrankning
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses sammamsättningsanalys token svenska
sbx-swe-compound-sparv-saldowords
Analys av sammansatta SALDO-ordformer
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses sammamsättningsanalys token svenska
sbx-swe-dependency-malt-treebank
Svensk dependensparsning tränad på Svensk trädbank baserad på MaltParser
Analys dependensparsning token svenska
sbx-swe-dependency-stanza-stanzasynt
Svensk dependensparsning tränad på Svensk trädbank med Stanza
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses dependensparsning token svenska
sbx-swe-export-sparv-conllu
Export av korpusdata i Språkbanken Texts CoNLL-U-format
Hjälpverktyg export
sbx-swe-geotagcontext-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
Analys sbx-swe-standard_analyses geotaggning text svenska
sbx-swe-geotagmetadata-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
Analys geotaggning text svenska
sbx-swe-lemgram-sparv-saldo
Uppslagning som ger SALDO-lemgram
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala uppslag token svenska
sbx-swe-lemmatization-sparv-saldo
Fullformsuppslagning som ger SALDO-grundformer
Analys lemmatisering token svenska
sbx-swe-lemmatization-sparv-saldo2
SALDO-grundformer plus analys av sammansättningar bestående av SALDO-ingångar
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses lemmatisering token svenska
sbx-swe-lemmatization-stanza-stanzalem
Annotering av grundformer (lemman) med Stanza för svenska tränat på SUC3
Analys lemmatisering token svenska
sbx-swe-lexical_classes_text-sparv-blingbring
Lexikala klasser från Blingbring på textnivå
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala klasser text svenska
sbx-swe-lexical_classes_text-sparv-swefn
Lexikala klasser från SweFN på textnivå
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala klasser text svenska
sbx-swe-lexical_classes_token-sparv-blingbring
Lexikala klasser från Blingbring på tokennivå
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala klasser token svenska
sbx-swe-lexical_classes_token-sparv-swefn
Lexikala klasser från SweFN på tokennivå
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses lexikala klasser token svenska
Samling
sbx-swe-mink_analyses
Samling av analyser som används i Mink
Analys, Samling svenska
sbx-swe-msd-hunpos-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för svenska
Analys morfosyntaktisk taggning token svenska
sbx-swe-msd-hunpos-suc3-1800
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för 1800-talssvenska
Analys morfosyntaktisk taggning token svenska
sbx-swe-msd-stanza-stanzamorph-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Stanza för svenska
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses morfosyntaktisk taggning token svenska
sbx-swe-msd-stanza-stanzamorph-ufeats
Morfologisk analys för svenska med universal features (UD) baserad på Stanza
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses morfosyntaktisk taggning token svenska
sbx-swe-namedentity-swener
Namnigenkänning känner igen och förser namn och namnliknande uttryck (s.k. entiteter) i löpande text med fördefinierade etiketter, som organisation, person eller plats.
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses namnigenkänning svenska
sbx-swe-ocr_correction-viklofg_sweocr
Annotering av OCR-korrigeringar.
Analys OCR-korrigering
sbx-swe-phrasestructure-sparv
Svensk frasstrukturparsning baserad på Mamba-Dep dependensanalys
Analys frasstrukturparsning svenska
sbx-swe-pi_detection-sparv
En Sparv-plugin som möjliggör upptäckt och annotering av personlig information i svenska texter, särskilt L2 uppsatser.
Analys personuppgiftsigenkänning token
sbx-swe-pos-hunpos-suc3
Annotering av SUC-ordklasser med Hunpos för svenska
Analys ordklasstaggning token svenska
sbx-swe-pos-hunpos-suc3-1800
Annotering av SUC-ordklasser med Hunpos för 1800-talssvenska
Analys ordklasstaggning token svenska
sbx-swe-pos-stanza-stanzamorph
Annotering av SUC-ordklasser med Stanza för svenska
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses ordklasstaggning token svenska
sbx-swe-readability-sparv-lix
Annotering av svenska texter med LIX-värden som indikerar hur lätt eller svår en text är att läsa
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses läsbarhetsvärden text svenska
sbx-swe-readability-sparv-nk
Annotering av svenska texter med NK-värden som indikerar hur lätt eller svår en text är att läsa
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses läsbarhetsvärden text svenska
sbx-swe-readability-sparv-ovix
Annotering av svenska texter med OVIX-värden som indikerar hur lätt eller svår en text är att läsa
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses läsbarhetsvärden text svenska
sbx-swe-sense-sparv
Ordbetydelsedisambiguering baserad på annotering i SALDO
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses betydelsedisambiguering token svenska
sbx-swe-sense-sparv-saldo
Uppslagning som ger SALDO-identifierare
Analys lexikala uppslag token svenska
sbx-swe-sentence-sparv-storsuc
Meningssegmenterar text, specialanpassad för svenska
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses meningssegmentering mening svenska
sbx-swe-sentiment-sparv-sensaldo
Sentimentanalys via uppslag i SenSALDO-lexikonet
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses sentimentanalys token svenska
sbx-swe-speech2text-transformers-kb_whisper_mp3
Transkription av ljudfil (mp3) till text med transformers och KB-Whisper för svenska
Hjälpverktyg svenska
sbx-swe-speech2text-transformers-kb_whisper_ogg
Transkription av ljudfil (ogg) till text med transformers och KB-Whisper för svenska
Hjälpverktyg svenska
sbx-swe-speech2text-transformers-kb_whisper_wav
Transkription av ljudfil (wav) till text med transformers och KB-Whisper för svenska
Hjälpverktyg svenska
Samling
sbx-swe-standard_analyses
Samling av Sparv-analyser för modern svenska
Analys, Samling svenska
sbx-swe-tokenization-sparv-betterword
Tokeniserar text, specialanpassad för svenska
Analys sbx-swe-mink_analyses, sbx-swe-standard_analyses tokensiering token svenska
sbx-swe-word_prediction-kb_bert
Annotering av ord-predikation för varje text i en text.
Analys ordförutsägelse token
sbx-zxx-export-sparv-xml_preserved
XML-korpusexport som bevarar formateringen från källfilen
Hjälpverktyg export
sbx-zxx-export-sparv-xml_pretty
XML-korpusexport där varje token skrivs på en egen rad
Hjälpverktyg export
sbx-zxx-export-sparv-xml_scrambled
XML-korpusexport med omkastat innehåll
Hjälpverktyg export