Metod
Strategianalys analyserar strategidokument genom tre huvudpelare och kompletterande ramverk. Varje pelare belyser en aspekt av dokumentets kvalitet: innehåll, form och språk.
Analysen går längre än att räkna ord. Verktyget läser meningar och förstår deras grammatiska struktur med hjälp av NLP (spaCy). Det gör det möjligt att skilja ett faktiskt åtagande ("kommunen ska utveckla digitala tjänster för invånarna") från en vag ambition ("vi vill bidra till utveckling"). En mänsklig läsare gör samma bedömning intuitivt; verktyget gör det systematiskt över hela dokumentet.
Kärnan i analysen är lemmabaserad lexikonmatchning – varje ord återförs till sin grundform och jämförs mot forskningsbaserade ordlistor. Det är verbet som avgör åtagandets styrka (ska vs kan), och kontexten som avgör vem som berörs (invånare = externt, medarbetare = internt).
Ordlistorna (lexikonen) med strategiska termer har tagits fram genom analys av närmare 2 000 strategidokument från svensk offentlig sektor. Bakom analysen ligger en strategi-ontologi som definierar hur begrepp som drivkrafter, avsikter, handlingar, förmågor och aktörer relaterar till varandra – den teoretiska grunden för vad verktyget letar efter och varför.
Visa alla lexikon → · Strategi-ontologi →
STRAT
Sammansatt forskningsindex som viktar strategiskt innehåll, dokumentstruktur och språkkvalitet lika. Varje pelare jämförs först mot dokumentsamlingens fördelning (percentil 0–100) innan medelvärdet beräknas. Detta hindrar pelare med hög varians (STA7) från att dominera indexet. Som alla index är det en förenkling – det ersätter inte professionellt omdöme eller dialog om strategins faktiska kvalitet.
Högt = bredare strategi. BLA-percentilen inverteras eftersom högt BLA = mer byråkratiskt.
Det gamla råa medelvärdet (utan percentil-konvertering) finns kvar som
combined_score_legacy för transparens.
LUFT
Listkvot, Utfallsmått, Floskler, Truismer, Redundans. Separat varningsindex som mäter andelen tomma formuleringar. 0 = bra, 100 = varm luft.
- L – listkvot (andel punktlistor av totalt innehåll)
- U – utfallsmått/kvantitativa mål per 1000 ord
- F – floskler (superlativer, vaga ambitioner, tomma verb, tomma förstärkare)
- T – truismer (påståenden vars motsats är absurd)
- R – redundans (upprepningar mellan stycken, Jaccard-likhet)
Fördjupning: truism-detektor, kalibrering och koppling till riktning →
1. Strategitavlan – innehåll
Mäter vilka strategiska element dokumentet adresserar: utmaning, antaganden, avsikt, värde, målbilder, förmågor och friktion. Varje element matchas genom lemmabaserad lexikonmatchning – alla böjningsformer av ett ord behandlas som samma term.
Fördjupning: 7 element, vikter, värde- och förmågesubtyper →
2. DNA – form
Mäter hur dokumentet är konstruerat – inte vad det säger. Tre dimensioner med 18 sub-mått jämförs mot över 800 strategidokument. 50 = medianen, 75 = bättre än 75%.
- Driv – propositionstäthet, verbrikedom, åtagandegrad (8 sub-mått)
- Nomenklatur – terminologi, ordförråd, retoriska mönster (7 sub-mått)
- Anatomi – struktur, läsbarhet, progression, specificitet (12 sub-mått)
Fördjupning: 3 dimensioner, 27 sub-mått, percentilberäkning →
3. BLA – språk
Byråkratisk-lexikal analys. Mäter språklig komplexitet med 9 viktade lingvistiska mått – läsbarhet, ordvariation, nominaliseringar, passiv form och mer. Högt = mer byråkratiskt.
4. Strategisk riktning
Placerar dokumentet i en fyrfältare: effektivitet–innovation × internt–externt. Bygger på lemmabaserad lexikonmatchning mot Marchs (1991) exploration/exploitation-ramverk. Kalibrerad mot 480 manuellt kodade uttalanden (94% överensstämmelse).
5. MÅL – målstruktur
Extraherar och analyserar mål ur dokumentet: hur många, på vilken nivå (vision/strategisk/taktisk), hur de hänger ihop (målkedjor), och om de har ansvarig, tidsram och mätbarhet. Skiljer mellan strategi och plan genom att leta efter vägval och avgränsningar.
- Målextraktion via frasmarkörer, modalverb och rubrikkontext
- Klassificering: vision, strategisk, taktisk nivå
- Kedjeanalys: kausala ("för att") och hierarkiska kopplingar
- Agens, tidsättning, mätbarhet per mål
- Strategiskt val-diagnos: prioriteringar, avgränsningar, avvägningar
6. Strategisk dissonans
Mäter avståndet mellan vad dokumentet pratar om (diskurs), vad det önskar (aspiration) och vad det faktiskt åtar sig (åtagande). Ett dokument kan ha tydlig riktning men ändå lida av dissonans – om det pratar om innovation men bara åtar sig effektivisering.
Tre gap: retoriskt gap (diskurs vs aspiration), trovärdighetsglapp (aspiration vs åtagande) och total dissonans (diskurs vs åtagande). Högt värde = stor skillnad mellan ord och handling.
Fördjupning: dissonansberäkning och LUFT × dissonans-matris →
7. Policy – strategi – plan
Placerar dokumentet på ett kontinuum från ren policy (principiell riktning) till ren plan (konkret handling). Strategin är bryggan däremellan.
8. Referenser
Mäter dokumentets koppling till omvärlden:
- Hänvisningsfraser, lagstiftning (SFS, EU), statliga utredningar (SOU, Ds, Prop)
- Organisationsreferenser (DIGG, SKR, OECD)
9. Integration
Jämför två eller fler dokument mot varandra: tematisk överlappning, terminologisk samstämmighet och strategisk riktning. Använder TF-IDF för att identifiera delad och unik terminologi mellan dokumenten.
- Ordöverlappning (Jaccard) och terminologisk likhet (TF-IDF cosinus)
- Riktningsjämförelse i fyrfältaren – pekar dokumenten åt samma håll?
- Per-kategori-jämförelse mot dokumentsamlingen
10. Principtyper
Klassificerar vägledande principer efter Eisenhardt & Sulls (2001) ramverk: hur-regler, gränsregler, prioriteringsregler, tidsregler och exitregler. Visar vilka typer av vägledning dokumentet ger – och vilka som saknas.
11. Tonalitet
Profilerar dokumentets tonalitet längs tre dimensioner: deklarativ/tentativ (hur bestämt), konkret/abstrakt (hur specifikt) och sentiment (positiv/neutral/negativ). Bygger på BLA-komponenterna och spaCy-annoteringar.
12. Tidsperspektiv
Analyserar dokumentets tidsfördelning: hur stor andel av texten som handlar om dåtid (lägesbeskrivning), nutid (pågående arbete) och framtid (åtaganden och ambitioner). Använder spaCy-morfologi och svenska framtidsauxiliarer (ska, komma att, böra).
Längdnormalisering
Råa ordkvoter gör långa dokument automatiskt bättre: fler signaler hittas, fler element täcks, fler domäner nämns. För att mäta kvalitet och inte längd används fem normaliseringsprinciper.
- Global densitet per 1000 ord – helhets-mått (floskler, truismer) divideras med dokumentets längd. Speglar dokumentets genomsnittliga karaktär.
- Rullande densitet (moving-density) – kvalitetsmarkörer (klarhets-signaler, prioriteringsmarkörer, bärande antaganden, mål, capability slack) mäts som genomsnittlig lokal densitet i glidande 100-ords fönster. Ett långt dokument med spridda signaler får lägre poäng än ett kort dokument med koncentrerad strategi. Samma princip som MATTR, men för signal-counts. Teoretisk grund: Altmann et al. (2009) visar att ordförekomster burstar i kluster och inte följer Poisson.
- Topp-densitet (peak-density) – komplement till moving-density som bevarar information om den tätaste 100-ords regionen i dokumentet. Används för mål: ett kort intensivt mål-avsnitt i ett långt dokument får kredit för sin toppkoncentration istället för att spädas ut över hela texten.
- MATTR (Moving-Average Type-Token Ratio, Covington & McFall 2010) – lexikal diversitet i glidande fönster (30–100 ord). Längd-invariant till skillnad från Guiraud eller ordförrådsstorlek. Används för DNA-substantiv, verb, adjektiv, noun chunks och propositioners subjekt.
- Percentil mot fryst baseline + Binned Term Count – aggregerade poäng (STRAT, DNA-dimensioner, MÅL-composite) jämförs mot fördelningen bland 815 strategidokument (baseline v2-2026-04-18). STRAT beräknas som medelvärdet av pelarnas percentiler (STA7, DNA, 100-BLA). MÅL-composite använder Binned Term Count (Shehzad et al. 2022): antalet mål trunkeras vid 95:e percentilen före percentil-jämförelse, för att hindra långa dokument med ovanligt många mål från att inflatera poängen.
Minimumslängdströskel. Dokument kortare än 500 ord har för få signaler för att ratio-baserade mått (som friktions-fokus unmanaged / total) ska vara stabila. Under tröskeln används istället en absolut räkne-regel. Grund: Moisl (2011) minimum document length för pålitlig klustring, Shi et al. (2020) lexikalrikedom stabiliseras först vid ~1000 tokens.
Rumelt-linjen. Långa utspädda strategidokument får lägre densitet och därmed lägre poäng – det är en medveten egenskap, inte ett fel. Rumelt (2011) kritiserar explicit svällda strategier som maskerar brist på fokus.
Regression mot medelvärdet. STRAT som medelvärde av tre pelar-percentiler komprimerar extremer mot median: ett dokument med extremt hög STA7-percentil (99) landar oftast runt 69 på STRAT eftersom pelarna är svagt korrelerade (ρ < 0,26). Detta är en känd egenskap hos composite-index (Nardo et al. 2005, OECD-handbook; jfr HDI, GII). STRAT ska därför läsas som en breddindikator – pelarna STA7, DNA och BLA visas alltid separat för nyans.
För transparens bevaras både normaliserade poäng (score) och
legacy-värden (score_legacy) som API-fält, så läsaren kan
jämföra. Alla förändringar av scoring-formeln bumpar versionen
(analysis_version i svaret) vilket invaliderar gamla cache-resultat.
Baslinje (dokumentsamling)
Alla analyser jämför mot över 800 strategidokument:
- Digitaliserings- och hållbarhetsstrategier
- Kommuner, regioner och myndigheter
- Tidsperiod: 2006–2025
- Baslinje v2-2026-04-18 (n=815) – fryst för reproducerbarhet
- Analyserade inom STRATEGIOS