Metod

Strategianalys analyserar strategidokument genom tre huvudpelare och kompletterande ramverk. Varje pelare belyser en aspekt av dokumentets kvalitet: innehåll, form och språk.

Analysen går längre än att räkna ord. Verktyget läser meningar och förstår deras grammatiska struktur med hjälp av NLP (spaCy). Det gör det möjligt att skilja ett faktiskt åtagande ("kommunen ska utveckla digitala tjänster för invånarna") från en vag ambition ("vi vill bidra till utveckling"). En mänsklig läsare gör samma bedömning intuitivt; verktyget gör det systematiskt över hela dokumentet.

Kärnan i analysen är lemmabaserad lexikonmatchning – varje ord återförs till sin grundform och jämförs mot forskningsbaserade ordlistor. Det är verbet som avgör åtagandets styrka (ska vs kan), och kontexten som avgör vem som berörs (invånare = externt, medarbetare = internt).

Ordlistorna (lexikonen) med strategiska termer har tagits fram genom analys av närmare 2 000 strategidokument från svensk offentlig sektor. Bakom analysen ligger en strategi-ontologi som definierar hur begrepp som drivkrafter, avsikter, handlingar, förmågor och aktörer relaterar till varandra – den teoretiska grunden för vad verktyget letar efter och varför.

Visa alla lexikon → · Strategi-ontologi →

STRAT

Sammansatt forskningsindex som viktar strategiskt innehåll, dokumentstruktur och språkkvalitet lika. Varje pelare jämförs först mot dokumentsamlingens fördelning (percentil 0–100) innan medelvärdet beräknas. Detta hindrar pelare med hög varians (STA7) från att dominera indexet. Som alla index är det en förenkling – det ersätter inte professionellt omdöme eller dialog om strategins faktiska kvalitet.

STRAT = \frac{pct (STA7) + pct (DNA) + (100 - pct (BLA))}{3} \to 0 - 100

Högt = bredare strategi. BLA-percentilen inverteras eftersom högt BLA = mer byråkratiskt. Det gamla råa medelvärdet (utan percentil-konvertering) finns kvar som combined_score_legacy för transparens.

LUFT

Listkvot, Utfallsmått, Floskler, Truismer, Redundans. Separat varningsindex som mäter andelen tomma formuleringar. 0 = bra, 100 = varm luft.

LUFT = max (F, T) \times 0.65 + \frac{F + T}{2} \times 0.25 + L \times 0.05 + U \times 0.05 + R \times 0.10 \to 0 - 100

L – listkvot (andel punktlistor av totalt innehåll)
U – utfallsmått/kvantitativa mål per 1000 ord
F – floskler (superlativer, vaga ambitioner, tomma verb, tomma förstärkare)
T – truismer (påståenden vars motsats är absurd)
R – redundans (upprepningar mellan stycken, Jaccard-likhet)

Fördjupning: truism-detektor, kalibrering och koppling till riktning →

1. Strategitavlan – innehåll

Mäter vilka strategiska element dokumentet adresserar: utmaning, antaganden, avsikt, värde, målbilder, förmågor och friktion. Varje element matchas genom lemmabaserad lexikonmatchning – alla böjningsformer av ett ord behandlas som samma term.

Fördjupning: 7 element, vikter, värde- och förmågesubtyper →

2. DNA – form

Mäter hur dokumentet är konstruerat – inte vad det säger. Tre dimensioner med 18 sub-mått jämförs mot över 800 strategidokument. 50 = medianen, 75 = bättre än 75%.

Driv – propositionstäthet, verbrikedom, åtagandegrad (8 sub-mått)
Nomenklatur – terminologi, ordförråd, retoriska mönster (7 sub-mått)
Anatomi – struktur, läsbarhet, progression, specificitet (12 sub-mått)

Fördjupning: 3 dimensioner, 27 sub-mått, percentilberäkning →

3. BLA – språk

Byråkratisk-lexikal analys. Mäter språklig komplexitet med 9 viktade lingvistiska mått – läsbarhet, ordvariation, nominaliseringar, passiv form och mer. Högt = mer byråkratiskt.

Fördjupning: 9 komponenter, vikter och normalisering →

4. Strategisk riktning

Placerar dokumentet i en fyrfältare: effektivitet–innovation × internt–externt. Bygger på lemmabaserad lexikonmatchning mot Marchs (1991) exploration/exploitation-ramverk. Kalibrerad mot 480 manuellt kodade uttalanden (94% överensstämmelse).

Fördjupning: tre lager, validering och begränsningar →

5. MÅL – målstruktur

Extraherar och analyserar mål ur dokumentet: hur många, på vilken nivå (vision/strategisk/taktisk), hur de hänger ihop (målkedjor), och om de har ansvarig, tidsram och mätbarhet. Skiljer mellan strategi och plan genom att leta efter vägval och avgränsningar.

Målextraktion via frasmarkörer, modalverb och rubrikkontext
Klassificering: vision, strategisk, taktisk nivå
Kedjeanalys: kausala ("för att") och hierarkiska kopplingar
Agens, tidsättning, mätbarhet per mål
Strategiskt val-diagnos: prioriteringar, avgränsningar, avvägningar

6. Strategisk dissonans

Mäter avståndet mellan vad dokumentet pratar om (diskurs), vad det önskar (aspiration) och vad det faktiskt åtar sig (åtagande). Ett dokument kan ha tydlig riktning men ändå lida av dissonans – om det pratar om innovation men bara åtar sig effektivisering.

Tre gap: retoriskt gap (diskurs vs aspiration), trovärdighetsglapp (aspiration vs åtagande) och total dissonans (diskurs vs åtagande). Högt värde = stor skillnad mellan ord och handling.

Fördjupning: dissonansberäkning och LUFT × dissonans-matris →

7. Policy – strategi – plan

Placerar dokumentet på ett kontinuum från ren policy (principiell riktning) till ren plan (konkret handling). Strategin är bryggan däremellan.

Fördjupning: kontinuumet, markörer och tolkning →

8. Referenser

Mäter dokumentets koppling till omvärlden:

Hänvisningsfraser, lagstiftning (SFS, EU), statliga utredningar (SOU, Ds, Prop)
Organisationsreferenser (DIGG, SKR, OECD)

9. Integration

Jämför två eller fler dokument mot varandra: tematisk överlappning, terminologisk samstämmighet och strategisk riktning. Använder TF-IDF för att identifiera delad och unik terminologi mellan dokumenten.

Ordöverlappning (Jaccard) och terminologisk likhet (TF-IDF cosinus)
Riktningsjämförelse i fyrfältaren – pekar dokumenten åt samma håll?
Per-kategori-jämförelse mot dokumentsamlingen

10. Principtyper

Klassificerar vägledande principer efter Eisenhardt & Sulls (2001) ramverk: hur-regler, gränsregler, prioriteringsregler, tidsregler och exitregler. Visar vilka typer av vägledning dokumentet ger – och vilka som saknas.

11. Tonalitet

Profilerar dokumentets tonalitet längs tre dimensioner: deklarativ/tentativ (hur bestämt), konkret/abstrakt (hur specifikt) och sentiment (positiv/neutral/negativ). Bygger på BLA-komponenterna och spaCy-annoteringar.

12. Tidsperspektiv

Analyserar dokumentets tidsfördelning: hur stor andel av texten som handlar om dåtid (lägesbeskrivning), nutid (pågående arbete) och framtid (åtaganden och ambitioner). Använder spaCy-morfologi och svenska framtidsauxiliarer (ska, komma att, böra).

Längdnormalisering

Råa ordkvoter gör långa dokument automatiskt bättre: fler signaler hittas, fler element täcks, fler domäner nämns. För att mäta kvalitet och inte längd används fem normaliseringsprinciper.

Global densitet per 1000 ord – helhets-mått (floskler, truismer) divideras med dokumentets längd. Speglar dokumentets genomsnittliga karaktär.
Rullande densitet (moving-density) – kvalitetsmarkörer (klarhets-signaler, prioriteringsmarkörer, bärande antaganden, mål, capability slack) mäts som genomsnittlig lokal densitet i glidande 100-ords fönster. Ett långt dokument med spridda signaler får lägre poäng än ett kort dokument med koncentrerad strategi. Samma princip som MATTR, men för signal-counts. Teoretisk grund: Altmann et al. (2009) visar att ordförekomster burstar i kluster och inte följer Poisson.
Topp-densitet (peak-density) – komplement till moving-density som bevarar information om den tätaste 100-ords regionen i dokumentet. Används för mål: ett kort intensivt mål-avsnitt i ett långt dokument får kredit för sin toppkoncentration istället för att spädas ut över hela texten.
MATTR (Moving-Average Type-Token Ratio, Covington & McFall 2010) – lexikal diversitet i glidande fönster (30–100 ord). Längd-invariant till skillnad från Guiraud eller ordförrådsstorlek. Används för DNA-substantiv, verb, adjektiv, noun chunks och propositioners subjekt.
Percentil mot fryst baseline + Binned Term Count – aggregerade poäng (STRAT, DNA-dimensioner, MÅL-composite) jämförs mot fördelningen bland 815 strategidokument (baseline v2-2026-04-18). STRAT beräknas som medelvärdet av pelarnas percentiler (STA7, DNA, 100-BLA). MÅL-composite använder Binned Term Count (Shehzad et al. 2022): antalet mål trunkeras vid 95:e percentilen före percentil-jämförelse, för att hindra långa dokument med ovanligt många mål från att inflatera poängen.

Minimumslängdströskel. Dokument kortare än 500 ord har för få signaler för att ratio-baserade mått (som friktions-fokus unmanaged / total) ska vara stabila. Under tröskeln används istället en absolut räkne-regel. Grund: Moisl (2011) minimum document length för pålitlig klustring, Shi et al. (2020) lexikalrikedom stabiliseras först vid ~1000 tokens.

Rumelt-linjen. Långa utspädda strategidokument får lägre densitet och därmed lägre poäng – det är en medveten egenskap, inte ett fel. Rumelt (2011) kritiserar explicit svällda strategier som maskerar brist på fokus.

Regression mot medelvärdet. STRAT som medelvärde av tre pelar-percentiler komprimerar extremer mot median: ett dokument med extremt hög STA7-percentil (99) landar oftast runt 69 på STRAT eftersom pelarna är svagt korrelerade (ρ < 0,26). Detta är en känd egenskap hos composite-index (Nardo et al. 2005, OECD-handbook; jfr HDI, GII). STRAT ska därför läsas som en breddindikator – pelarna STA7, DNA och BLA visas alltid separat för nyans.

Densitet och kvalitet per STA7-element. Varje element rapporteras med två längd-invarianta poäng. Densitet är percentil-ranking av nyckelords-frekvens per 1 000 ord mot 815-dok-baseline, mekaniskt och lätt att försvara: hur ofta nämner detta dokument elementets kärnord jämfört med jämförelsedokumenten? Kvalitet är en theory-anchored composite av strukturella sub-komponenter där sådan djupanalys finns (E1 Utmaning, E2 Antaganden, E3 Avsikt, E4 Värde, E5 Målbilder, E6 Förmågor, E7 Friktion). Vikterna är empirisk-pilot-validerade via NB14 (CLAUDE.md Fas 3.7–3.10) så alla element uppnår |ρ|<0,3 mot ordantal. Densitet är primär aggregat-källa för STA7-compound och STRAT; kvalitet visas parallellt på element-deep-dive-sidorna som komplementerande lins.

För transparens bevaras både normaliserade poäng (score) och legacy-värden (score_legacy) som API-fält, så läsaren kan jämföra. Alla förändringar av scoring-formeln bumpar versionen (analysis_version i svaret) vilket invaliderar gamla cache-resultat.

Baslinje (dokumentsamling)

Alla analyser jämför mot över 800 strategidokument:

Digitaliserings- och hållbarhetsstrategier
Kommuner, regioner och myndigheter
Tidsperiod: 2006–2025
Baslinje v2-2026-04-18 (n=815) – fryst för reproducerbarhet
Analyserade inom STRATEGIOS

Utforska data →

Visa alla lexikon →

Forskningsgrund och referenser