Vad skiljer p90 från p10 på E7 Friktion?

Jämförelse av E7 Friktion mellan dokument i topp-tiondelen (p90) och botten-tiondelen (p10).

Är grupperna olika långa?

p90 har i snitt 1796 ord (median 1253). p10 har i snitt 1148 ord (median 812).

p90-dokument är längre än p10-dokument. Vissa skillnader nedan kan bero på att längre dokument hinner ta upp fler saker, inte att de är bättre eller sämre.

Hur skiljer sig grupperna på andra mått?

Jämför p90 med p10 på andra dimensioner. Värdena är justerade för dokumentlängd, vilket betyder att vi jämför korta dokument mot korta, mellanlånga mot mellanlånga, långa mot långa, och slår sedan ihop resultaten. När den justerade skillnaden är mycket mindre än den ojusterade handlade hela skillnaden om att grupperna var olika långa, inte att innehållet skiljde sig.

Dimension Pelare Skillnad (justerad för längd) Robust vid bredare tröskel? Att veta
STA7 (totalt) STA7 mycket högre i p90 Nej, bara synligt vid p90/p10 Ojusterad och justerad är liknande
E6 Förmågor STA7 mycket högre i p90 Nej, bara synligt vid p90/p10 Ojusterad och justerad är liknande
E1 Utmaning STA7 mycket högre i p90 Nej, bara synligt vid p90/p10 Ojusterad och justerad är liknande
E2 Antaganden STA7 märkbart högre i p90 Ja, fyndet håller även vid q75/q25 Ojusterad och justerad är liknande
E4 Värde STA7 märkbart högre i p90 Ja, fyndet håller även vid q75/q25 Ojusterad och justerad är liknande
BLA (totalt) BLA lite högre i p90 Nej, bara synligt vid p90/p10 Ojusterad och justerad är liknande
E5 Målbilder STA7 lite högre i p90 Nej, bara synligt vid p90/p10 Ojusterad och justerad är liknande
DNA Driv DNA lite högre i p90 Ja, fyndet håller även vid q75/q25 Något av skillnaden var längd-effekt
E3 Avsikt STA7 lite högre i p90 Ja, fyndet håller även vid q75/q25 Ojusterad och justerad är liknande
DNA Anatomi DNA lite högre i p10 Ja, fyndet håller även vid q75/q25 Ojusterad och justerad är liknande
LUFT (totalt) LUFT lite högre i p90 Ja, fyndet håller även vid q75/q25 Ojusterad och justerad är liknande
Substansindex Övrigt liknar varandra Ja, fyndet håller även vid q75/q25 Något av skillnaden var längd-effekt
DNA Nomenklatur DNA liknar varandra Ja, fyndet håller även vid q75/q25 Ojusterad skillnad var större, mest längd-effekt
Integration Övrigt liknar varandra Nej, bara synligt vid p90/p10 Ojusterad och justerad är liknande

Vilka ord används mer av varje grupp?

Ord som förekommer i fler p90-dokument än p10-dokument (eller tvärtom). Räknat per dokument: ett ord räknas en gång oavsett hur ofta det förekommer i samma dokument.

Ord som p90 använder mer

Visar i hur många dokument av 38 ordet förekommer.

  1. förenkla p90: 23 / p10: 5
  2. tydlig p90: 33 / p10: 10
  3. innovation p90: 35 / p10: 11
  4. samla p90: 26 / p10: 7
  5. förtroende p90: 14 / p10: 2
  6. mod p90: 14 / p10: 2
  7. minimera p90: 12 / p10: 1
  8. innefatta p90: 12 / p10: 1
  9. analysera p90: 16 / p10: 3
  10. motverka p90: 11 / p10: 1
  11. dela p90: 22 / p10: 6
  12. framgångsrik p90: 10 / p10: 1
  13. positiv p90: 14 / p10: 3
  14. aktiv p90: 14 / p10: 3
  15. lärande p90: 16 / p10: 4
  16. beakta p90: 16 / p10: 4
  17. ledningsgrupp p90: 9 / p10: 1
  18. utvärdering p90: 9 / p10: 1
  19. definition p90: 9 / p10: 1
  20. sammanhang p90: 11 / p10: 2
  21. beroende p90: 11 / p10: 2
  22. sak p90: 11 / p10: 2
  23. individ p90: 18 / p10: 5
  24. ordinarie p90: 18 / p10: 5
  25. regional p90: 20 / p10: 6

Ord som p10 använder mer

Visar i hur många dokument av 38 ordet förekommer.

  1. digital p90: 59 / p10: 58
  2. arbetsmiljö p90: 5 / p10: 11
  3. policy p90: 8 / p10: 14
  4. form p90: 12 / p10: 17
  5. riktlinj p90: 8 / p10: 13
  6. mobil p90: 5 / p10: 10
  7. arbete p90: 32 / p10: 33
  8. kommunfullmäktige p90: 18 / p10: 21
  9. verksamhet p90: 38 / p10: 37
  10. mål p90: 37 / p10: 36
  11. strategie p90: 5 / p10: 9
  12. underlätta p90: 17 / p10: 19
  13. telefon p90: 6 / p10: 9
  14. hand p90: 14 / p10: 16
  15. processer p90: 5 / p10: 8
  16. sikt p90: 4 / p10: 7
  17. gräns p90: 4 / p10: 7
  18. policyn p90: 4 / p10: 7
  19. tillgodose p90: 4 / p10: 7
  20. kund p90: 4 / p10: 7
  21. presentera p90: 4 / p10: 7
  22. tillgång p90: 22 / p10: 22
  23. tjänst p90: 35 / p10: 32
  24. behov p90: 39 / p10: 35
  25. kostnad p90: 10 / p10: 12
Per organisations-typ (är ord-mönstren samma i kommun, region och stat?)

Samma log-odds-ratio-analys som ovan men beräknad separat för varje organisations-typ. Visar om de generella mönstren håller eller om de drivs av en specifik typ. Org-typer med färre än 10 dokument i p90 eller p10 visas inte (otillförlitliga estimat).

Kommun (p90 n=30, p10 n=27)

Mer i p90 (top 10)

  1. mod 13/1
  2. dela 17/3
  3. lärande 14/2
  4. samla 19/4
  5. genomsyra 11/1
  6. ställa 21/5
  7. tydlig 26/7
  8. förstå 13/2
  9. förståelse 13/2
  10. innovation 28/8

Mer i p10 (top 10)

  1. riktlinj 4/9
  2. arbetsmiljö 4/9
  3. kommunfullmäktige 18/21
  4. digital 48/43
  5. form 8/12
  6. underlätta 12/14
  7. policy 6/9
  8. mål 27/25
  9. syfta 11/13
  10. verksamhetssystem 4/7

Region (p90 n=5, p10 n=3)

Otillräckligt sample för stratifierad analys.

Stat (p90 n=3, p10 n=8)

Otillräckligt sample för stratifierad analys.

Exempel från p90-dokument

Bästa passage från de tre dokument som scoreade högst på E7 Friktion. Visar konkret språkmönster som triggar hög score, för läsning som inspiration eller jämförelse.

"Denna strategi ska främja en utveckling där digitala lösningar och tjänster förstärker kärnverksamheten och blir viktiga verktyg och stöd för att uppnå verksamheternas mål och hantera välfärdens utmaningar."

Hallstahammar Digitaliseringsstrategi · score 92.3 · trigger: Friktion adresserad

"Innovation är ett strategiskt verktyg för nyskapande problemlösning i utvecklingen av produkter, tjänster och arbetssätt."

Danderyd strategi-for-digitalisering · score 89.3 · trigger: Friktion adresserad

"Det finns stora möjligheter i att möta välfärdens utmaningar, genom att utmana existerande strukturer och arbetssätt, använda data som en strategisk resurs och kraften i ny teknologi."

Laholm Program för strategisk IT · score 89.3 · trigger: Friktion adresserad

Semantisk närhet mellan dokumenten

Använder spaCy-vektorer (300-dim) per dokument och beräknar genomsnittlig cosinus-likhet inom p90 (38 dok), inom p10 (38 dok) och mellan grupperna. Mäter om p90-dokumenten är semantiskt täta (samma temacluster) eller endast lexikalt täta (samma ord, olika tema). Värden 0–1: högre = mer lik.

Mått Cosinus-likhet
Inom p90 (genomsnitt par-vis) 0.944
Inom p10 (genomsnitt par-vis) 0.947
Mellan p90 och p10 0.945
Tightness-diff (p90 - mellan) -0.001

Tolkning: positiv tightness-diff betyder att p90-dokumenten är mer lika varandra än de är p10-dokumenten, vilket pekar mot egen semantisk klunga. Nära noll betyder att lexikal skillnad i tabellen ovan inte motsvaras av semantisk separation.

Hur skiljer sig strukturen?

Rubriker, listor, referenser i dokumentet. Justerad för längd som ovan.

Mått p90 medel p10 medel Skillnad (längd-justerad)
headings_total_per_1k 0.0 0.0 liknar varandra
tables_count_per_1k 0.01 0.03 liknar varandra
list_bullet_count_per_1k 3.98 1.38 märkbart högre i p90
list_numbered_count_per_1k 1.23 1.03 liknar varandra
list_ratio 0.07 0.04 lite högre i p90
total_references_per_1k 11.88 13.29 liknar varandra
ref_legislation_per_1k 0.04 0.07 liknar varandra
ref_organizations_per_1k 1.62 1.04 liknar varandra
Hur är detta beräknat?

Underlag: 38 dokument i p90, 38 dokument i p10 (av dessa har 38 respektive 38 annoterad text för ord-analysen).

"Skillnad" i tabellerna ovan är översatt från Cohen's d med tröskelvärdena 0.2 (liten), 0.5 (medel) och 0.8 (stor). Standardvärden för effektstorlek (Cohen 1988).

Längd-justering. Dokumenten delas i tre lika stora grupper efter ord-antal: kort (under 1207 ord), mid (upp till 2139 ord), och lång (resten). Cohen's d beräknas inom varje längd-grupp och poolas via inverse-variance weighting (analog med fixed-effect meta-analysis av Hedges g). Detta neutraliserar längd-confound som annars uppstår när rankningen på E7 Friktion är systematiskt längd-stratifierad. Se docs/length-bias-audit-2026-06-05.md för bakgrund.

Ord-jämförelsen använder log-odds-ratio med Dirichlet-prior (Monroe, Colaresi och Quinn 2008). En statistisk metod som visar vilka ord som är överrepresenterade i en grupp jämfört med en annan. Visas endast ord som förekommer i minst 10 dokument totalt och som är innehållsord (substantiv, verb, adjektiv, egennamn). Ord-räkningen är per-dokument förekomst, inte total frekvens (annotated/-format ger unika lemman per dok). Lexikal differential är INTE längd-justerad i nuvarande version.

Kvarstående bias. Per length-bias-audit 2026-06-05 har STA7- och DNA-rå-scores i baseline_scores.csv stark längd-korrelation (canvas_compound ρ=+0.774, nom_total ρ=+0.850). Detta är drift mellan baseline-CSV och density-versionerna i deep_scoring.py och åtgärdas separat. Stratifieringen ovan hanterar konsekvensen i cross-dim-tabellen men löser inte grundorsaken.

Underlaget är genererat 2026-06-05 mot frusen baseline. Vid förändringar i scoring eller korpus måste underlaget regenereras.

Analyserar dokumentet