Metod och variabeldokumentation
Hur Skolkoll samlar in, bearbetar och presenterar data om Sveriges skolor och kommuner. Denna sida beskriver datakällor, variabler, beräkningsmetoder och datakvalitet.
1. Datakällor
Skolkoll aggregerar data från ett flertal öppna svenska datakällor. Nedan sammanfattas de viktigaste källorna och deras uppdateringsfrekvens. En fullständig förteckning med alla Kolada-KPI:er och övriga datapunkter finns på datakällorsidan.
| Datakälla | Typ av data | Uppdateringsfrekvens |
|---|---|---|
| Skolverket Planned Educations API v3 | Skolenheter, huvudmän, kontaktuppgifter, skolformer | Dagligen |
| Skolverket Statistikdatabasen (PxWeb) | Detaljerad statistik per kommun: förskola, grundskola, gymnasium | 1:a och 15:e varje månad |
| SCB PxWeb API | Demografisk statistik per DeSO-område: inkomst, utbildning, bakgrund | Månatligen |
| Kolada API | 136 kommun-KPI:er: kostnader, resultat, behörighet | Månatligen |
| Skolinspektionen | Förelägganden, viten och tillsynsresultat | Manuell trigger |
| Bolagsverket | Företagsdata för fristående huvudmän: juridisk form, SNI-koder | Veckovis |
| Valmyndigheten | Valresultat per kommun — politisk styrning | Efter val |
2. Variabelordbok
Tabellen nedan dokumenterar de viktigaste variablerna som visas på Skolkoll. Varje variabel beskrivs med enhet, källa och en kort förklaring.
| Variabel | Enhet | Källa | Beskrivning |
|---|---|---|---|
| Meritvärde åk 9 | Poäng (0–340) | Skolverket | Genomsnittligt meritvärde för elever i årskurs 9. Beräknas som summan av de 16 bästa betygen (max 320 poäng, eller 340 med moderna språk), där varje betyg ger 0–20 poäng. |
| Behöriga lärare | % | Skolverket | Andel lärare med pedagogisk högskoleutbildning (lärarexamen eller lärarlegitimation) av samtliga tjänstgörande lärare. |
| Elever per lärare | Ratio | Skolverket | Antal elever per heltidstjänst (lärare). Lägre värde innebär fler lärarresurser per elev. |
| Kostnad per elev | kr/år | Skolverket Statistikdatabasen | Total kommunal kostnad per elev och år, inklusive undervisning, lokaler, måltider, elevhälsa och administration. |
| SALSA-residual | Poäng | Beräknad (Skolverkets modell) | Skillnad mellan faktiskt och förväntat meritvärde givet elevsammansättning. Positivt värde innebär att skolan presterar bättre än förväntat. Se SALSA-metoden. |
| Behörighet yrkesprogram | % | Skolverket | Andel elever i årskurs 9 som uppnår behörighet till gymnasieskolans yrkesprogram (godkänt i svenska/svenska som andraspråk, engelska, matematik samt 5 övriga ämnen). |
| Examensgrad | % | Skolverket | Andel gymnasieelever som tar examen (slutbetyg) inom 3 år efter påbörjad utbildning. |
| Betygspoäng gymnasium | Poäng (0–22,5) | Skolverket | Genomsnittlig betygspoäng för gymnasieelever med examen. Beräknas som medelvärdet av samtliga kursbetyg. |
| Utländsk bakgrund | % | SCB / Skolverket | Andel elever med utländsk bakgrund, definierat som att eleven själv är utrikes född eller har två utrikes födda föräldrar. |
| Barnfattigdom | % | SCB | Andel barn (0–17 år) som lever i hushåll med låg ekonomisk standard, definierat som under 60 % av medianinkomsten. |
| Högskolebehörighet | % | Skolverket | Andel gymnasieelever med examen som uppnår grundläggande behörighet till högskola och universitet. |
| Skolenkät: trygghet | % | Skolverket | Andel elever som instämmer i att de känner sig trygga i skolan, baserat på Skolverkets skolenkät. Redovisas per årskurs (åk 5, åk 8, GY år 2). |
| Skolenkät: studiero | % | Skolverket | Andel elever som upplever studiero i klassrummet, baserat på Skolverkets skolenkät. |
| NP Svenska | % | Skolverket | Andel elever som nått godkänt resultat (betyg A–E) på nationella provet i svenska/svenska som andraspråk. |
| NP Matematik | % | Skolverket | Andel elever som nått godkänt resultat (betyg A–E) på nationella provet i matematik. |
| NP Engelska | % | Skolverket | Andel elever som nått godkänt resultat (betyg A–E) på nationella provet i engelska. |
| Ekonomisk standard | tkr | SCB | Median disponibel inkomst per konsumtionsenhet (justerad för hushållsstorlek), per DeSO-område. Används som socioekonomisk indikator. |
| Föräldrar med högre utbildning | % | Skolverket | Andel elever vars föräldrar har eftergymnasial utbildning. Viktig bakgrundsvariabel i SALSA-modellen. |
| Nyinvandrade elever | % | Skolverket | Andel elever som invandrat till Sverige under de senaste fyra åren. Ingår som kontrollvariabel i SALSA-modellen. |
| Godkänt alla ämnen åk 9 | % | Skolverket | Andel elever i årskurs 9 som uppnått minst betyg E i samtliga ämnen. |
| Skolbibliotek | Ja/Nej | Skolverket | Huruvida skolenheten har tillgång till bemannat skolbibliotek. |
| Antagningspoäng | Poäng | Gymnasieantagningen | Lägsta meritvärde för antagning till respektive gymnasieprogram föregående läsår. |
3. SALSA-metoden
Vad är SALSA?
SALSA står för Skolverkets Arbetsverktyg för Lokala SambandsAnalyser. Det är en statistisk modell som Skolverket utvecklat för att sätta skolors resultat i relation till elevsammansättningen. Syftet är att ge en rättvisare bild av skolors prestationer genom att kontrollera för bakgrundsfaktorer som skolan inte själv råder över.
Modellspecifikation
SALSA är en multipel linjär regressionsmodell som skattar förväntat meritvärde baserat på följande oberoende variabler:
- Föräldrarnas utbildningsnivå — andel elever vars föräldrar saknar gymnasieutbildning (%)
- Nyinvandrade elever — andel elever som invandrat till Sverige under de senaste fyra åren (%)
- Kön — andel pojkar (%)
Modellen kan uttryckas som:
Meritvärde = β₀ + β₁ × (utländsk bakgrund %) + β₂ × (föräldrar utan gymnasieutb. %) + β₃ × (nyinvandrade %) + β₄ × (andel pojkar %) + ε Koefficienterna (β-värdena) skattas genom minsta-kvadratmetoden på samtliga grundskolor med årskurs 9 som rapporterar tillräckligt elevunderlag.
Residualen — vad den betyder
SALSA-residualen är skillnaden mellan skolans faktiska meritvärde och det modellförväntade värdet:
Residual = Faktiskt meritvärde − Förväntat meritvärde - Positivt residual — skolan presterar bättre än förväntat givet elevsammansättningen. Detta kan indikera effektiv undervisning, gott ledarskap eller andra framgångsfaktorer.
- Negativt residual — skolan presterar sämre än förväntat. Kan bero på resursbrist, hög personalomsättning eller andra utmaningar.
- Residual nära noll — skolan presterar i linje med vad modellen förutsäger.
På Skolkoll används gränsvärdet −15 poäng för att flagga skolor med betydande underprestation. Residual under −25 poäng markeras med röd varningsnivå.
Begränsningar
- SALSA gäller bara grundskolan årskurs 9 — det finns ingen motsvarande modell för gymnasium eller förskola.
- Modellen kontrollerar för en begränsad uppsättning bakgrundsfaktorer. Faktorer som boendesegregation, psykisk hälsa och skolans resurstilldelning fångas inte.
- Residualen är ett genomsnitt för skolan — den säger inget om enskilda elevers resultat.
- Små skolor med få elever får instabila residualer som kan variera kraftigt mellan år.
- SALSA mäter relativ prestation, inte absolut kvalitet. En skola kan ha positivt residual men ändå ha låga meritvärden i absoluta tal.
Referens: Skolverkets SALSA-dokumentation
4. Datakvalitet
All data som visas på Skolkoll kommer från officiella svenska myndigheter och öppna API:er. Det finns dock viktiga begränsningar att vara medveten om:
Sekretessavdrag
Skolverket redovisar inte statistik för skolenheter där elevunderlaget understiger 15 elever i den aktuella variabeln. Detta för att skydda enskilda elevers integritet. Berörda variabler visas som "–" eller saknas helt på Skolkoll.
Svarsfrekvens skolenkäten
Skolverkets skolenkät bygger på frivillig medverkan. Svarsfrekvensen varierar kraftigt mellan skolor och årskurser, vilket påverkar tillförlitligheten. Resultat med låg svarsfrekvens bör tolkas med försiktighet.
Förskolor — GPS-positioner
Skolverkets API innehåller inte alltid koordinater för förskolor. Skolkoll matchar förskoleadresser mot SCB:s geodata, Bolagsverkets adressregister och OpenStreetMaps Nominatim-tjänst. Ungefär 85 % av förskolorna har matchats med GPS-position, resterande visas utan karta.
Kommun-aggregering
Demografisk data på DeSO-nivå (Demografiska Statistikområden) aggregeras till kommunnivå genom summering. Ingen viktning efter befolkningsstorlek görs vid denna aggregering, vilket innebär att stora och små DeSO-områden viktas lika.
Betygsdata
Meritvärden i Skolverkets statistik avser elever som fått betyg i minst ett ämne. Elever som inte fått betyg i något ämne (exempelvis nyanlända utan betygsunderlag) inkluderas inte i genomsnittsvärdet.
Tidsfördröjning
Viss data har en naturlig tidsfördröjning. Betygsdata för ett läsår publiceras vanligen på hösten samma år. Kolada-data kan ha upp till sex månaders fördröjning beroende på KPI. Uppdateringsdatum för varje datakälla visas på datakällorsidan.
5. Citera Skolkoll
Data och analyser från Skolkoll får fritt citeras med källhänvisning. Förslag på citeringsformat:
Skolkoll (2026). [Variabelnamn]. Hämtad [datum] från https://skolkoll.se/
Baserat på data från Skolverket, SCB och Kolada. Exempel: Skolkoll (2026). Meritvärde åk 9. Hämtad 2026-03-07 från https://skolkoll.se/skola/12345678/. Baserat på data från Skolverket.
6. Ändringslogg
Viktiga förändringar i datainsamling, beräkningsmetoder och variabeldefinitioner.
| Datum | Förändring |
|---|---|
| 2025-03 | Metodsida publicerad med variabelordbok, SALSA-dokumentation och citeringsguide. |
| 2025-02 | Lade till skolenkätdata (trygghet, studiero, stimulans) per skola och årskurs. |
| 2025-01 | SALSA-benchmarking: möjlighet att jämföra skolor med liknande elevsammansättning. |
| 2024-12 | Utökade Kolada-KPI:er från 80 till 133 per kommun. |
| 2024-11 | Lade till DeSO-baserad demografisk data från SCB (barnfattigdom, ekonomisk standard). |
| 2024-10 | Lansering av Skolkoll med grunddata från Skolverket API, Kolada och Bolagsverket. |