Metod och variabeldokumentation

Hur Skolkoll samlar in, bearbetar och presenterar data om Sveriges skolor och kommuner. Denna sida beskriver datakällor, variabler, beräkningsmetoder och datakvalitet.

Ordlista

Skolkoll använder dessa fem termer konsekvent. Begreppen syftar på olika nivåer i datakedjan — från myndighetens register, via varje upstream-API, ner till den fil du kan ladda ner.

Datakälla
En upstream-feed eller API vi synkar från (t.ex. Skolverket API, Skolverket Statistik, SCB DeSO, Kolada). En myndighet har ofta flera feeds — Skolkoll synkar 15 datakällor från 9 organisationer. Live-synkstatus per datakälla finns på settings-sidan.
Dataset
En distinkt datatyp som hämtas inom en datakälla (t.ex. "Meritvärden åk 9", "SALSA", "Skolenkäten"). En datakälla kan exponera flera dataset — Skolkoll dokumenterar 27 dataset i tabellen nedan.
Datafil
Bearbetad CSV/JSON du kan ladda ner. Skolkoll publicerar nedladdningsbara datafiler på öppen data-portalen.
Skolenhet
Skola enligt Skolverkets register. Skolverkets råregister innehåller ~46 000 skolenheter inklusive vilande och upphörda; Skolkoll publicerar endast aktiva (~16 000).
Aggregat
Statistisk population som en analys baseras på (t.ex. "samtliga grundskolor i en kommun" eller "alla elever med betyg över ett tröskelvärde").

1. Datakällor och dataset

Skolkoll aggregerar 27 dataposter från 15 datakällor hos 9 myndigheter och organisationer. Tabellen nedan listar varje datapost — vissa rader är hela datakällor/API:er (t.ex. "Skolverket Planned Educations API v3") som returnerar flera datatyper, andra är enskilda dataset inom en datakälla (t.ex. "Meritvärden åk 9"). Live-synkstatus per datakälla visas på settings-sidan.

Utöver dessa hämtar vi även 143 kommun-KPI:er från Kolada (RKA) — komplett lista finns på settings-sidan.

Datakälla / dataset Publicerande organisation Vad vi hämtar Synkfrekvens
Skolverket Planned Educations API v3 Skolverket Skolenheter, huvudmän, kontaktuppgifter, skolformer, antal elever Dagligen
Meritvärden åk 9 Skolverket Genomsnittligt meritvärde per skolenhet Årligen (höst)
Behöriga lärare Skolverket Andel lärare med lärarlegitimation per skolenhet Årligen
Elever per lärare Skolverket Lärartäthet per skolenhet Årligen
Nationella prov Skolverket Resultat åk 6 och åk 9 i svenska, matematik och engelska Årligen
Examensgrad gymnasium Skolverket Andel gymnasieelever med examen inom 3 år Årligen
Betygspoäng gymnasium Skolverket Genomsnittlig betygspoäng vid examen Årligen
Högskolebehörighet Skolverket Andel med grundläggande behörighet till högskola Årligen
Skolbibliotek Skolverket Tillgång till bemannat skolbibliotek per skolenhet Årligen
SALSA — socioekonomisk modell SIRIS/Skolverket Förväntat vs faktiskt meritvärde, residual per skolenhet Årligen
Skolverket Statistikdatabasen (PxWeb) Skolverket Förskolestatistik per kommun (personaltäthet, andel behöriga, m.m.) 1:a och 15:e varje månad
Frånvarostatistik Skolverket Statistikdatabasen Andel elever med > 20 % frånvaro per skolenhet Årligen
Skolenkäten Skolverket Skolenkäten Elev- och vårdnadshavarsvar: trivsel, trygghet, studiero Vartannat år (vår + höst)
SCB PxWeb (DeSO) SCB Barnfattigdom, ekonomisk standard, hushållstyper, migration, boende per DeSO Månatligen
SCB UF0551 — Lärarstatistik SCB Utbildade lärare per sysselsättning och skolform (nationell nivå) Årligen
SCB UF0505 — Arbetskraftsbarometern SCB Brist/balans per utbildningsgrupp (nationell) Årligen
SCB Befolkningsprognos SCB Befolkningsprognos per kommun, åldersgruppsfördelad (förskola/grundskola/gymnasie) Årligen
Antagningspoäng gymnasium Gymnasieantagningen Cutoff-poäng per program och skolenhet föregående läsår Årligen (efter antagning)
Söktryck gymnasium Skolverket Sökta vs antagna platser per program/skolenhet Årligen
Skolinspektionsbeslut Skolinspektionen Aktiva förelägganden, viten, kritik och avslagsbeslut per skolenhet/huvudman Veckovis (schemalagd) + manuell trigger
Skolinspektionen — anmälningar Skolinspektionen Anmälningar och Barn- och elevombudets beslut Veckovis
Tillsyn — pågående ärenden Skolinspektionen Pågående tillsynsärenden per huvudman Veckovis
Diskrimineringsärenden Diskrimineringsombudsmannen DO-anmälningar med skolkoppling Månatligen
Årsredovisningar friskolor Bolagsverket via koncerncrawler Omsättning, resultat, soliditet, anställda per fristående huvudman Veckovis (när nya filings finns)
Skolbarns hälsovanor Folkhälsomyndigheten Enkätresultat om hälsa, trivsel, ANDT-vanor (kommunnivå) Vart 4:e år (efter undersökning)
Högskolekoppling UKÄ + SCB Genomströmning och arbetsmarknadsetablering efter gymnasium Årligen
Valresultat Valmyndigheten Riksdags- och kommunvalsresultat per kommun Efter val

1b. Kvalitetskontroller

All data som publiceras på Skolkoll passerar 27 automatiska kvalitetskontroller innan den når en publik sida. Tabellen nedan listar varje kontroll, vad den verifierar och var i pipelinen den körs. Kontrollerna är implementerade i functions/lib/data-quality-engine.js, functions/lib/schema-validator.js, functions/lib/sync-guard.js, functions/lib/upload-validation.js, functions/lib/compare-quality.js och functions/lib/validation.js.

# Kontroll Vad den verifierar Skede
1Saknat kritiskt fält: totalPupilsAktiv skolenhet utan elevantal — flaggas som kritisktEfter synk
2Saknat kritiskt fält: schoolTypesAktiv skolenhet utan skolformsangivelseEfter synk
3Avvikare — totalPupilsVärde utanför intervallet 1–3 000Efter synk
4Avvikare — studentsPerTeacherVärde utanför intervallet 2–50Efter synk
5Avvikare — certifiedTeachersPercentVärde utanför 0–100 %Efter synk
6Avvikare — meritRating9Värde utanför 0–340 poängEfter synk
7Avvikare — eligibleYR9Värde utanför 0–100 %Efter synk
8Plötslig förändring — totalPupils≥ 5 % varning, > 20 % kritiskt mot föregående periodEfter synk
9Plötslig förändring — studentsPerTeacher≥ 5 % varning, > 20 % kritisktEfter synk
10Plötslig förändring — certifiedTeachersPercent≥ 5 % varning, > 20 % kritisktEfter synk
11Plötslig förändring — meritRating9≥ 5 % varning, > 20 % kritisktEfter synk
12Plötslig förändring — eligibleYR9≥ 5 % varning, > 20 % kritisktEfter synk
13Inkonsistens — aktiv skola med 0 eleverStatus AKTIV men totalPupils = 0Efter synk
14Inkonsistens — behöriga lärare > 100 %Värde överskrider logisk maxgränsEfter synk
15Rapporteringslucka — grundskolaGrundskola med elever saknar både meritvärde och behörighetEfter synk
16Misstänkt dubblettSamma namn + kommun + elevantal inom ±30 %Efter synk
17Korskälla — skola vs KoladaSkol-genomsnittligt meritvärde avviker > 10 % från Kolada-värdeEfter synk
18Schema-validering — schools.jsonObligatoriska toppnycklar (syncedAt, schools) + 4 fältkontroller i ett stickprov på 100 posterFöre uppladdning
19Schema-validering — kolada.jsonObligatoriska toppnycklar (syncedAt, kommuner)Före uppladdning
20Schema-validering — koncern-lookup.jsonObligatoriska toppnycklar (meta, lookup) + orgnr/namn på posterFöre uppladdning
21Schema-validering — salsa.jsonObligatoriska toppnycklar (syncedAt, schools)Före uppladdning
22Schema-validering — betygsfordelning.jsonObligatoriska toppnycklar (syncedAt, schools)Före uppladdning
23Pre-upload-vakt mot antalstappBlockar publicering om antal poster minskar > 20 % mot föregående versionFöre uppladdning
24Skola-antal före uppladdningBlockerar om total/aktiv-antal sjunker under 80 % av föregåendeFöre uppladdning
25Sekretessavdrag (n < 15)Censurerar värden där elevunderlaget understiger Skolverkets sekretesströskel — applicerat på 13 jämförelse-måttBygge/rendering
26Litet urval (n < 30)Flaggar småskaliga värden så att rendering kan tona ner demBygge/rendering
27CI-gate — datakällskonsistensBygget felar om data-sources.json divergerar från faktiska datafiler (34 källor med kravklass required)CI

Utöver dessa körs format-validering på organisationsnummer (Luhn-checksumma), skolenhetskod (8 siffror eller forsk-NNNNNN), kommunkod (4 siffror) och LEI (ISO 17442). Pre-upload-guarderna är aktiverade i prioriterade sync-flöden via validateBeforeUpload eller validateSchoolUploadCounts; övriga functions/sync-*.js-funktioner täcks av efter-synk- och CI-kontroller tills motsvarande guard är inkopplad.

2. Variabelordbok

Tabellen nedan dokumenterar de viktigaste variablerna som visas på Skolkoll. Varje variabel beskrivs med enhet, källa och en kort förklaring. En komplett maskinläsbar datakatalog med samtliga 80+ mått finns i metric-definitions.json.

Variabel Enhet Källa Beskrivning
Meritvärde åk 9 Poäng (0–340) Skolverket Genomsnittligt meritvärde för elever i årskurs 9. Beräknas som summan av de 16 bästa betygen (max 320 poäng, eller 340 med moderna språk), där varje betyg ger 0–20 poäng.
Behöriga lärare % Skolverket Andel lärare med pedagogisk högskoleutbildning (lärarexamen eller lärarlegitimation) av samtliga tjänstgörande lärare.
Elever per lärare Ratio Skolverket Antal elever per heltidstjänst (lärare). Lägre värde innebär fler lärarresurser per elev.
Kostnad per elev kr/år Skolverket Statistikdatabasen Total kommunal kostnad per elev och år, inklusive undervisning, lokaler, måltider, elevhälsa och administration.
Skolans eget bidrag (SALSA-residual) Poäng Beräknad (Skolverkets modell) Skillnad mellan faktiskt och förväntat meritvärde givet elevsammansättning. Positivt värde innebär att skolan presterar bättre än förväntat. Se SALSA-metoden.
Behörighet yrkesprogram % Skolverket Andel elever i årskurs 9 som uppnår behörighet till gymnasieskolans yrkesprogram (godkänt i svenska/svenska som andraspråk, engelska, matematik samt 5 övriga ämnen).
Examensgrad % Skolverket Andel gymnasieelever som tar examen (slutbetyg) inom 3 år efter påbörjad utbildning.
Betygspoäng gymnasium Poäng (0–22,5) Skolverket Genomsnittlig betygspoäng för gymnasieelever med examen. Beräknas som medelvärdet av samtliga kursbetyg.
Utländsk bakgrund % SCB / Skolverket Andel invånare/elever med utländsk bakgrund (utrikes födda eller med två utrikes födda föräldrar). Finns i två varianter: DeSO-nivå från SCB (aggregeras till kommun) och skolnivå från Skolverkets statistikdatabas.
Barnfattigdom % SCB Andel barn (0–17 år) som lever i hushåll med låg ekonomisk standard, definierat som under 60 % av medianinkomsten.
Högskolebehörighet % Skolverket Andel gymnasieelever med examen som uppnår grundläggande behörighet till högskola och universitet.
Skolenkät: trygghet % Skolverket Andel elever som instämmer i att de känner sig trygga i skolan, baserat på Skolverkets skolenkät. Redovisas per årskurs (åk 5, åk 8, GY år 2).
Skolenkät: studiero % Skolverket Andel elever som upplever studiero i klassrummet, baserat på Skolverkets skolenkät. Redovisas per årskurs (åk 5, åk 8, GY år 2).
NP Svenska % Skolverket Andel elever som nått godkänt resultat (betyg A–E) på nationella provet i svenska/svenska som andraspråk.
NP Matematik % Skolverket Andel elever som nått godkänt resultat (betyg A–E) på nationella provet i matematik.
NP Engelska % Skolverket Andel elever som nått godkänt resultat (betyg A–E) på nationella provet i engelska.
Ekonomisk standard tkr SCB Median disponibel inkomst per konsumtionsenhet (justerad för hushållsstorlek), per DeSO-område. Används som socioekonomisk indikator.
Föräldrar med högre utbildning % Skolverket Andel elever vars föräldrar har eftergymnasial utbildning. Relaterad bakgrundsvariabel — observera att SALSA-modellen använder det inverterade måttet andel utan gymnasieutbildning.
Nyinvandrade elever % Skolverket Andel elever som invandrat till Sverige under de senaste fyra åren. Ingår som kontrollvariabel i SALSA-modellen.
Godkänt alla ämnen åk 9 % Skolverket Andel elever i årskurs 9 som uppnått minst betyg E i samtliga ämnen.
Skolbibliotek Ja/Nej Skolverket Huruvida skolenheten har tillgång till bemannat skolbibliotek.
Antagningspoäng Poäng Gymnasieantagningen Lägsta meritvärde för antagning till respektive gymnasieprogram föregående läsår.

3. SALSA-metoden

Vad är SALSA?

SALSA står för Skolverkets Arbetsverktyg för Lokala SambandsAnalyser. Det är en statistisk modell som Skolverket utvecklat för att sätta skolors resultat i relation till elevsammansättningen. Syftet är att ge en rättvisare bild av skolors prestationer genom att kontrollera för bakgrundsfaktorer som skolan inte själv råder över.

Modellspecifikation

SALSA är en multipel linjär regressionsmodell som skattar förväntat meritvärde baserat på följande oberoende variabler:

Modellen kan uttryckas som:

Meritvärde = β₀ + β₁ × (föräldrar utan gymnasieutb. %) + β₂ × (nyinvandrade %) + β₃ × (andel pojkar %) + ε

Koefficienterna (β-värdena) skattas genom minsta-kvadratmetoden på samtliga grundskolor med årskurs 9 som rapporterar tillräckligt elevunderlag.

Residualen — vad den betyder

SALSA-residualen är skillnaden mellan skolans faktiska meritvärde och det modellförväntade värdet:

Residual = Faktiskt meritvärde − Förväntat meritvärde

På Skolkoll används gränsvärdet −15 poäng för att flagga skolor med betydande underprestation. Residual under −25 poäng markeras med röd varningsnivå.

Begränsningar

Referens: Skolverkets SALSA-dokumentation

4. Datakvalitet

All data som visas på Skolkoll kommer från officiella svenska myndigheter och öppna API:er. Det finns dock viktiga begränsningar att vara medveten om:

Sekretessavdrag

Skolverket redovisar inte statistik för skolenheter där elevunderlaget understiger 15 elever i den aktuella variabeln. Detta för att skydda enskilda elevers integritet. Berörda variabler visas som "–" eller saknas helt på Skolkoll.

Svarsfrekvens skolenkäten

Skolverkets skolenkät bygger på frivillig medverkan. Svarsfrekvensen varierar kraftigt mellan skolor och årskurser, vilket påverkar tillförlitligheten. Resultat med låg svarsfrekvens bör tolkas med försiktighet.

Förskolor — GPS-positioner

Skolverkets API innehåller inte alltid koordinater för förskolor. Skolkoll matchar förskoleadresser mot SCB:s geodata, Bolagsverkets adressregister och OpenStreetMaps Nominatim-tjänst. Ungefär 85 % av förskolorna har matchats med GPS-position, resterande visas utan karta.

Kommun-aggregering

Demografisk data på DeSO-nivå (Demografiska Statistikområden) aggregeras till kommunnivå. Absoluta tal (befolkningsantal, sysselsatta, bostäder m.fl.) summeras och andelar beräknas sedan från de summerade värdena. Mått som redan är medelvärden eller medianer (t.ex. ekonomisk standard) viktas med befolkningstal per DeSO-område så att folkrikare områden får proportionellt större inflytande.

Betygsdata

Meritvärden i Skolverkets statistik avser elever som fått betyg i minst ett ämne. Elever som inte fått betyg i något ämne (exempelvis nyanlända utan betygsunderlag) inkluderas inte i genomsnittsvärdet.

Tidsfördröjning

Viss data har en naturlig tidsfördröjning. Betygsdata för ett läsår publiceras vanligen på hösten samma år. Kolada-data kan ha upp till sex månaders fördröjning beroende på KPI. Uppdateringsdatum för varje datakälla visas på datakällorsidan.

Hittar du ett fel i data eller beräkningar? Läs vår rättelsepolicy för hur du rapporterar och hur vi åtgärdar.

5. Citera Skolkoll

Data och analyser från Skolkoll får fritt citeras med källhänvisning. Förslag på citeringsformat:

Skolkoll (2026). [Variabelnamn]. Hämtad [datum] från https://skolkoll.se/
Baserat på data från Skolverket, SCB och Kolada.

Exempel: Skolkoll (2026). Meritvärde åk 9. Hämtad 2026-06-04 från https://skolkoll.se/skola/12345678/. Baserat på data från Skolverket.

Se även versionspolicyn för information om arkivering, schemaförändringar och licensvillkor och metodpolicyn för hur metod dokumenteras och ändras.

6. Ändringslogg

Viktiga förändringar i datainsamling, beräkningsmetoder och variabeldefinitioner.

Datum Kategori Förändring
2025-03 Metodändring Metodsida publicerad med variabelordbok, SALSA-dokumentation och citeringsguide.
2025-02 Ny data Lade till skolenkätdata (trygghet, studiero, stimulans) per skola och årskurs.
2025-01 Metodändring SALSA-benchmarking: möjlighet att jämföra skolor med liknande elevsammansättning.
2024-12 Ny data Utökade Kolada-KPI:er från 80 till 133 per kommun.
2024-11 Ny data Lade till DeSO-baserad demografisk data från SCB (barnfattigdom, ekonomisk standard).
2024-10 Ny data Lansering av Skolkoll med grunddata från Skolverket API, Kolada och Bolagsverket.