Skolinformation på Wikidata

I början av året importerades omkring 6 000 skolenheter till Wikidata. Det innebär att mycket av den information som försvann från Skolverket när Skolenhetsregistret sekretessbelades går att få tag på via Wikidata istället. Vi har intervjuat grundaren av projektet.

Raoul Wallenbergsskolan i Skövde, en av många grundskolor i Sverige. Foto: Wazzaa97, CC BY-SA 3.0.

I augusti tillkännagav Skolverket att skolinformation kommer att sekretessbeläggas. Eftersom information och statistik om Sveriges skolor enligt en dom i Kammarrätten från häromåret kan ses som affärshemligheter går det inte att begära ut det i enlighet med offentlighetsprincipen. Resultatet är att information som betygsfördelning, antalet godkända elever och liknande inte går att ta del av. Inte ens information om vilka skolor som finns, vilka adresser skolorna är belägna på, och vilka som äger dem, anses omfattas av offentlighetsprincipen. 

På Wikidata, en strukturerad databas med öppen och fri information, har ett gäng volontärer och användare skapat ett projekt för att sammanställa den information som finns om svenska skolor och skolenheter,* och resultatet är att merparten av den information som fanns i det tidigare Skolenhetsregistret nu istället finns tillgängligt via Wikidata. Det innebär att det går att söka, ta del av och sammanställa mycket av den information som tidigare gick att få tag på via Skolenhetsregistret via Wikidata istället. Vi intervjuade en av volontärerna bakom projektet, användaren Popperipopp, eller Robin Linderborg som han heter egentligen. 

Det kan vara svårt att förstå sig på Wikidata för en oinsatt, hur man ska använda det eller ens vad det är bra för. Varför är Wikidata användbart om man vill få tag på information? Varför är Wikidata viktigt för samhället?

Wikidata har enormt mycket data, men det kan vara svårt att överblicka vad som finns och vilken kvalitet det har. Jag kom först i kontakt med projektet när vi letade efter bra källor för parlamentariska val runtom i världen. En sådan konkret ingång är viktig för att skapa ett initialt intresse. Så jag tror att riktade informationsinsatser mot exempelvis journalister, forskare eller politiker kan vara effektivt. Visa upp ett område där Wikidata är bäst i klassen och använd det som ingång.

Fördelen med att ha ett dataset som skolenheter på Wikidata är att objekten är länkade till andra objekt. Med en kort introduktion till Wikidatas query-språk SPARQL kan man enkelt söka efter kopplingar mellan skolor, kommuner, privata företag, beslutsfattare och så vidare. Ju fler ögon på detta, desto bättre. Om användarna sedan får intressanta insikter eller skapar något innovativt tror jag att fler förstår nyttan av att hålla sådan data öppen och fritt tillgänglig. Det är en viktig samhällelig effekt.

Du är ju själv inne på hur mycket data som finns på Wikidata. All möjlig kunskap om alla möjliga ämnen. Det finns hur mycket som helst att göra! Vad fick dig att skapa ett projekt om just svenska skolenheter på Wikidata?

Jag jobbar på den ideella organisationen Datastory, där vi strävar efter att tillgängliggöra data för allmänheten. Vi har jobbat en hel del med skoldata och skapat interaktiva applikationer där användarna själva kan utforska den.

Jag såg att Wikipedia och Wikidata hade en del intressant information om skolor som saknades i den officiella statistiken, så jag började matcha de skolobjekten i vår databas. Efter ett tag insåg jag att det var mer effektivt att importera alla skolenheter direkt till Wikidata för att sedan kunna hämta ut all data via SPARQL-gränssnittet. En stor fördel med det tillvägagångssättet är dessutom att det möjliggör för andra att berika dataobjekten, information som vi sedan kan använda på Datastory. Så det är en win-win-situation.

Skolverket har ju nu beslutat att lägga skolenhetsregistret bakom sekretess. Vilken av den informationen har kunnat tillgängliggöras via Wikidata?

Den stora importen av skolenheter, omkring 6 000 objekt, gjordes i början av 2020, så de allra flesta skolenheter bör vara representerade på Wikidata. Undantaget är skolenheter som har registrerats efter importen.

Wikidata har i princip en kopia av det så kallade Skolenhetsregistret som numera är nedsläckt. Det innefattar information om alla skolenheter, skolor, huvudmän, och så vidare. Wikidata har även uppgifter om elevantal för många skolenheter. Det som saknas är övrig statistik som betyg, antal elever per lärare, med mera.

För den som vill ta del av informationen om skolenheter på Wikidata, hur ska den gå tillväga?

Sök. Wikidatas sökfunktion är bra för den som vill hitta information om en specifik skola eller skolenhet. Om man är ute efter mer strukturerad information, om exempelvis alla skolor i en kommun, skulle jag verkligen rekommendera att lägga en timme på Youtube-videon ”Querying Wikidata with SPARQL for Absolute Beginners” för en introduktion till ett mer avancerat sökgränssnitt. Det är enormt inspirerande att se vilka möjligheter som finns med den kunskapen i ryggen.

Hur kan jag själv vara med och bidra till att förbättra informationen om skolenheter på Wikidata?

Känner du till någon berömd person som har gått på skolan? Lägg till den uppgiften. Har du en bra bild på skolan? Ladda upp den. Hittar du ett fel? Rätta det. Man behöver inga särskilda tekniska kunskaper för att bidra direkt, och bidragen gör skillnad.

P. s. Om du har för ont om tid för att lära dig grundläggande SPARQL-kod har Robin sammanställt en sökning åt oss, som du kan komma åt här

Robin har använt Västerås som modellkommun. Om du vill ändra till en annan kommun:

  1. Gå till rad 5. 
  2. Stryk Q34550. 
  3. Tryck CTRL+Space, så kan du få hjälp med automatisk komplettering av kod. 
  4. Skriver du exempelvis “Jönköpings kommun” kommer den föreslå rätt objekt åt dig, i det här fallet Q504689. 
  5. Tryck på den vita pilen i det vänstra hörnet – “Utför förfrågan” – och du kommer få fram en fin lista med alla skolenheter.  

*  ”Som ett resultat av den nya skollagen (2010:800) samlas uppgifter in per skolenhet istället för per skola från och med läsåret 2012/13. […] Vissa skolor har valt att organisera sig i flera skolenheter och har då gett skolenheterna namn som exempelvis Centralskolan 1 och Centralskolan 2.
Statistiken presenteras alltid för en skolenhet. Inom gymnasieskolan kan ibland samma program återfinnas på flera skolenheter på det som i dagligt tal kallas för en skola. Programmet kan då ha olika resultat vilket till exempel kan bero på att skol-enheterna ansvarar för olika inriktningar på programmet.” https://www.skolverket.se/download/18.2a23c2b1698641e369cda/1556535871912/Bra att veta och begreppsförklaringar_190425.pdf