Wikipedia, det välkända fria uppslagsverket, har flera så kallade systerprojekt – plattformar som precis som Wikipedia sprider öppen kunskap. Det finns till exempel Wikimedia Commons, den fria mediadatabasen; Wiktionary, den fria ordboken, och Wikidata – den fria strukturerade databasen som just nu innehåller drygt 90 miljoner objekt. Wikidata har funnits i nästan exakt 8 år – det fyller år den 29 oktober – och har tilldragit sig intresse från olika håll, inte minst hos informationsvetare och bibliotekarier.
Det var just bibliotekarier och andra verksamma inom biblioteks- och informationsvetenskap som tidigare under oktober månad bjöds in till Wikimedia Sveriges webbinarium om Wikidata. Det organiserade vi tillsammans med Kungliga biblioteket, som vi har ett pågående samarbete kring strukturerade bibliografiska data med. Tack vare detta kunde vi nå ut till en bred skara biblioteksverksamma – över 50 personer från hela Sverige var med!
Bibliografiska metadata och Wikidata – en bra matchning
Webbinariet riktade sig först och främst till nybörjare; inga tidigare kunskaper om Wikidata behövdes, endast nyfikenhet. Vi gick igenom det viktigaste som är bra att veta om man är intresserad av öppna länkade data: vad Wikidata är och hur det redigeras, hur det hänger ihop med Wikipedia och hur man använder frågespråket SPARQL för att ta fram det man vill. Dessutom fördjupade vi oss i hur just bibliografiska data ser ut på Wikidata, något som var särskilt intressant för våra deltagare. Den vanligaste objekttypen på Wikidata är nämligen, något otippat, vetenskaplig artikel. Över trettio miljoner sådana objekt har kunnat skapats tack vare massimportering av bibliografiska poster från öppet tillgängliga databaser, huvudsakligen PubMed (som innehåller referenser till artiklar inom medicin och andra livsvetenskaper). Något som kan te sig överraskande men som är ett fantastiskt exempel på Wikidatas möjligheter som en bibliografisk databas och dessutom ett bevis på volontärgemenskapens intresse och engagemang inom området.
Med oss på kursen var Elisabet Fornell, projektledare och samordnare för katalogisering vid Stockholms stadsbibliotek, enheten för Digitala Bibliotek och Medier. Elisabet är mycket engagerad i frågor som rör bibliotekets utmaningar i den digitala tidsåldern – hon deltar också i utbildningen ”Att leda bibliotekens digitala transformation” på Kungliga bibliotekets plattform Digiteket. Hon berättar:
I samband med det reflekterar jag över bibliotekets roll i det nya digitala landskapet: vad är vår roll, vad borde vår roll vara, vad borde vi göra, hur borde vi göra, och så vidare. Spelplanen är förändrad och vi måste förhålla oss till det. En sak som är tydlig de senaste åren på bibliotek är att så kallade referensfrågor (när någon vill ta reda på något) har minskat radikalt. Inte för att folk undrar mindre tror jag, men man använder andra kanaler än biblioteket. Vi kan inte räkna med att de kommer tillbaka och borde då inte biblioteket använda dessa etablerade kanaler och bidra med det vi är bra på?
Elisabet berättar att hon är en flitig Wikipedialäsare, både privat och i yrkesrollen, men Wikidata är en ny bekantskap för henne.
Att Wikidata använder samma modell för länkad data som Libris XL (Kungliga bibliotekets nya katalogplattform – red. anm.) med tripletter gör det extra intressant. Dels för att det är en struktur vi känner till och därför kan bidra, och dels för att hela poängen med att länka data verkligen ligger i bibliotekens intresse. Jag är bibliotekarie med IT-bolagserfarenhet, men jag är inte programmerare (har bara nosat på Python) vilket möjligen gör SPARQL till en utmaning.
Även en annan deltagare, Alejandro Engelmann, använder Wikipedia som första steget i vilken ny fråga som helst, både privat och på jobbet. Han jobbar som systemanalytiker och utvecklare på Sveriges lantbruksuniversitets bibliotek och hade redan testat Wikidata innan webbinariet. Han berättar:
Särskilt intressant för mig var ”upptäckten” av tilläggsinformation kopplad till tripletterna, t.ex. referenser, någonting som är av stor vikt i olika länkad data-representationer av forskningsinformation och inte särskilt bra hanterat. Jag skall fortsätta undersöka funktionaliteten och titta närmare på Wikibase (mjukvaran bakom Wikidata – red. anm.).
Alejandro reflekterar även över Wikidatas funktion som informationsaggregator. En av plattformens största styrkor är att den innehåller data från en mängd olika, öppet licensierade, källor, som berikar varandra och blir till en enhet som är större än summan av delarna. Men för att kunna importeras till Wikidata måste datat vara strukturerat på rätt sätt, och det måste även vara fritt – en utmaning för dataleverantörer:
Om man skall sammanfatta vad man skall göra med en triplett-databas om man vill samarbeta med Wikidata (eller vilken annan ”riktig” triplettdatabas) så skall man ha permanenta identifierare, som redan är eller kan omvandlas till coola URI:er. Sedan skall man hålla reda på vilka tripletter är CC0 för att kunna skicka dem till Wikidata.
Att träffas i cyberrymden – digitala möten och läromedel
Den pågående Corona-pandemin gjorde att vi inte kunde träffas fysiskt. Att genomföra kursen online, som ett webbinarium, hade sina utmaningar; en del människor uppskattar personliga möten och lär sig mer på plats. Å andra sidan är cyberrymden mycket mer välkomnande för dem som föredrar sitta i lugn och ro framför sin skärm. Och så den kanske största fördelen: att kunna engagera deltagare från olika delar av Sverige, från Lund i söder till Piteå i norr, utan stressande resor och utsläpp!
Under förarbetena till kursen blev vi varse om att det saknades bra, svenskspråkigt material där grunderna i Wikidata förklaras för nybörjare. Vi ville gärna ha något som tog upp allt från de absoluta grunderna – vad Wikidata är för något, hur det skiljer sig från Wikipedia men samtidigt hänger samman med det – till hur man använder sig av språket SPARQL för att extrahera information från Wikidata. Något som såväl deltagarna i kursen som andra svenskspråkiga intresserade skulle kunna vända sig till även framöver och på en timme få en grundlig genomgång av plattformen.
Därför har vi skapat tre videopresentationer som motsvarar webbinariets tre huvudsakliga ämnen: Introduktion till Wikidata, Bibliografiska data på Wikidata och SPARQL. De är publicerade på både Youtube och Wikimedia Commons under en öppen licens. Alla är välkomna att använda och sprida dem.
Dessutom sparade vi de frågor som deltagarna ställde under webbinariet och publicerade dem, tillsammans med våra svar och intressanta länkar, på vår wiki. Allt för att göra det lättare för deltagarna att jobba vidare med den kunskap de fick på utbildningen.
Bibliotek och Wikimedia – självklart!
Det här är inte första gången som Wikimedia Sverige stödjer bibliotekarier som vill lära sig mer om öppen kunskap och Wikimediaplattformarna. Vi står bland annat bakom kurspaketet Wikipedia och bibliotek på Digiteket, där alla nyfikna, inte bara bibliotekarier, kan få en inblick i hur det är att skriva och samarbeta på Wikipedia.
Varför är det viktigt för biblioteken att satsa på Wikimediaplattformarna? Johanna Robinson Aalto och Tuija Drake vid Avdelningen för Informationssystem på Kungliga biblioteket berättar:
Att visa nyttan med bibliografiska data i sammanhang för länkade data och Wikimedia ger nödvändig input i bibliotekets arbete. Dels blir det mer uppenbart hur bibliotekariers arbete med kvalitativa metadata hjälper till att koppla information, dels kan biblioteksverksamma själva bidra till att kvalitetssäkra Wikidata och inlägg i Wikipedia. Utbildningen gav verktyg för att få en nyanserad och grundlig bild på Wikidata, att arbeta med Wikidata och att använda SPARQL för mer specifika sökfrågor. De kommer att vara användbara och inspirera biblioteksverksamma i deras arbete.
Stort tack till alla deltagare!