KulturNav + Wikidata = Sant!

Vokabulärer och auktoriteter i GLAM-sektorerna

Arkiv, bibliotek och museer använder ett stort antal terminologier, auktoriteter, ortnamnsförteckningar, och andra sorters kontrollerade vokabulärer. Museerna är kanske den av sektorerna som använder det största antalet olika sådana.

De flesta vokabulärer i bruk är enspråkiga. Det gör det svårt att söka fram och analysera samlingsdata på tvärs över nations- och språkgränser. En sökning på svenska efter “svartfigurig keramik” skulle inte få några träffar i ett system där den indexerade etiketten är “Black-figure pottery” (engelska) eller ”Zwartfigurige stijl” (nederländska) eller etiketten på något annat språk än svenska. Genom att använda flerspråkiga vokabulärer kan samlingsdata bli mer sökbara och analyserbara, speciellt på tvärs över flera samlingar och över språkgränser.

Flera vokabulärer följer idag standarder för länkade öppna data. Det innebär också att det har blivit enklare att länka dem samman. Men för en förvaltare av en vokabulär kan det vara svårt att veta vilka andra vokabulärer som ger mest värde att länka sig samman med. Dessutom skulle man i värsta fall behöva manuellt uppdatera varje term i vokabulären manuellt! Det skulle kunna bli mycket kostsamt.

Wikidata kan göra det arbetet mindre kostsamt. Anledningen är att om man skapar länkar mellan sin vokabulärs termer med motsvarande termer i Wikidata så skapar man också indirekt länkar med alla andra vokabulärer som gjort detsamma.

Six operators, all women, all wearing headets, sitting in front of a telephone exchange.
TELEPHONE OPERATORS. Harris & Ewing Collection, Library of Congress. Public Domain.

Det innebär att Wikidata kan fungera som en växel mellan olika vokabulärer och auktoriteter. Med utgångspunkt i en vokabulär kan en programmerare, via Wikidata, hämta hem etiketter på andra språk – etiketter som kommer från andra vokabulärer eller som kommer från Wikidataobjektet självt. Etiketterna kan då tillföras ursprungsvokabulären och därmed dramatiskt öka dess flerspråkighet.

En teknisk lösning för att förvalta vokabulärer, auktoriteter, och ortnamnsförteckningar och som använder sig av Wikidatas möjligheter är KulturNav.

Vad är KulturNav?

KulturNav är en teknisk plattform för att förvalta och publicera vokabulärer som länkade data. Plattformen utvecklas av det norska icke-vinstdrivande bolaget KulturIT. Plattformen är kostnadsfri att använda. Det bör noteras att KulturIT står enbart för plattformen. Det är de museer och andra kulturarvsinstitutioner som använder plattformen som själva ansvarar för innehållet.

Idag använder ungefär 50 kulturarvsinstitutioner plattformen. Vokabulärerna som återfinns där omfattar stora sådana som används av flera institutioner, som den Svenska fotografdatabasen, men även små som används enbart av ett museum, som denna lista med militärflygplanstyper från Flygvapenmuseum.

Hur är KulturNav sammankopplat med Wikidata?

Precis som flera andra förvaltningssystem för vokabulärer stödjer KulturNav användare att skapa länkar till externa termer med samma innebörd. Interaktionsdesignen i KulturNav uppmuntrar och underlättar för användaren att göra sådana kopplingar.

I vad som kanske är unikt för KulturNav så föreslår systemet automatiskt förbättringsförslag baserade på det motsvarande Wikidataobjektet.

Figure 1. Auktoritetsposten för Aeroseum i KulturNav.

I figur 1 kan du se hur användare med redaktörsrättighet till en vokabulär får förslag på tillägg till en term. Förslagen kommer från Wikidata och omfattar i exemplet ovan: ett förslag på annan geografisk position, ett datum för museets grundande, och en länk till den motsvarande posten för Aeroseum i Virtual International Authority File VIAF

Denna funktionalitet är baserad på ett bakgrundskript som kollar av om det finns ny information i Wikidata. Skriptet körs automatiskt när en användare med redaktörsrättighet besöker termsidan.

Fig 2. Auktoritetspost för Nordiska museet med kort beskrivning, markerad i rött, från Wikipedia.

Auktoritetsposter som har en motsvarighet i Wikidata får en kort beskrivande text tagen från Wikipedia (se fig 2 ovan). Beskrivningarna hämtas via Wikidata och i de fall där det finns beskrivningar på flera av de språk som KulturNav stödjer (nynorsk, bokmål, svenska, finska, estniska) så importeras även de.

De här funktionaliteterna, i kombination med insatser från KulturIT att programmatiskt länka samman termer i KulturNav med de i Wikidata, har resulterat i att det nu finns över 20 000 sådana dubbelriktade länkar. Det gör ju också Wikidata till en rikare resurs!

Avslutande tankar

För att förbättra kulturarvssamlingars interoperabilitet och sökbarhet är sammankoppling av vokabulärer och auktoriteter en nyckelaktivitet. Att göra sammankopplingen via Wikidata är ett väldigt bra sätt. Det gör arbetet enklare, mindre resurskrävande och ger stöd för väldigt många språk. En förutsättning är att vokabulärer och auktoriteter är publicerade som länkade öppna data.

Förhoppningsvis kommer fler system för hantering av vokabulärer att koppla sig samman med Wikidata. Om du känner till några så får du gärna kontakta oss!