Förra veckan introducerade vi projektet 100 000 Bildminnen i vilket vi laddar upp foton ur Nordiska museet samlingar till Wikimedia Commons. Projektets syfte är inte endast att göra dessa fascinerande bilder tillgängliga utan även att engagera Wikimediagemenskapen – både dem som redan aktivt bidrar till plattformarna och dem som ännu inte vet att de snart kan sätta igång med det – för att förbättra deras data. Ett sätt att göra detta är med hjälp av strukturerade data. Men hur fungerar det egentligen?
I detta inlägg beskriver vi hur man kan ta rygg på Wikidata för att göra bilder på Wikimedia Commons mer användbara och sökbara. Texten riktar sig främst till dig som har grundläggande kunskap om hur Wikidata fungerar, det vill säga vet vad Wikidataobjekt är och hur man letar fram dem.
Vad – och varför
Det finns två sätt att beskriva vad som finns på en bild på Wikimedia Commons. Antingen med vanlig text, som man får skriva in när man laddar upp bilden eller redigera genom att klicka på Redigera-knappen – eller med hjälp av Strukturerad Data på Commons, SDC.
I korta drag går SDC ut på att, istället för att beskriva vad man ser på bilden, länka till det avbildade motivets Wikidataobjekt. Detta har flera fördelar:
Wikidata är flerspråkigt. När man skapar vanliga bildbeskrivningar på Wikimedia Commons får man använda vilket språk som helst – man kan skriva get, goat, коза eller vuohi. Det är bekvämt för bilduppladdaren, men det betyder att om man söker på get så hittar man inga bilder på кози – det är ju helt olika textsträngar. SDC och Wikidata löser det problemet. Wikidataobjektet Q2934 har etiketter på alla möjliga språk.
Testa SDC-sökverktyget för att hitta bilder som avbildar getter. Eller Uppsala domkyrka. Eller citroner.
SDC gör det lättare att hitta lämpliga illustrationer till Wikipediaartiklar. Som i exemplet nedan: när man redigerar en artikel på svenskspråkiga Wikipedia med VisualEditor och väljer Infoga bilder och media, så kan man söka på vilket språk som helst för att få bra förslag. Detta eftersom bildsökmotorn vet att strängen vuohi motsvarar Wikidataobjektet Q2934 – get!
SDC är läsbart för både människor och datorer. Vill man skriva ett program för att analysera alla bilder som avbildar getter är det betydligt lättare att använda sig av Wikidatakopplingarna än av textbeskrivningarna (som ju kan vara på många olika språk och ibland felstavade). Mänskligt språk är, tyvärr, svårt för datorer att förstå sig på.
En direkt följd av detta är att datat kan exporteras i standardiserade format och konsumeras av andra tjänster. Till exempel kan ett museum – som i detta fall, Nordiska museet – ta reda på vilka Wikidatakopplingar Wikimediagemenskapen har gjort i deras bilder på Commons och använda dem för att förbättra sina egna samlingsdatabaser.
Allt detta är möjligt tack vare uttalandet Motiv, eller Depicts, som är en del av SDC.
Hur
- Öppna en filsida på Wikimedia Commons, till exempel https://commons.wikimedia.org/wiki/File:Finsp%C3%A5ng_-_Nordiska_museet_-_NMAx.0003660.tif.
- Klicka på fliken Structured data / Strukturerad data under själva bilden.
- Under rubriken Items portrayed in this file / Objekt som porträtteras i den här filen ser du om det redan finns något motivuttalande.
- Om du vill lägga till ett motivuttalande kan du söka efter ett lämpligt Wikidataobjekt i sökrutan. Du kan även klistra in en Wikidataidentifierare direkt, men i de flesta fall går det bra att söka på etiketten.
- Om du är osäker om det föreslagna objektet är korrekt kan du klicka på det för att gå vidare till Wikidata och granska det.
- Om du är nöjd, klicka på Publish changes / Publicera ändringar. Klart!
Bli SDC-mästare?
På sidan Commons:Structured data finns utförlig information om SDC-infrastrukturen, inklusive andra typer av uttalanden än Motiv. Med hjälp av SDC kan man berätta mycket om en bild, som när den skapades och av vem, eller under vilken licens den är publicerad. Det är samma typ av information som vi brukar ha med som text eller mallar, men som SDC blir den mycket mer uppstädad och strukturerad. Men dem behöver man egentligen inte tänka på så mycket, då det finns automatiska skript, eller robotar, som omvandlar textinformationen till strukturerade data. Det är just Motiv som kräver mänsklig hjälp.
På Digiteket, Kungliga bibliotekets fortbildningsplattform, finns ett kapitel om SDC. Där kan du även se en kort instruktionsfilm av Wikimedia Sveriges Tore Danielsson.
Och så en sak till…
SDC är en relativt ny del av Wikimedia Commons. Det finns just nu över 91 miljoner filer på plattformen och ”bara” 11 miljoner av dem har minst ett motivuttalande. Tycker du det är kul med ett nästintill ofattbart stort projekt som aldrig kommer att bli 100% klart? Grattis, det här är något för dig. Det är precis den inställningen som gjort Wikipedia möjligt…