Ett riksdagsdokument säger mer än tusen ord

Lexikografen Samuel Johnson (Joshua Reynolds, 1775, via Wikimedia Commons). Kanske är han på jakt efter ett smaskigt språkprov till sin ordbok?

Nja, kanske inte varje riksdagsdokument. Men de över hundra tusen dokumenten som numera finns i Wikidata gör det mer än väl. Det här inlägget är en återkoppling till inlägget om de riksdagsdokument som importerats till Wikidata som jag skrev för lite drygt ett år sedan. Se det här som en liten uppföljning, eller kanske utvikning till det.

Först ska vi kanske konstatera att det har hänt en hel del. Dels så har användare Popperipopp fortsatt att importera nya dokument allt eftersom att de har uppstått. Dels så har en del nya verktyg och arbetsmetoder gjort att vi kommit en bra bit på vägen med att lägga till ämnen på dokumenten. Till exempel kan vi se att drygt 17 000 motioner har fått ämnen och att dryga 14% nu har minst ett ämne angivet.

Men det var egentligen inte det som jag tänkte berätta om idag. Istället tänkte jag berätta om ett annat sätt som dokumenten har gjort det lättare att arbeta på Wikidata som jag inte nämnde sist, och det är i arbetet med lexem.

Kort om vad lexem är

Innan vi dyker ner i det behöver jag nog kort förklara vad ett lexem på Wikidata är. I korthet kan man säga att det är ett sätt att på ett strukturerat sätt beskriva språkets olika delar. Det kan dels komma till användning på Wiktionary, men framför allt, i framtiden, så är det avgörande för att få Abstract Wikipedia att fungera. Vill du höra en djupare förklaring så lyssna på avsnitt 83 av Wikipediapodden där det diskuteras. Blev du nyfiken på Abstract Wikipedia, lyssna istället på avsnitt 154.

Hur hjälper riksdagsdokumenten?

Ett sätt att etablera relevans för ett lexem är att ange exempel på hur det används i språket. Det gör det också lättare att förstå ett ord. Wikidataegenskapen språkprov är som gjord för detta. Ord som förekommer i riksdagens dokument är en stark indikator på att det är väl utbrett i språket.

Dessutom är det väldigt enkelt att källhänvisa till ett riksdagsdokument nu. Under referensen kan man helt enkelt nyttja egenskapen anges i och börja skriva namnet på dokumentet. Lägg till dagens datum som hämtdatum och vips: en referens av hög klass.

För att hitta lämpliga dokument att hänvisa i kan man med fördel använda riksdagens egna söktjänst. Tyvärr är den lite för ”smart” och det kan vara svårt att hitta specifika böjningar av ett ord, eller former som de kallas i Wikidata. Å andra sidan finns det väldigt många olika ord representerade.

Ett praktiskt exempel

För att se hur det kan se ut i praktiken kan vi titta på lexemet för klimatförändring. Där kan vi dels se att alla former har fått ett språkprov, dels att de flesta språkproven har ett exempel från Riksdagens dokument.

Skärmbild från det översta språkprovet på lexemet klimatförändring.

Att lägga till bestämningsorden som i exemplet här ovan är lite bökigt då sökfunktionen funkar dåligt. Istället kan man kopiera id:et som anges framför formen och betydelsen. I det här fallet L242121-F1 respektive L242121-S1.

Som vanligt i wikivärlden behöver det inte bli komplett på en gång. Vi bygger det tillsammans, bit för bit. Om du lägger till ett exempel lite då och då så hjälper du till att ta oss i rätt riktning.

Kom ihåg, när du vill söka efter ett lexem på Wikidata måste du lägga till namnrymden (eller dess förkortning) före. Exempelvis L:räksmörgås.