Edaens inscanningsprojekt

Som aktiv Wikipedian har användaren Edaen en lång meritlista och här kommer lite mer information om det nya projektet. Genom Wikimedias projektområden Gemenskapens projekt och Teknikpoolen har Edaen nu en ny utrustning för att scanna gamla böcker. Några personer är aktiva och scannar gamla böcker, men då klipps böckerna upp och läggs i en scanner som matar in sida för sida.

Edaen har nu valt att scanna gamla böcker, som är sällsynta, och de måste vara oförstörda efter inscanning. Så låt oss höra mer om projektet.

Du har startat ett inscanningsprojekt hemma. Kan du berätta kort om din lilla arbetsstation du byggt?

Arbetsstationen består av en kamera, ett bordsstativ, en gummibandsbelastad plexiglasskiva och två arbetslampor och dessutom en svart pläd för att stänga ute solljuset samt en enkel ställning till lamporna. När jag först började digitalisera böcker använde jag dagsljus. Det gav olika belysning av olika delar av materialet på grund av att solen hinner flytta sig under arbetets gång och varierande molnighet. Plexiglasskivan är framför allt till för att få sidan som fotograferas plan, men också för att boken skall ligga stilla.

Jag bläddrar igenom boken två gånger, först fotograferas, t. ex., udda sidor och sedan jämna. Efter att materialet överförts till datorn använder jag Irfanview för att numrera om sidorna så att de kommer i rätt följd. För att ta fram själva boksidan ur fotot tar jag hjälp av Scan Tailor. Detta är för att förbereda sidorna för den djvu-fil som sedan laddas upp på Commons. De bilder som skapas av Scan Tailor används även för OCR-tolkning med hjälp av programmet VietOCR. OCR-tolken skapar en textfil för varje bild, dessa sammanfogas och bearbetas i en ordbehandlare – sammanfogning av avstavade ord och enklare korrigering av tolkningsfel. När djvu-filen lagts upp på Commons görs en indexsida för verket på Wikisource där den OCR-tolkade texten kan läggas upp för manuell korrekturläsning och formatering – sida för sida jämsides med bilden av boksidan.

Du har beställt Flintbergs Lagfarenhetsbibliotek och börjat scanna dem. Är det något särskilt du hoppas finna i böckerna?

Jacob Albrecht Flintbergs ”Lagfarenhets-bibliothek” är en jämförande kommentar och den enda rättsfallssamling för 1700-talet som finns och används som källa av rättshistoriska författare i frågor om sådant som rätten till ollon och nötter. Jag hoppas att genom Flintberg få en bättre bild av hur man såg på frågan om rätten till naturalster under 1700-talet, men också att den kan användas för att ge exempel till rättshistoriska artiklar på Wikipedia.

Du har tidigare scannat lite olika böcker, vad är det som är din drivkraft i detta arbete?

Det som fick mig att börja med det här projektet var en händelse i början av året där en användare på svenskspråkiga Wikipedia lade in uppgifter om allemansrättens ursprung som jag tyckte var överraskande. Diskussionen gick över till att handla om uttrycket ”allemansrätten” fanns på något annat ställe i SOU 1940:12 än i ett pm bifogat betänkandet. Det blev jag som lånade hem SOU:n och lade upp den på Commons. Projektet har efter hand vidgats till att omfatta i princip allt upphovsrättsligt fritt material med anknytning till allemansrätten. Bland större delprojekt kan nämnas 1734 års lag i ursprunglig lydelse och ”Lagberedningens förslag till jordabalk III” samt flera SOU:er.

Har projektet något slutdatum, eller när känner du att du är klar med arbetet?

Det större projektet har inget bortre datum, men pågående delprojekt vad gäller själva inskanningen är dels Flintbergs Lagfarenhetsbibliotek och riksdagsbehandlingen av samtliga de motioner som rör bärplockning under perioden 1899–ca 1960 samt även riksdagsbehandlingen av strafflagsändringar som rör naturalster.

Tack så mycket för intervjun, och Lycka till!

Projektet kan följas fortlöpande på Edaen/WMSE-projekt