Dr. Nawar Halabi – den arabiska rösten på Wikipedia?


Ett av våra största projekt just nu går ut på att ta fram en talsyntes på öppen källkod, som kommer användas på Wikipedia. Syntesen kommer lanseras på svenska, engelska och arabiska. Dr. Nawar Halabi, från University of Southampton, har gett oss en stor del av det material som gör det möjligt för oss att lansera den på arabiska. Vi bestämde oss för att ställa några frågor till honom.


”Med en arabisk talsyntes på Wikipedia skulle redigerare uppmuntras till att förbättra, korrigera och diakritisera arabisk skrift på Wikipedia för att det automatiskt ska läsas upp på ett bättre sätt. Det skulle i sin tur tillgängliggöra mer data för forskare när de bygger sina system för talsynteser, och driva tekniken framåt.”

                      – Nawar Halabi

Nawar, vad har du för bakgrund?

500px-wikispeech_logo_proposals_v1_logo_3-svg
Wikispeechs logga.

– Jag föddes i Aleppo i Syrien för 26 år sedan. I 22 år av mitt liv har jag bott där. Jag gick i skola där, och fick min examen i datavetenskap där. Jag tog även två examina i klassisk gitarr-performance där. 2012 flyttade jag till Southampton i Storbritannien för att påbörja en master i webbteknologi, och 2013 påbörjade jag min doktorsgrad. Den blev klar i september 2016, samtidigt som jag har arbetat med flera projekt som forskningsassistent.

Hur kommer det sig att du började arbeta på ett talsyntesprojekt? Varför är den typen av projekt viktiga?

– I tre år arbetade jag i en grupp för tekniska hjälpmedel vid fakulteten för elektronik och datavetenskap på Southamptons universitet. Därigenom växte mitt intresse för att utveckla teknologi som kan få människor stärkta och inkluderade. Att utveckla sådan teknologi är inte bara viktigt för människor med specialbehov, utan för alla, och talsyntes var mitt sätt att bidra i det arbetet. Dessutom finns det mycket intressant vetenskap kring talsyntes. Maskininlärning, artificiell intelligens, matematik, signal processing och så vidare. Ämnen som alla ligger nära mitt hjärta.

– Mitt intresse för maskinintelligens började redan som ung, men det var först i Southampton som jag upptäckte talsyntesen.

– Hur kommer det sig att du valde att släppa ditt arbete under en fri licens?

 Varje doktorand kämpar med att hitta ett syfte för sitt arbete, och för att få andra forskare att hitta och återanvända deras verk.  Att arbeta med Wikimedia är verkligen ett sätt för mig att sprida ordet om mitt arbete, och att lämna delar av mitt verk fritt ger mig glädjen att kunna känna att jag hjälper någon och uppmuntrar människor att använda mitt verk.

– För de som funderar över att släppa sitt arbete under en fri licens, vilka tips och erfarenheter skulle du vilja ge?

Gör det!
– Att ha ett fritt och välanvänt verktyg ökar dina möjligheter till anställning, och skapar dig ett namn.

– Men se till att informera den institution som sponsrar dig tidigt. Eftersom många institutioner är väldigt defensiva när det kommer till det arbete som utförs på deras domäner.

– Vad har du för förväntningar på Wikispeechs framtid?

– Jag skulle vilja se Wikispeech användas på Wikipedia, framförallt på arabiska, och personligen skulle jag älska att arbeta för dem i framtiden. Med en arabisk talsyntes på Wikipedia skulle redigerare uppmuntras till att förbättra, korrigera och diakritisera arabisk skrift på Wikipedia för att det automatiskt ska läsas upp på ett bättre sätt. Det skulle i sin tur tillgängliggöra mer data för forskare när de bygger sina system för talsynteser, och driva tekniken framåt.

eric_luth_28wmse29
Eric Luth
Projektadministratör,
Wikimedia Sverige
+46765 55 50 95
eric.luth@wikimedia.se