*

Parool.nl
Vrij, Onverveerd

UvA werkt aan alternatief voor Google Translate

12-11-14   16:00 uur  - Bron: Het Parool

Oister houdt wél rekening met plaats van werkwoord

© anp

Woordenboeken lijken iets van de vorige eeuw te zijn, met dank aan Google Translate. Die vertaaldienst is weliswaar creatief, maar niet altijd even correct. De Universiteit van Amsterdam (UvA) werkt daarom aan het vertaalsysteem Oister, dat, tamelijk cruciaal, wél rekening houdt met de plaats van het werkwoord in de zin.

Hoe haal je het beste uit Google Translate?

X De vertaling is beter tussen twee talen die grammaticaal veel overeenkomsten hebben. Voorbeelden zijn Spaans-Engels en Frans-Engels, maar ook opvallende taalparen zoals Bulgaars-Engels en Indonesisch-Engels doen het behoorlijk goed. Minder geslaagde koppels zijn Koreaans-Engels en Japans-Engels.
X Uiteraard geldt: hoe moeilijker de taal, hoe groter de kans op een verkeerde vertaling. Duits en Russisch zijn bijvoorbeeld lastig door alle naamvallen en het onderscheid tussen mannelijk en vrouwelijk. Met Spaans en Engels heb je meer succes.
X Probeer alvast de volgorde van de zin in de doeltaal - de taal waarin vertaald wordt - te benaderen. Een voorbeeld: 'De politie greep meteen na de demonstratie in' is volgens Google Translate 'The police seized shortly after the demonstration in'. Dit is natuurlijk fout, 'grijpen' is letterlijk vertaald. Zorg daarom dat 'in' en 'grijpen' dichter bij elkaar staan: 'De politie greep in kort na de demonstratie' wordt dan correct vertaald als: 'The police intervened shortly after the demonstration'.

'Beroemdheid Jurken hebben de beste kwaliteit beroemdheid jurken worden verkocht, kunnen wij afhan op uw bestelling grootte (we kunnen accepteren alle op maat gemaakte jurken van onze website), als je van andere model jurken, kun je je als afbeelding sturen, kunnen we afhankelijk op uw bestelling foto!' Hoe we precies een 'beroemdheid jurk' moeten bestellen, is ons nog niet duidelijk. Maar één ding weten we na het lezen van dit intro van een trouwjurkensite wél: de schrijver had een blind vertrouwen in de vertaalcapaciteit van Google Translate.

Grote kans dat vertalingen van dit kaliber straks tot het verleden behoren. De UvA ontwikkelde onlangs de nieuwe methode Oister, die op een andere manier opereert dan de huidige systemen, maar nog te veel tijd kost. Universitair hoofddocent Christof Monz is één van de ontwikkelaars van het nieuwe systeem, met post-doc onderzoeker Arianna Bisazza en promovendus Ke Tran.

Context
Monz werkt voor het instituut voor informatica aan de faculteit natuurwetenschappen, wiskunde en informatica: een hele mond vol, maar met, opvallend genoeg, niets van taalkunde. Volgens de wetenschapper is de kunst van het machinaal vertalen namelijk eerder een statistische dan een linguïstische aangelegenheid.

'Een vertaalsysteem pakt allerlei vertalingen uit verschillende data, genereert daar vertaalregels uit en past deze vervolgens toe. Dat werkt op zich goed, maar het kijkt niet naar de context van een woord en weet daardoor niet altijd of iets enkel- of meervoud moet zijn. Ook houdt het vaak de oorspronkelijke woordvolgorde van een zin aan. Terwijl het per taal vaak verschilt waar bijvoorbeeld een werkwoord in de zin staat. Ons nieuwe systeem houdt hier wel rekening mee. Dat kost wat meer tijd, maar zorgt wel voor correctere vertalingen.'

Zinnen als 'kunnen we afhankelijk op uw bestelling foto!' hoeven we daardoor niet meer tegen te komen, zegt de onderzoeker. Fijn, maar het echte probleem van de hedendaagse machinale vertalers zit niet in deze zinnen. Hoe krom ze ook zijn, we snappen wel ongeveer waar het over gaat.


Lees vandaag (12-11) in PS Het Parool: 'Hoe haal je het beste uit Google Translate?'

(Door: Nienke Blokhuis)


gerelateerde artikelen

Alles over


Bestel nu het wijnpakket van Hamersma

GESPONSORDE LINKS


PAROOL NIEUWSBRIEF

Elke middag gratis de hoogtepunten uit het nieuws in uw mailbox?

U kunt zich voor deze service van Het Parool opgeven via parool.nl/lunchnieuws.
De Persgroep Digital
© 2015 - Alle rechten voorbehouden