Plus

Drie miljard tweets: 'Een goudmijn voor een taalonderzoeker'

Antal van den Bosch (47) is sinds 1 januari directeur van het Meertens Instituut. Hij ziet zichzelf als een technologiepositivist. 'Computers zijn een wonder.'

Antal van den Bosch: 'Ik hoop vooral dat we de nuance in het debat kunnen bieden' Beeld Marc Driessen

Drie miljard tweets heeft Antal van den Bosch (47) van het internet geplukt. Wat moet een mens met drie miljard berichten? Een goudmijn, vindt Van den Bosch het. Het is een berg data waar je als taalonderzoeker eindeloos veel interessante zoekacties op kunt loslaten.

Van den Bosch, taalkundige en hoogleraar taal- en spraaktechnologie aan de Radboud Universiteit Nijmegen, is sinds 1 januari de nieuwe directeur van het Meertens Instituut, het instituut dat beroemd werd dankzij Het Bureau van J. J. Voskuil en dat onderzoek doet naar de Nederlandse taal en cultuur in de breedste zin van het woord. Van den Bosch, die de oude tafel van Voskuil in zijn kantoor heeft staan, volgt Hans Bennis op, die na achttien jaar directeur wordt van de Taalunie.

U bent een computernerd die een klassiek taal- en cultuurinstituut gaat leiden. Dat is best een overgang.
"Ik heb altijd in de techniek gezeten, ik programmeer sinds ik elf ben. Computers zijn een wonder. Maar ik ben ook altijd geïnteresseerd geweest in taal. In veel landen ligt computerlinguïstiek dicht bij informatica, maar bij ons valt het onder de letteren."

"Dat is niet vreemd, want natuurlijke taalverwerking is altijd een van de hoofddoelen geweest: denk aan autocorrectie, automatisch vertalen en spraakherkenning, maar ook aan het gebruik van taal in software."

"Grote bedrijven hebben nu behoefte aan geesteswetenschappers die de zachte kanten van taal en cultuur begrijpen. Computers en software zijn erg gericht op de Angelsaksische wereld, maar de Aziatische en Afrikaanse markt is ook groot en vereist een andere benadering van de taal en cultuur van gebruikers."

Betekent het ook dat u andere accenten gaat leggen bij het onderzoek dat wordt gedaan?
"Het Meertens Instituut blijft doen waar het goed in is: de boerderijcultuur, de achtergrond van Zwarte Piet en dialecten onderzoeken. Ik ga ook niemand dwingen data-analyse per computer te doen, maar nieuwe onderzoekers die worden aangenomen moeten wel gewend zijn met data en computers te werken."

"Sociale media zijn trouwens al heel gebruikelijk in het onderzoek naar taal. Er zijn tienduizenden mensen die tweeten in het Brabants of het Fries - om afspraken te maken en hun identiteit en trots uit te dragen."

Wat doet u met de drie miljard tweets die u heeft verzameld?
"Daar kun je data-analyses op uitvoeren. Zo hebben we onderzoek gedaan naar sarcasme in tweets. In 400.000 tweets wordt de hashtag sarcasme gebruikt. Op basis daarvan kan de computer een sarcasmefilter leren, en in dat filter kun je zien wat voor woorden en onderwerpen vaak sarcastisch worden ingezet. Ook zie je dat veel mensen 'codeswitchen' - meer talen, zoals Arabisch, Engels of Turks, met Nederlands combineren in één bericht."

Wat kunnen we daarmee?
"In plaats van enquêtes houden en vragenlijsten laten invullen, zoals veel onderzoekers voorheen deden, kunnen we vanaf ons bureau vragen op data loslaten en zo inzicht krijgen in de manier waarop het Nederlands verandert. Zo kunnen we iets als populistisch taalgebruik onderzoeken."

24

Er zijn 24 miljoen varianten van het Nederlands: iedereen die de taal spreekt heeft zijn eigen versie

Wat is dat? Hoe wordt het gebruikt? Dat soort onderzoek kunnen we ook in samenwerking met andere instituten van de Koninklijke Nederlandse Akademie van Wetenschappen doen."

Wat voor rol hoopt u te spelen in het debat over de Nederlandse cultuur?
"We zijn als instituut niet voorschrijvend. Wij gaan niet zeggen dat spelling op een bepaalde manier moet, al vind ik het eigenlijk ook onzinnig dat we voor spelling zulke strenge regels hebben, dat het zelfs is vastgelegd in de wet."

"Ik hoop vooral dat we de nuance in het debat kunnen bieden, dat onze experts aan tafel in De Wereld Draait Door worden uitgenodigd en de ruimte krijgen om een gelaagd verhaal te vertellen."

Juist in deze tijd van zoeken naar onze identiteit ligt die beïnvloeding van het Nederlands gevoelig.
"Daar kan het Meertens Instituut ook een rol in spelen, bijvoorbeeld door te laten zien dat het Nederlands altijd een speelbal is geweest, onderhevig aan veranderingen, zoals immigratie. De beïnvloeding en de weerstand tegen die verandering zijn van alle tijden. Er zijn 24 miljoen 'Nederlandsen'."

"Eigenlijk heeft iedereen die de taal spreekt een eigen variant, beïnvloed door hoe je ouders spraken, waar je woont, hoe je vrienden spreken; iedereen gebruikt zijn eigen persoonlijke versie van het Nederlands. Dankzij computertechnologie zou je modellen kunnen maken van al die verschillende versies en dan de ultieme taalbeschrijving maken."

U bent een echte technologiepositivist.
"Dat klopt. Ik ben ook altijd een early adopter. Volgens mij kan techniek prima naast andere goede dingen blijven bestaan. Maar papier gaat verdwijnen, teksten worden ook steeds meer geautomatiseerd. Waarom zou je nog zelf een e-mail schrijven als de computer dat straks uitstekend voor jou kan doen? Ik zie daar geen gevaar in, maar ik begrijp dat mensen ook scepsis ervaren."

Meer over

Wilt u belangrijke informatie delen met Het Parool?

Tip hier onze journalisten


Op alle verhalen van Het Parool rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@parool .nl.
© 2019 DPG Media B.V. - alle rechten voorbehouden