Taal is primair een instrument om met elkaar te communiceren. Het is dan ook logisch om over afasie te denken in termen van communicatie. Daarom heeft de analyse van spontane taal, de taal die mensen gebruiken om over alledaagse zaken met elkaar te communiceren, een speciale plaats in de batterij van taalkundige tests van afasie.
Het is lastig om spontane taal te analyseren, want voordat variabelen berekend kunnen worden die de eigenschappen van de taal samenvatten, dient er eest een nauwkeurige transcriptie opgesteld te worden. Dat is arbeidsintensief, zeker als bijvoorbeeld ook gecodeerd moet worden wanneer bepaalde woorden, zinnen of stiltes voorkomen in een gesprek.
Roelant Ossewaarde, promovendus bij prof.dr. Roel Jonkers aan de Rijksuniversiteit Groningen en docent informatie aan de Hogeschool Utrecht, werkt aan promotieonderzoek naar de vraag hoe software kan helpen bij het maken van transcripties van de taal van mensen met afasie. Hij richt zich vooral op afasie die wordt veroorzaakt door een degeneratieve neurologische aandoening, in het bijzonder bij mensen met Primair Progressieve Afasie.
Taal- en spraaktechnologie in het algemeen worden al in ruime mate gebruikt voor taken die lijken op onderdelen van het transcriptieproces. Het zou mogelijk moeten zijn om die technologie ook toe te passen op de spraak van mensen met afasie. Tegelijk stelt die specifieke doelgroep onderzoekers ook voor nieuwe uitdagingen. De taal van mensen met afasie wijkt immers bijna per definitie af van de taal van gezonde mensen. Veel toepassingen in de taal- en spraaktechnologie maken gebruik van machine learning. Machine learning is gebaseerd op het vinden van verbanden die geleerd zijn uit grootschalige databases – meestal juist de data van gezonde mensen. Zulke modellen zijn dus niet per definitie één-op-één toe te passen op afwijkende taal.
Waar taaltechnologie al wel wordt toegepast, kunnen complexe variabelen berekend worden die met de hand bijna niet bepaald kunnen worden. In een studie van Fraser et al (2013) aan de universiteit van Toronto werden bijvoorbeeld allerlei karakteristieken van de boomstructuur van zinnen gebruikt in een voorspellend model. Het maken van analyses van syntax op dat niveau is ondoenlijk om met de hand te doen, maar met technieken vanuit de corpuslinguïstiek is dat met een redelijke accuratesse haalbaar. Zo maakt de inzet van technologie het niet alleen eenvoudiger om taal te analyseren, het leidt ook tot meer inzicht in de sporen die afasie achterlaat in spontane taal.
Voor het zover is, moet er nog veel gebeuren. In de context van dit onderzoek wordt, onder begeleiding van prof.dr. Yolande Pijnenburg, een corpus aangelegd met gesprekken met mensen met Primair Progressieve Afasie bij het Alzheimercentrum van het Amsterdam UMC. De deelnemers worden longitudinaal gevolgd, om een beeld te vormen van de mate waarin de spontane taal verandert bij het verloop van de ziekte.
Het lukt al heel aardig om de vloeiendheidspatronen van mensen met een niet-vloeiende taalstoornis in kaart te brengen. Daar wordt software voor gebruikt die kan detecteren waar en wanneer er stiltes vallen, hoe lang die duren, en wat hun verhouding is met gevulde pauzes (‘/eh/’ of ‘/ehm/’). Minder volwassen is nog de technologie om met spraakherkenning te detecteren welke woorden iemand gebruikt. Informaticastudenten van de Hogeschool Utrecht werken daarom aan projecten om de grootschalige spraakmodellen die zijn opgebouwd met gezonde, meestal jonge, deelnemers, geschikt te maken om te gebruiken in de context van oudere mensen met afwijkende taal. Dat is taaie materie, maar het stelt computationele taalkundigen ook in staat om hun modellen breder toepasbaar te maken.
Het is de hoop dat het meten van woorden, zinsconstructies en andere eigenschappen van taal, veel eenvoudiger worden door dit onderzoek. Dat maakt het beter mogelijk om spontane taal te bestuderen, zowel voor klinische doeleinden als voor onderzoek.