Een kijkje naar de overhoormethode Leren: spreiding en blijvende kennis

Jasper Naberman

Leerlingen verwarren gemakkelijk oefenen vaak met goed leren. De wetenschap laat iets anders zien [1] [2]. Geheugen wordt sterker wanneer je a) een antwoord oproept in plaats van het opnieuw te lezen [3] [4]; en b) herhalingen spreidt, zodat een volgende herhaling plaatsvindt na antwoorden al een beetje te zijn vergeten [5] [6] [7]. Die combinatie, het testeffect plus het spreidingseffect, creëert ‘gewenste moeilijkheid’: inspanning die nu wat zwaarder voelt maar waar je later profijt van hebt [8] [2].

De overhoormethode Leren in StudyGo zet dit principe al binnen één studiesessie om in de praktijk. In plaats van hetzelfde woordpaar meteen weer te tonen tijdens het woordjes leren, wisselen we items af tussen herhalingen en bouwen we de antwoordmodus op richting getypt terughalen (niet alleen herkennen). We doen dit omdat het niet ons doel is om oefencijfers kunstmatig op te krikken; we willen dat kennis blijft hangen op de momenten die ertoe doen (toetsen, proefwerken en gebruik in gesprekken).

Hoe Leren werkt

Een leerling kiest een woordenlijst, uit de schoolmethode of een eigen samengestelde lijst. In Leren doorloopt elk item een korte ladder van vraagtypen:

  1. Flashcard (bekijk beide kanten; een woord en de vertaling)
  2. Meerkeuze (kies uit vier vertaalopties)
  3. Hints (de eerste letter verschijnt, typ de rest)
  4. Open vraag (typ de volledige vertaling)

Zodra een item in elk vraagtype correct is beantwoord, wordt het als afgerond gemarkeerd en verdwijnt het uit de cyclus. Om zwakke plekken te versterken, verschijnt aan het eind nog een korte ronde waarin de meest foutgevoelige items terugkomen.

Spreiding verwijst naar de tijd tussen herhalingen van een item. Stel: een leerling ziet tijdens het leren voor Frans dat ‘bioscoop’ ‘cinéma’ betekent. Dat item komt eerst als Flashcard langs; daarna volgen meerdere andere items. Vervolgens verschijnt bioscoop-cinéma opnieuw, nu als meerkeuzevraag, enzovoort. Spreiding vindt plaats binnen een blok van items: nieuwe geïntroduceerde woorden duwen eerdere woorden uit elkaar; tegen het einde van zo’n blok wordt de spreiding weer wat kleiner. Meer uitleg over Leren kun je hier vinden.

Hoeveel spreiding geeft de juiste balans?

Leerlingen, ouders en leerkrachten hechten terecht waarde aan dat iets werkt in de klas en thuis, niet alleen in een lab. Daarom hebben we twee versies van Leren in StudyGo zelf vergeleken, waarbij het enige verschil was hoeveel spreiding er werd toegepast. Alles bleef verder hetzelfde: de inhoud, de stappen binnen Leren en de manier waarop we antwoorden beoordelen. Om de vergelijking eerlijk te maken wees het systeem leerlingen stilletjes en willekeurig toe aan de ene of de andere versie. Dit wordt vaak een A/B-test genoemd, maar je kunt het gewoon zien als het opgooien van een muntje dat de twee groepen in balans brengt, zodat we een eventueel later verschil kunnen toeschrijven aan de spreiding en niet aan wie toevallig welke versie gebruikte.

Vervolgens keken we wat er daarna gebeurde, zonder leerlingen te vragen hun gewoonten aan te passen. Sommige leerlingen gingen rechtstreeks van Leren door naar een latere Toets (een andere overhoormethode) op dezelfde lijst, anderen kwamen terug na een korte pauze en weer anderen wachtten langer. Die natuurlijke variatie is nuttig, omdat we zo kunnen zien of het voordeel van spreiding afhangt van de tijd tussen leren en toetsen. Het onderzoek is uitgevoerd als onderdeel van een masterscriptie door onze Data Scientist Tatiana Litvin, in samenwerking met de Vrije Universiteit Amsterdam en prof. dr. Martijn Meeter.

Wat we hebben gemeten (en waarom)

Onze belangrijkste uitkomst was het cijfer in Toets op dezelfde lijst, omdat dat echt iets zei over daadwerkelijk later kennisbehoud. Daarnaast keken we naar het Leren-cijfer (dus tijdens het oefenen), omdat dat vertelt hoe de leersessie in het moment voelde. Om de vergelijking eerlijk te houden, corrigeerden we voor de tijd tussen Leren en Toets, voor de duur van de Leren-sessie en voor eventuele extra oefenrondes op dezelfde lijst tussendoor. Om het even technisch te zeggen, we gebruikten een statistisch model dat elke leerling en elke lijst zijn eigen referentiepunt geeft, zodat we een moeilijke lijst niet verwarren met een makkelijke, of een gevorderde leerling met een beginner.

Wat er gebeurde binnen Leren

Zoals verwacht voelde de versie met minder (dus krappere) spreiding makkelijker. Zoals te zien is in Figuur 1, waren cijfers tijdens Leren iets hoger wanneer items sneller terugkwamen (de ‘small block’-lijn). Dat voelt de leerling ook: minder momenten van “hmm, hoe zat het ook alweer?” en meer vloeiende, bekende antwoorden. De keerzijde is dat veel van die ‘gemakkelijke’ successen komen door herkenning en zeer korte intervallen tussen herhalingen. Ze geven terecht zelfvertrouwen, maar dagen het geheugen misschien net niet genoeg uit om écht te blijven plakken.

Figuur 1.  Effect van de verandering in spreiding (‘Groups’) en overhoormethode (‘Quiz type’) op cijfers (‘Mean grade’).

Wat er gebeurde binnen Toets

In Figuur 1 zien we ook dat leerlingen die oefenden met ruimere spreiding (‘large block’) het beter deden toen zij dezelfde lijst toetsten. Gemiddeld lagen de Toets-cijfers enkele punten hoger in de groep met meer spreiding. We bekeken ook of dit voordeel pas na lange pauzes ontstaat. Dat is niet zo. Veel leerlingen maken eigenlijk al binnen een uur na Leren een Toets-oefening, en het voordeel van ruimere spreiding is zelfs dan al zichtbaar; het blijft aanwezig naarmate de tijd tussen Leren en Toets groter wordt. Dat zie je in Figuur 2: ‘large block’ (meer spreiding) presteert gemiddeld en consistent beter dan ‘small  block’ (minder spreiding).

Figuur 2. Het verschil in cijfers (‘Average Grade’) blijft consistent over tijd (‘Time Difference’).

Waarom dit patroon eigenlijk best logisch is

Een antwoord uit het hoofd typen is alsof je met een iets zwaarder gewicht traint. Het hoeft niet onmogelijk te zijn, maar er moet genoeg uitdaging zijn om de gewenste aanpassing uit te lokken. Meer spreiding creëert die uitdaging door een ‘beetje vergeten’ toe te laten tussen ontmoetingen. Als een item na andere items terugkomt, moet je het heropbouwen. Precies die inspanning versterkt het geheugen. De tijdelijke dip in vloeiendheid tijdens oefenen is dus geen fout, het is juist de weg naar beter herinneren op het moment dat ertoe doet.

Wat dit betekent voor leerlingen, leraren en ouders

Als Leren soms net wat pittiger voelt, zeker vergeleken met oefeningen waarin hetzelfde item meteen terugkomt, dan is dat opzettelijk. Lagere oefencijfers betekenen geen mislukking; ze laten zien dat je het soort werk doet dat zich uitbetaalt bij een latere toets. Voor leraren is de boodschap bemoedigend: je hoeft geen extra huiswerk of nieuw materiaal in te zetten om dit voordeel te krijgen. Het algoritme verschuift de inspanning binnen de sessie, een beetje minder nadruk op nu, een beetje meer op winst straks. Voor ouders helpt het om de oefenfase te zien als training, niet als rapportcijfer. Enkele extra “hmm, even denken”-momenten vandaag betekenen vaak minder lege blikken morgen.

Wat we op het platform hebben aangepast

Op basis van deze resultaten standaardiseren we de ruimere spreiding in Leren. Achter de schermen betekent dit dat er meer items tegelijk in het spel blijven, zodat herhalingen verder uit elkaar liggen binnen een sessie. De stappen die je als leerling ziet (Flashcard, Meerkeuze, Hints, Open vraag) blijven precies hetzelfde, en de lijsten waaruit je kiest ook. Wat verandert, is het ritme tussen herhalingen.

Ruimere spreiding binnen één Leren-sessie leidt tot betere herinnering in een latere Toets, ook als oefenen in het moment net wat zwaarder voelt. Daarom maken we dit de standaard. Voor leerlingen betekent dit dat meer van de inspanning van vandaag terugkomt op de momenten die tellen; voor leraren en ouders betekent het dat StudyGo stilletjes meewerkt op de achtergrond, zodat leerlingen niet langer hoeven te studeren of hun routine hoeven aan te passen. We blijven ons hieraan houden: ontwerpen op basis van leertechniek, zorgvuldig checken in echt gebruik, en alleen datgene toepassen wat kennis versterkt.

Bronnen

[1] Soderstrom, N. C., & Bjork, R. A. (2015). Learning versus performance: An integrative review. Perspectives on Psychological Science, 10(2), 176-199. (link)

[2] Bjork, E. L., & Bjork, R. (2014). Making things hard on yourself, but in a good way: Creating desirable difficulties to enhance learning. In Psychology and the real world: Essays illustrating fundamental contributions to society (2nd ed., pp. 59-68). New York: Worth Publishing.

[3] Karpicke, J. D., & Roediger, H. L. (2008). The critical importance of retrieval for learning. Science, 319, 966–968. (link)

[4] Roediger, H. L., & Karpicke, J. D. (2006). Test-enhanced learning: Taking memory tests improves long-term retention. Psychological Science, 17(3), 249-255. (link)

[5] Kornell, N. (2009). Optimising learning using flashcards: Spacing is more effective than cramming. Applied Cognitive Psychology, 23(9), 1297-1317. (link)

[6] Karpicke, J. D., & Bauernschmidt, A. (2011). Spaced retrieval: Absolute spacing enhances learning regardless of relative spacing. Journal of Experimental Psychology: Learning, Memory, and Cognition, 37(5), 1250-1257. (link)

[7] Nakata, T., & Suzuki, Y. (2019). Effects of massing and spacing on the learning of semantically related and unrelated words. Studies in Second Language Acquisition, 41(2), 287-311. (link)

[8] Pyc, M. A., & Rawson, K. A. (2009). Testing the retrieval effort hypothesis: Does greater difficulty correctly recalling information lead to higher levels of memory? Journal of Memory and Language, 60(4), 437-447. (link)

Meer dan alleen antwoorden: hoe AI de manier van leren verandert

Jasper Naberman

AI in het onderwijs: je hebt er vast wel eens over gehoord. Misschien gebruik je zelf ChatGPT of vergelijkbare programma’s. Hoewel deze hulpmiddelen indrukwekkend en erg handig kunnen zijn, is niet alle feedback positief. Waarom werkt AI (kunstmatige intelligentie) soms heel goed, terwijl het andere keren lijkt tegen te vallen?

Bij StudyGo is het ons doel om met behulp van slimme technologie onderwijs persoonlijker en effectiever te maken voor elke middelbare scholier. AI kan hierbij een krachtige tool zijn, maar alleen als je het op de juiste manier inzet. In deze blog leggen we uit hoe wij AI inzetten om leerlingen beter en effectiever te laten leren.

Waarom levert AI in het onderwijs wisselende resultaten op?

Veel leerlingen gebruiken AI, zoals ChatGPT, vooral om snel antwoorden of samenvattingen te krijgen. Superhandig natuurlijk, maar niet altijd even effectief. Uit onderzoek blijkt namelijk dat leerlingen die AI vooral als ‘antwoordmachine’ gebruiken, minder diep leren. Dit komt doordat ze minder actief nadenken en sneller denken iets te snappen zonder écht begrip te ontwikkelen. [1]

Vergelijk het maar met huiswerkvragen even snel googelen: handig voor een toets, maar niet ideaal om de stof écht onder de knie te krijgen.

De aanpak van StudyGo: AI inzetten voor actief leren

Bij StudyGo pakken we het anders aan. Onze nieuwe AI-tutor helpt leerlingen om actief met de lesstof aan de slag te gaan. Geen kant-en-klare antwoorden, maar gerichte vragen die scholieren stimuleren zelf na te denken. Dit heet ook wel een Socratische aanpak.

De tutor stelt gerichte vragen, laat leerlingen zelf het antwoord vinden en begeleidt ze stap-voor-stap door de stof heen.

Uit onderzoek blijkt dat deze Socratische methode, ook toegepast in AI-omgevingen, leerlingen beter helpt om kritisch na te denken en de stof beter te onthouden. [2] [3] [4]

AI-tutor: verbeterde inzichten en testgesprekjes

De AI-tutor op StudyGo is altijd zichtbaar aan de zijkant van het scherm. Hierdoor worden leerlingen aangemoedigd om regelmatig met de tutor te communiceren, zonder dat ze de aandacht voor hun opdrachten verliezen.

Uit een recent onderzoek hiernaar blijkt dat leerlingen veel vaker interactie hebben met de AI-tutor dan voorheen. Vooral leerlingen die actief met de tutor werkten, toonden betere inzichten in de lesstof en kwamen vaker terug naar het platform. Dit geeft aan dat scholieren de AI-tutor zien als waardevolle hulp bij hun leerproces.

Maar we zagen ook verbeterpunten. Soms leidde de open structuur van de tutor tot ongerichte gesprekken, die niet altijd productief waren. Dit helpt ons om de tutor verder te verbeteren en ervoor te zorgen dat elke interactie waardevol blijft.

Tegelijkertijd zagen we ook meer ’testgesprekjes’: leerlingen die de tutor vooral even wilden uitproberen. Dat zorgde voor wat frustratie bij sommigen, maar de meerderheid had juist een positieve leerervaring.

Dit zegt ons dat enkel de Socratische methode toepassen nog niet genoeg is. Het is een goed begin, maar kan nog verder uitgebreid worden:

  • Door leersessies meer doelgedreven te maken [5]
  • Door de AI-tutor kennis te geven over welke lesstof relevant is voor een leerling [6]
  • Door te reflecteren op het geleerde [7]
  • Nog veel meer!

Wat betekent dit voor onze menselijke tutors?

Misschien denk je nu: “Vervangt deze AI-tutor dan de menselijke tutors?” Goed nieuws: absoluut niet! Ons onderzoek laat zien dat leerlingen net zo vaak menselijke tutors blijven inschakelen. De AI-tutor is dus een aanvulling en geen vervanging. Leerlingen blijven regelmatig gebruikmaken van de persoonlijke ondersteuning van onze deskundige en gescreende tutors, die dagelijks tussen 15:00 en 22:00 via de chat live bereikbaar zijn om uitleg te geven wanneer dat nodig is.

Onze menselijke tutors blijven onmisbaar, terwijl de AI-tutor leerlingen extra ondersteuning biedt wanneer ze zelfstandig aan de slag gaan.

We beginnen net!

We blijven continu onderzoek doen om te ontdekken hoe AI het onderwijs nog beter kan ondersteunen. Onze ambitie is duidelijk: onderwijs slimmer en persoonlijker maken, voor elke leerling.

Probeer nu onze AI-tutor zelf of houd onze blog in de gaten voor meer inzichten en updates.

Bronnen

[1] Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning: Evidence from high school mathematics. Proceedings of the National Academy of Sciences, 122(26), e2422633122. (link)

[2] Fakour, H., & Imani, M. (2025). Socratic wisdom in the age of AI: A comparative study of ChatGPT and human tutors in enhancing critical thinking skills. Frontiers in Education, 10, 1528603. (link)

[3] Favero, L., Pérez-Ortiz, J. A., Käser, T., & Oliver, N. (2024). Enhancing critical thinking in education by means of a Socratic chatbot. In ECAI’24: International Workshop on AI in Education and Educational Research (AIEER), October 19-20, 2024, Santiago de Compostela, Spain. (link)

[4] Pitorini, D. E., Suciati, & Harlita. (2024). Students’ critical thinking skills using an e-module based on problem-based learning combined with Socratic dialogue. Journal of Learning for Development, 11(1), 52-65. (link)

[5] Wang, F., Zhou, X., Li, K., Cheung, A. C. K., & Tian, M. (2025). The effects of artificial intelligence-based interactive scaffolding on secondary students’ speaking performance, goal setting, self-evaluation, and motivation in informal digital learning of English. Interactive Learning Environments. Advance online publication. (link)

[6] Levonian, Z., Henkel, O., Li, C., & Postle, M.-E. (2025). Designing safe and relevant generative chats for math learning in intelligent tutoring systems. Journal of Educational Data Mining, 17(1), 66–97. (link)

[7] Kumar, H., Xiao, R., Lawson, B., Musabirov, I., Shi, J., Wang, X., Luo, H., Williams, J. J., Rafferty, A., Stamper, J., & Liut, M. (2024). Supporting self‑reflection at scale with large language models: Insights from randomized field experiments in classrooms. arXiv preprint. (link)

it_ITItaliano