Reinforcement Learning (RL) krijgt een systeem van beloningen en straffen. Versterkend leren is breder dan gecontroleerd of niet-gesuperviseerd leren om een doel te bereiken of gewoon te profiteren van prikkels en sancties van contact met de omgeving.
In welk type beloningen en straffen wordt als feedback gegeven?
De eerste is evaluatieve feedback als bekrachtiging, waarbij beloningen en straffen worden gebruikt om het gedrag van de leerling vorm te geven door middel van versterkende leermechanismen.
Wat zijn de soorten beloning en straf?
Laten we nu deze vier termen combineren: positieve bekrachtiging, negatieve bekrachtiging, positieve straf en negatieve straf (Tabel 1). Er wordt iets toegevoegd om de kans op gedrag te vergroten. Er wordt iets toegevoegd om de kans op gedrag te verkleinen.
Welk type leren is gebaseerd op een benadering van beloning en straf?
Impliciet, zonder bewuste verwerking, leren individuen over de beloning en strafwaarde van elke context en activiteit. Deze associatieve leerprocessen beïnvloeden op hun beurt de waarschijnlijkheid dat individuen zich opnieuw zullen bezighouden met dergelijke activiteiten of die context zullen opzoeken.
Hoe beïnvloeden beloning en straf het leren?
Over het algemeen zagen we weinig effect van beloning op leren of retentie. Straf had geen effect op het behoud van vaardigheden, maar had significante,taakafhankelijke effecten op het leren. In de SRTT straf verbeterde snelheid met minimale impact op nauwkeurigheid. Daarentegen verminderde straf de prestaties op de FTT.