So funktionieren Verstärkungspläne

Operante Konditionierung ist ein Lernprozess, bei dem neue Verhaltensweisen durch ihre Verknüpfung mit Konsequenzen erworben und modifiziert werden. Die Verstärkung eines Verhaltens erhöht die Wahrscheinlichkeit, dass es in Zukunft wieder auftritt, während die Bestrafung eines Verhaltens die Wahrscheinlichkeit verringert, dass es wiederholt wird.

Bei der operanten Konditionierung sind Verstärkungspläne ein wichtiger Bestandteil des Lernprozesses. Wann und wie oft wir ein Verhalten verstärken, kann einen dramatischen Einfluss auf die Stärke und Geschwindigkeit der Reaktion haben.

Zeitplan der Verstärkung

Ein Verstärkungsplan ist im Grunde eine Regel, die festlegt, welche Verhaltensweisen verstärkt werden. In einigen Fällen kann ein Verhalten jedes Mal verstärkt werden, wenn es auftritt. Manchmal kann ein Verhalten überhaupt nicht verstärkt werden.

Als Teil der operanten Konditionierung kann entweder positive Verstärkung oder negative Verstärkung verwendet werden. In beiden Fällen besteht das Ziel der Verstärkung darin, ein Verhalten so zu verstärken, dass es wahrscheinlich wieder auftritt.

Verstärkungspläne finden sowohl in natürlich vorkommenden Lernsituationen als auch in strukturierteren Trainingssituationen statt. In realen Umgebungen werden Verhaltensweisen wahrscheinlich nicht jedes Mal verstärkt, wenn sie auftreten. In Situationen, in denen Sie absichtlich versuchen, eine bestimmte Aktion zu verstärken (z. B. in der Schule, beim Sport oder beim Tiertraining), würden Sie einem bestimmten Verstärkungsplan folgen.

Einige Zeitpläne sind für bestimmte Arten von Trainingssituationen besser geeignet. In einigen Fällen kann das Training einen Zeitplan erfordern und dann zu einem anderen wechseln, sobald das gewünschte Verhalten gelehrt wurde.

Arten von Bewehrungsplänen

Die beiden Grundformen von Bewehrungsplänen werden als Durchlaufbewehrung und Teilbewehrung bezeichnet.

Kontinuierliche Verstärkung

Bei der kontinuierlichen Verstärkung wird das gewünschte Verhalten jedes Mal verstärkt, wenn es auftritt. Dieser Zeitplan wird am besten in der Anfangsphase des Lernens verwendet, um eine starke Verbindung zwischen Verhalten und Reaktion herzustellen.

Stellen Sie sich zum Beispiel vor, Sie wollen einem Hund beibringen, Ihre Hand zu schütteln. In der Anfangsphase des Lernens würden Sie sich an einen kontinuierlichen Verstärkungsplan halten, um das Verhalten zu lehren und zu etablieren. Dazu kann es gehören, die Pfote des Hundes zu greifen, sie zu schütteln, "schütteln" zu sagen und dann jedes Mal, wenn Sie diese Schritte ausführen, eine Belohnung anzubieten. Schließlich beginnt der Hund, die Aktion von selbst auszuführen.

Kontinuierliche Verstärkungspläne sind am effektivsten, wenn Sie versuchen, ein neues Verhalten beizubringen. Es bezeichnet ein Muster, auf das jeder eng definierten Reaktion eine eng definierte Konsequenz folgt.

Teilbewehrung

Sobald die Reaktion fest etabliert ist, wird normalerweise von einem kontinuierlichen Verstärkungsplan auf einen teilweisen Verstärkungsplan umgestellt. Bei einer teilweisen (oder intermittierenden) Verstärkung wird die Reaktion nur zeitweise verstärkt. Erlernte Verhaltensweisen werden mit teilweiser Verstärkung langsamer erworben, aber die Reaktion ist widerstandsfähiger gegen Auslöschung.

Denken Sie an das frühere Beispiel, in dem Sie einem Hund beibrachten, zu schütteln und. Während Sie anfangs kontinuierliche Verstärkung verwendet haben, ist es einfach unrealistisch, das Verhalten jedes Mal zu verstärken. Mit der Zeit würden Sie zu einem Teilzeitplan wechseln, um zusätzliche Verstärkung bereitzustellen, sobald das Verhalten festgestellt wurde oder nachdem eine beträchtliche Zeit vergangen ist.

Es gibt vier Pläne für die Teilbewehrung:

Zeitpläne mit festem Verhältnis

Fahrpläne mit festen Verhältnissen sind solche, bei denen eine Reaktion erst nach einer bestimmten Anzahl von Antworten verstärkt wird. Dieser Zeitplan erzeugt eine hohe, stetige Reaktionsrate mit nur einer kurzen Pause nach der Verabreichung des Verstärkers. Ein Beispiel für einen Zeitplan mit festem Verhältnis wäre die Abgabe eines Futterpellet an eine Ratte, nachdem sie fünfmal auf eine Stange gedrückt hat.

Zeitpläne mit variablem Verhältnis

Zeitpläne mit variablem Verhältnis treten auf, wenn eine Reaktion nach einer unvorhersehbaren Anzahl von Reaktionen verstärkt wird. Dieser Zeitplan schafft eine hohe konstante Reaktionsrate. Glücksspiele und Lotteriespiele sind gute Beispiele für eine Belohnung, die auf einem variablen Verhältnisplan basiert. In einer Laborumgebung könnte dies die Abgabe von Futterpellets an eine Ratte nach einem Pressen mit einer Stange, erneut nach einer Pressung mit vier Stangen und dann erneut nach einer Pressung mit zwei Stangen beinhalten.

Zeitpläne mit festen Intervallen

Zeitpläne mit festen Intervallen sind solche, bei denen die erste Reaktion erst nach Ablauf einer bestimmten Zeit belohnt wird. Dieses Schema verursacht hohe Mengen an Reaktionen gegen Ende des Intervalls, aber langsamere Reaktionen unmittelbar nach der Verabreichung des Verstärkers. Ein Beispiel hierfür in einer Laborumgebung wäre die Verstärkung einer Ratte mit einem Laborpellet für die erste Stangenpresse, nachdem ein 30-Sekunden-Intervall verstrichen ist.

Zeitpläne mit variablem Intervall

Zeitpläne mit variablem Intervall treten auf, wenn eine Antwort nach einer unvorhersehbaren Zeitspanne belohnt wird. Dieser Zeitplan erzeugt eine langsame, stetige Reaktionsgeschwindigkeit.

Ein Beispiel hierfür wäre die Abgabe eines Futterpellet an eine Ratte nach dem ersten Pressen der Stange nach einem einminütigen Intervall; ein zweites Pellet für die erste Reaktion nach einem fünfminütigen Intervall; und ein drittes Pellet für die erste Reaktion nach einem dreiminütigen Intervall.

Verwenden des entsprechenden Zeitplans

Die Entscheidung, wann ein Verhalten verstärkt werden soll, kann von einer Reihe von Faktoren abhängen. In Fällen, in denen Sie gezielt versuchen, ein neues Verhalten beizubringen, ist ein kontinuierlicher Zeitplan oft eine gute Wahl. Sobald das Verhalten erlernt wurde, ist es oft vorzuziehen, zu einem Teilzeitplan zu wechseln.

Im täglichen Leben treten teilweise Verstärkungspläne viel häufiger auf als kontinuierliche. Stellen Sie sich zum Beispiel vor, Sie erhalten jedes Mal, wenn Sie pünktlich zur Arbeit erscheinen, eine Belohnung. Im Laufe der Zeit könnte die Verweigerung der Belohnung als negative Verstärkung angesehen werden, anstatt dass die Belohnung eine positive Verstärkung ist.

Stattdessen werden Belohnungen wie diese normalerweise nach einem viel weniger vorhersehbaren Zeitplan für die teilweise Verstärkung vergeben. Diese sind nicht nur viel realistischer, sondern neigen auch dazu, höhere Reaktionsraten zu erzeugen, während sie weniger anfällig für Aussterben sind.

Teilzeitpläne reduzieren das Sättigungsrisiko, sobald sich ein Verhalten etabliert hat. Wenn eine Belohnung ohne Ende gegeben wird, kann das Subjekt die Ausführung des Verhaltens einstellen, wenn die Belohnung nicht mehr gewünscht oder benötigt wird.

Stellen Sie sich zum Beispiel vor, Sie wollen einem Hund das Sitzen beibringen. Wenn Sie jedes Mal Futter als Belohnung verwenden, stellt der Hund möglicherweise seine Leistung ein, sobald er satt ist. In solchen Fällen kann etwas wie Lob oder Aufmerksamkeit effektiver sein, um ein bereits etabliertes Verhalten zu verstärken.

Ein Wort von Verywell

Operante Konditionierung kann ein mächtiges Lernwerkzeug sein. Der während des Trainings- und Wartungsprozesses verwendete Verstärkungsplan kann einen großen Einfluss darauf haben, wie schnell ein Verhalten erworben wird, wie stark die Reaktion ist und wie häufig das Verhalten angezeigt wird.

Um zu bestimmen, welcher Zeitplan vorzuziehen ist, müssen Sie verschiedene Aspekte der Situation berücksichtigen, einschließlich der Art des gelehrten Verhaltens und der Art der gewünschten Reaktion.