Dziecko w klatce Skinnera | Modyfikacja zachowania małych dzieci (1960)

Dziecko w klatce Skinnera | Modyfikacja zachowania małych dzieci (1960)

Dziecko w klatce Skinnera | Modyfikacja zachowania małych dzieci

Kojec został wybrany jako nasze środowisko eksperymentalne, ponieważ dziecko jest z nim zaznajomione. Nieznane dziecku dodatkowe przedmioty, to m.in. podajnik z łakociami wraz z plastikową dźwigienką, która po naciśnięciu generuje sygnał świetlny, sygnał dźwiękowy podajnika oraz bodziec wzmacniający w postaci łakocia.

Przed faktycznym wykształceniem się zachowania naciskania dźwigienki najlepiej jest oddzielnie ustanowić funkcję sygnału świetlnego i dźwiękowego jako bodźców niezawodnie sygnalizujących nadchodzące wzmocnienie.

Dziecko zostało uprzednio nauczone, by stawać przed podajnikiem poprzez regularne podawanie łakoci tak, aby czynności związane ze swobodną eksploracją podajnika oraz wszystkiego, co dziecku wydaje się nowe czy dziwne zostały w dużej mierze wzmocnione pozytywnie. Owa zachęta wraz ze znajomością otoczenia, w którym została udzielona, najprawdopodobniej zapobiegnie występowaniu wybuchów emocjonalnych zakłócających eksperyment.

Jednakże ponieważ sygnał świetlny i dźwiękowy nie zostały skojarzone z jedzeniem, wszelkie szkodliwe skutki wynikające z tej sekwencji winny zostać wcześniej zidentyfikowane, a jeśli zajdzie taka potrzeba, każde nowe zachowanie emocjonalne jako forma adaptacji powinno zostać wykształcone poprzez powtarzanie tej sekwencji kilka razy.

W tej fazie uczenia dźwigienka została usunięta, ale związek między światłem, dźwiękiem i bodźcem wzmacniającym nie ulega zmianie. Oddzielenie mechanizmu reakcji umożliwia nam skoncentrowanie się na jednej sekwencji behawioralnej.

Podczas tej fazy uczenia się [warunkowania] badanym zachowaniem docelowym jest sięgnięcie do podajnika w reakcji na bodziec świetlny i dźwiękowy. Żadna powtarzająca się grupa czynności bezpośrednio poprzedzających sygnał świetlny i dźwiękowy nie jest szczególnie wyróżniana w celu jej wzmocnienia w celu uniknięcia wykształcenia się w niepożądanej formy zachowania, która potencjalnie może konkurować z naciskaniem dźwigienki i tym samym spowolnić proces uczenia się.

Należy postępować ostrożnie, gdyż wszelkie nieumyślnie wykształcone niepożądane zachowania wzmocnione nie zawsze poddają się łatwej i skutecznej eliminacji. Z tych dwóch bodźców oznaczających, że wzmocnienie zostanie uruchomione, dźwięk jest najbardziej praktyczny w zastosowaniu o ile nie wymaga od dziecka żadnych szczególnych zachowań postawnych lub orientacyjnych.

Niemniej jednak światło, choć użyte tutaj przede wszystkim w celach wizualizacyjnych, może również wpływać na zachowania, które wiążą się z podejściem do dozownika. Dostępnych jest wiele technik skłaniających do pierwszego naciśnięcia dźwigienki. Osoba dorosła może nacisnąć dźwigienkę w nadziei, że dziecko zacznie naśladować ten przykład, czy też poprzez wzmacnianie reakcji, które skutecznie imitują czynność naciskania dźwigienki.

Inną możliwością jest pozwolenie dziecku samemu odkryć okoliczności wzmocnienia na zasadzie prób i błędów, co właśnie możemy zaobserwować.

Fakt, że dziecko kieruje się w kierunku dozownika po wystąpienia bodźca świetlno-dźwiękowego, wskazuje na istotny wpływ wcześniejszej procedury wzmocnienia zachowania.

Gdy dziecko jest zaznajomione ze swoim otoczeniem i zachowanie w postaci naciskania dźwigienki zostało wzmocnione, możemy obserwować dramatyczne zmiany w procesie uczenia się.

Coraz większy procent czasu będzie poświęcany zachowaniom, które szybko przynoszą nagrody w postaci przekąski i w ich rezultacie zachowania konsumpcyjne zaczną dominować na liście czynności, w które angażuje się dziecko.

Zgodnie z projektem eksperymentu, nie każde naciśnięcie dźwigienki aktywuje dozownik, lecz tylko te reakcje dziecka, które następują po sobie z opóźnieniem jednej sekundy lub więcej spowodują dostarczenie wzmocnienia.

Ten czasowy wymóg, aby kolejne reakcje były oddalone od siebie w czasie został wprowadzony w celu wyeliminowania wielokrotnych nacisków dźwigienki po otrzymaniu wzmocnienia.

Zakłada się, że reagowanie po wzmocnieniu ostatecznie ustąpi miejsca łańcuchowi działań zastępczych, czyli wyjmowania łakocia z tacy dozownika, zjedzenia go i wreszcie powrotu do czynności prowadzących do otrzymania kolejnego łakocia.

Chociaż słusznie można twierdzić, że dziecko traci na tym układzie, łatwo można zrozumieć, że gdyby każda reakcja wzmacniana została nagradzana w sposób ciągły, duża liczba przekąsek, które szybko by się dziecku gromadziły, wzmocniłaby niepożądany wzorzec behawioralny, a mianowicie długą sekwencję odpowiedzi, po której następuje długi i przyjemny okres jedzenia i w konsekwencji silna niechęć do powrotu do naciskania dźwigienki.

Wraz z przybieraniem bardziej ekonomicznego charakteru reakcji dziecka na bodziec, możemy zwiększyć częstotliwość naciśnięć dźwigienki poprzez podawanie łakoci wyłącznie po określonej liczbie zachowań zrealizowanych przez dziecko.

Taka procedura, w ramach której z góry określony liczba pożądanych zachowań gwarantuje wzmocnienie nosi nazwę rozkładu wzmacniania o stałym współczynniku. Łatwo można rozpoznać właściwości rozkładu o stałym współczynniku na przykładzie czynności czy prac nagradzanych stawką akordową.

Im szybciej dana osoba pracuje, tym więcej może zarobić. Wielkość współczynnika odpowiedzi [naciśnięć] względem wzmocnienia może być ustalona dowolnie, jednak naszym celem są stabilne wyniki osiągane na bazie takiego rozkładu, najskuteczniejszą metodą jest na początku utrzymać niską jego wartość i wraz czasem zwiększać wysokość nagrody.

Zachowanie w ramach układu o stałym współczynniku wzmocnienia opiera się na zasadzie „wszystko albo nic”. Po rozpoczęciu odpowiedzi [naciskania] jest ona utrzymywana na wysokim i jednolitym poziomie, a następnie braku odpowiedzi, zwykle po otrzymaniu wzmocnienia.

Wzmocnienia mogą być również serwowane na podstawie określonego zakresu wartości wzmocnienia, co możemy zaobserwować na kolejnych kadrach, będzie dobierany w zakresie od 3 do 32 odpowiedzi [naciśnięć] przy średnim współczynniku wzmocnienia [przekąski] na poziomie 20 odpowiedzi [naciśnięć].

Zgodnie z tym układem eksperymentalnych, znanym jako rozkład o zmiennym współczynniku wzmocnienia, wzmocnienia są wciąż serwowane na podstawie pożądanych odpowiedzi, ale liczba ich będzie się zmieniać wraz kolejną ekspozycją na wzmocnienie, a zatem w przeciwieństwie do treningu w rozkładzie o stałym współczynniku wzmocnienia osobnik nie będzie w stanie odróżnić wielkości kolejnych współczynników wzmocnienia.

Rezultatem treningu w rozkładzie o zmiennym współczynniku wzmocnienia jest stały schemat zachowania w postaci energicznego przyciskania dźwigienki. Teraz, gdy wykształciliśmy repertuar w postaci odpowiedzi o wysokiej częstotliwości, załóżmy, że poprosimy dziecko by zmieniło swoje zachowanie i zwolniło tempo reakcji.

Efekt ten można osiągnąć poprzez nie wzmacnianie reakcji w postaci przyciskania dźwigienki i podawanie nagrody wyłącznie, gdy przyciśnięcia są odpowiedzi rozłożone w czasie. Należy przypomnieć, że procedura ta została zastosowana wcześniej w celu wyeliminowania reakcji po wzmocnieniu.

Wtedy, podobnie jak teraz, dziecko musi odczekać pewien czas, zanim odpowiedź zostanie wzmocniona. Wcześniej interwał czasowy był mniejszy i wymagał zaledwie sekundy odczekania, teraz jednak opóźnienie jest znaczniejsze.

Dziecko jest zmuszone odczekać co najmniej 12 sekund, nim otrzyma wzmocnienie w postaci nagrody. Uprzednia kontrola behawioralna bazująca na układach o stałym i zmiennym współczynniku wzmocnienia sprawia, że wyzwanie stojące przed dzieckiem jest niezwykle żmudne i frustrujące.

Za każdym razem, gdy dźwigienka zostanie naciśnięta, zegar jest resetowany i zaczyna się ponowne odliczanie czasu. Jeśli kolejne odpowiedzi nie zostają udzielone, zegar automatycznie uruchomi swój bieg od nowa i zacznie odliczać czas do zera.

Po tym czasie prezentowane jest wzmocnienie i każda odpowiedz po tym czasie spowoduje uruchomienie podajnika z nagrodą.

W ten sposób dziecko jest faktycznie karane za reagowanie przed upływem czasu, ponieważ każde naciśnięcie dźwigni przed czasem resetuje zegar i odsuwa nagrodę w czasie.

Dostarczenie wzmocnienia w tej sytuacji jest wypadkową dwóch czynników – wstrzymanie się od przyciskania dźwigienki przez co najmniej 12 sekund oraz pojedyncze przyciśniecie dźwigienki po tym czasie.

Ciągła ekspozycja na czynniki występujące w danej okoliczności, długość kolejnych okresów braku odpowiedzi będą się konsekwentnie wydłużać zapewniając w ten sposób więcej okazji do programowania wzmocnień.

W tej chwili upłynęło ok. 5 sekund od naciśnięcia dźwigienki i jeśli dziecko wytrzyma jeszcze 7 sekund, kolejna odpowiedź przyniesie mu nagrodę.

No i proszę!

Kiedy maluch zostanie ponownie umieszczony w układzie eksperymentalnym i wzmocnienia są rozplanowane tak jak poprzednio, tj. przy interwale reakcji wynoszącym 12 sekund od pierwszego naciśnięcia dźwigienki, obserwujemy powrót do wysokiego wskaźnika odpowiedzi [naciskania] jak w przypadku układu ze zmiennym współczynnikiem wzmocnienia oraz podczas początkowej ekspozycji na te nowe warunki.

W tym przypadku jednak dziecko wstrzymuje próby odpowiedzi wcześniej przejawiając pewne zachowania niekiedy kojarzone z wygaszaniem oczekiwanego wzmocnienia. Skuteczne zajęcie sobie czasu w ramach obecnego układu, czynności niezwiązane z naciskaniem dźwigienki muszą zostać wykryte i utrzymane.

Odwrócenie uwagi od dozownika jest wystarczającym środkiem samokontroli, ale silniejsze dowody ma kształtowanie się mechanizmów oporu przed pokusą ujawniają się w momencie, gdy dziecko staje przed podajnikiem, lecz nie uruchamia dźwigienki, choć wprawdzie tego nie wie, ale minęła wystarczająca ilość czasu by kolejna nagroda została wydana.

Skuteczne przystosowanie do obecnie dominujących wymogów czasowych wymaga zredukowania częstości odpowiedzi [naciskania] prowadzących do otrzymania nagrody.

Jest to faktyczny powód, dla którego zastosowane warunkowanie z zadanym rozkładzie wzmocnień zostało nazwane wzmocnieniem różnicowym o niskiej częstotliwości, czy w skrócie harmonogramem DRL [differential-reinforcement-of-low-rate].

Obecnie dziecko odkłada nagrodę w czasie, co obrazuje pierwszy długi interwał pomiędzy wzmocnieniami. Do tej pory okresy naznaczone brakiem odpowiedzi miały charakter krótkotrwały, rzadko dłuższy niż 3 sekundy między kolejnymi odpowiedziami.

Jeśli jednak większość interwałów między odpowiedziami rozkłada się wokół wartości 12 sekund, otrzymamy przekonujący dowód na zdolność małego dziecka do precyzyjnego oszacowania upływu czasu.

Metodyczne egzekwowanie harmonogramu DRL [wzmocnienie różnicowe o niskiej częstotliwości] pozwala łatwo dostrzec i dokładnie przeanalizować dwie klasy zachowań.

Pierwsza dotyczy prawdopodobieństwa zarejestrowanej odpowiedzi i drugą, nieco ogólniejszą kategorię zachowań, która obejmuje wszystkie inne czynności oprócz naciskania dźwigienki. Niezwykle trudno jest zawczasu określić dokładną formę i częstotliwość tych innych zachowań, ponieważ żadna ewentualność nie została wprowadzona do układu eksperymentalnego w celach kontrolnych.

Niemniej jednak możliwe jest, że wykształcą się idiosynkratyczne wzorce o charakterze rytualistycznym w sposób spontaniczny i całkowicie zdominują zachowania wykształcone w ramach rozkładu wzmocnień różnicowych o niskiej częstotliwości [DRL].

To, co może być konieczne, aby te czasochłonne wybryki nasilały się to przypadkowe wzmocnienia czynność w postaci przyciśnięcia dźwigienki w skutek tych zachowań. Jest o wiele za wcześnie, by móc rozstrzygać skuteczności tych przypadkowych współwystąpień oraz utrzymywanie się przesądów, które generują. Ale nawet jeśli te jawne zachowania się nie zmaterializują, istnieje wiele źródeł bodźców wewnętrznych, które mogą pomóc modulować upływ czasu podczas rozkładu DRL.

Należy podjąć szereg prób w celu przezwyciężenia zakłócających efektów behawioralnych wywołanych warunkami wcześniejszymi rozkładów wzmocnień.

Wysoka częstość odpowiedzi, wcześniejsza okazja do zwiększenia prawdopodobieństwa uzyskania wzmocnienia w ramach rozkładu ze stałym i zmiennym wzmocnieniem, ustępuje regule odwrotnej – zaprzestaniu odpowiedzi, ponieważ za szybka rekcja zmniejsza szansę na otrzymanie nagrody.

Dziecko przesuwa się do rogu kojca, tego samego, w którym znalazł się na początku filmu i nasuwa się pytanie, dlaczego zachowuje się tak, a nie inaczej. Mając na względzie jego doświadczenia z udziałem w tym eksperymencie oraz świadomość konsekwencji wynikających z bieżącego rozkładu wzmocnienia mamy nadzieję, że jesteś w stanie skuteczniej odpowiedzieć na to pytanie.