Teoria ‘Dostosowanie Przebija Prawdę’ – Donald Hoffman

Omówienie teorii przewagi dostosowania nad prawdą.

Teoria Dostosowanie Przebija Prawdę

 Czy widzimy rzeczywistość taką, jaka ona jest – Donald Hoffman

Co, jeśli wszystko, czego doświadczyłeś, całe twoje życie, było zaledwie użyteczną fikcją? Odwołując się do matematycznych modeli i symulacji procesów ewolucyjnych w ramach teorii gier, Donald Hoffman zaproponował dowód na zero procentową szansę, że ty czy ja postrzegamy tę samą rzeczywistość obiektywną czy świat takim, jakim on jest.

Zatem zajmijmy się tym jakże złożonym problemem zwanym rzeczywistością. Sponsorem programu jest ewolucja. Kognitywista z Uniwersytetu Kalifornijskiego w Irvine, Donald Hoffman zaproponował kilka szokujących teorii, ale w niniejszej serii materiałów skupimy się na jego fundamentalnej teorii “dostosowanie przebija prawdę”.

“Zgodnie z teorią ewolucji poprzez dobór naturalny, każdy organizm postrzegający rzeczywistość taką, jak jest, nigdy nie będzie bardziej dostosowany do danych warunków niż organizm o podobnej złożoności, który w ogóle nie postrzega owej rzeczywistości, ale wyłącznie maksymalizuje poziom dostosowania. Nigdy”. (Hipoteza “dostosowanie przebija prawdę”)

Ideą to zajmiemy się bliżej za chwilę, ale przedtem przypomnijmy nieco podstawy działania ludzkiego zmysłu wzroku i mózgu. 1/3 kory mózgowej odpowiada za widzenie. 120 mln fotoreceptorów wraz z 200 mln neuronów w oku gromadzą i przekazują informacje do prawie 50 mld neuronów oraz 10 bilionów synaps w mózgu.

Należy sobie uświadomić, że nasze mózgi nie są pasywnymi obserwatorami lecz raczej rekonstruują obrazy i kolory, które widzimy. Kilka przykładów pozwoli nam wyjaśnić ten proces. Który ze stołów jest dłuższy?

Stoły Sheparda

Niemalże każdy odpowie, że ten po lewej stronie. Otóż wymiary obu stołów są identyczne. Jest to jedno ze złudzeń geometrycznych zwane “stołami Sheparda”.

Nasze mózgi niepoprawnie rekonstruują te obrazy odwołując się do heurystyki dla obiektów trójwymiarowych. Spróbuj zakryć środek ekranu powierzchnią swojej dłoni a zauważysz zapewne, że ruch nieco przyspiesza.

Teraz zakryj boku ekranu obiema dłoniami – ruch zdaje się zwalniać. Szybkość animacji jest taka sama w obu przypadkach, a nasz mózg w czasie rzeczywistym rekonstruuje pęd ruchu.

bloczki Purvesa-Lotto

Kolejny przykład – bloczki Purvesa-Lotto. Blok u góry wydaje się ciemniejszy, ale wystarczy zakryć palcem czarną linię pomiędzy klockami a zobaczycie, że oba bloczki są w tym samym odcieniu szarości.

To złudzenie optyczne Cornsweeta pokazuje, że nasz mózg aktywnie rekonstruuje odcienie szarości. Jak widać, nasza percepcja jest podatna na błędy. Nasz mózg tworzy postrzegane kolory. Światło nie ma koloru jako takiego. Kolor w fizyce opisywany jest za pomocą długości fali i częstotliwości.

Fale elektromagnetyczne - światło widzialne

KOLOR – Krzysztof Karoń

https://www.historiasztuki.com.pl/strony/022-00-00-ANTROPOLOGIA.php

 

Światło widzialne to zaledwie wąski zakres spektrum fal elektromagnetycznych, przedział w przybliżeniu od 400 do 700 nm. Kolory to produkt naszych mózgów. Przyjrzyj się tym dwóm zaznaczonym kwadratom.

Kostka - żółte kwadraty

Który z nich jest jaśniejszy i kolorem bliższy żółtemu? Kwadraty te zdają się mieć inny kolor, lecz w istocie są identyczne. Gdy usunąć pozostałe elementy, nasz mózg dokona reinterpretacji obrazu szacując dokładnie kolor dolnego kwadratu.

Ciężko nam się z tym pogodzić, ponieważ nasz układ wzrokowy skutecznie i niezauważalnie generuje te percepcje w toku swojego działania. Nasze mózgi bezustannie modelują nasze percepcje bazując na bodźcach środowiskowych, generują doświadczenia, fenomeny przekształcając fale świetlne w tzw. qualia (jakości zmysłowe) w postaci barw.

Wróćmy teraz to hipotezy “dostosowanie przebija prawdę” i przedstawmy konkurencyjnych aktorów użytych w symulacjach Hoffmana. Posłużymy się definicją dostosowania zaproponowaną przez Johna Maynarda Smitha, jako “miary prawdopodobieństwa przekazania genów, a zatem cech osobniczych, kolejnym pokoleniom”.

Kolokwialnie rzecz ujmując, lepsze dostosowanie zwiększa szanse przetrwania i reprodukcji. Definicji prawdy jest wiele, być może najlepiej opisać ideę prawdy jako sądu prawdziwego, gdzie prawdziwość odnosi się do stopnia w jakim doświadczenie, percepcja czy interpretacja trafnie oddaje rzeczywistość.

Dla fascynatów symulacji, prawdę można zrównać z tzw. obiektywną rzeczywistością. Warto pokrótce przedstawić różnicę pomiędzy zasobami biologicznymi a dostosowaniem z perspektywy matematyki. Funkcja monotoniczna to taka funkcja, gdzie wartości na osi odciętych, w tym przypadku wartość liczbowa dostosowania, wzrastają liniowo lub logarytmicznie wraz z wzrostem wartości na osi rzędnych, w naszym przypadku cennych zasobów dla organizmów.

Funkcja monotoniczna i niemonotoniczna

Przeciwieństwem takiej funkcji jest funkcja niemonotoniczna, gdzie dla wybranych wielkości zasobów dostosowanie osiąga swoje maksima i przybiera wartości niższe dla innych przedziałów. Taka funkcję obrazuje np. krzywa Gaussa, opisująca tzw. rozkład normalny, znana też pod nazwą krzywej dzwonowej.

W naturze monotoniczne funkcje skończone są rzadkością. Znakomita ilość funkcji opisujących dostosowanie to funkcje niemonotoniczne.

Dla przykładu, woda. Zbyt mało tego zasobu kończy się śmiercią w wyniku odwodnienia. Zbyt dużo wody – śmierć z powodu powodzi i utopienia.

Większość zasobów ma niemonotoniczny charakter w kontekście organizmów żywych. Tlen, na przykład, musi stanowić określoną część wdychanego powietrza, w przypadku człowieka jest to stężenie rzędu 23,5 do 19,5 proc.

Zawartość tlenu w powietrzu w masce – Jeff Neff [strażak]

Wartości spoza tego zakresu mogą mieć fatalne konsekwencje. Organizmy muszą utrzymywać równowagę ustrojową w procesie zwanym homeostazą. Większość funkcji w modelu, który za chwile opiszemy, na charakter niemonotoniczny, choć Hoffman w swoich symulacjach stosuje dodatkowo kilka funkcji monotonicznych.

Przejdźmy zatem do symulacji Hoffmana demonstrujących ideę “dostosowanie przebija prawdę”. Moim celem jest zaprezentowanie uproszczonej, lecz wiernej oryginałowi wersji jego modelu analitycznego, który jest dość kompleksowy i wymaga znajomości zaawansowanej matematyki, by go w pełni docenić.

Przedstawiam tutaj slajdy z prezentacji autorstwa matematyka Chetana Prakasha dla osób zainteresowanych. Jeśli naprawdę chcesz zapoznać się z każdym szczegółem, podaję poniżej link do artykułu źródłowego.

Dwie strategie – nastawiona na dostosowanie i nastawiona na prawdę, rozgrywają iteracyjną grę zdobywania terytoriów. Mamy wspólne środowisko, świat oznaczony jako “w”, złożony z określonej ilości terytoriów, każde zawierające określoną ilość zasobów i odpowiadającym im wartościom liczbowym na skali parametru dostosowania.

Mamy daną funkcję dostosowania optymalizującą wybór pod kątem dostosowania, przyjmującą szereg argumentów wejściowych: dany świat “w” niezależny od obserwatora, organizm “o”, możliwe stany organizmu oznaczone “s”, mogące opisywać stan głodu czy łaknienie danego organizmu oraz działania podejmowanie przez owe organizmy oznaczone parametrem “a”.

Aby możliwie jak najprościej opisać ten model, zredukujemy liczbę światów do jednego, jednego typu organizmu, jednego możliwego stanu, a jedynym dostępnym działaniem będzie wybór terytorium.

Gra jest powtarzana określoną ilość razy, przy czyn każdy z graczy na zmianę wykonuje pierwszy ruch. Liczbę zasobów ograniczymy do jednego – wody. Jak już wspomniano, woda to zasób modelowany niemonotoniczną krzywą dzwonową.

Teoria ‘Dostosowanie Przebija Prawdę’

Zasób ten ma pewien zakres optymalny pomiędzy pustynią a głębokim oceanem. Każde terytorium w naszym świecie opisywane jest konkretną wartością dostosowania. Im wyższa ta wartość, tym lepsze jest terytorium. Kolejny element modelu jest najistotniejszy dla jego zrozumienia.

Obie strategie, “wyłącznie prawda” i “wyłącznie dostosowanie”, mają takie same parametry wejściowe, a mianowicie stany percepcyjne ze zbioru X.

Symulacja, podobnie jak w przypadku każdego życia biologicznego, daje wgląd w świat poprzez stany percepcyjne jej aktorów. Bazując na konkretnym przykładzie pokażemy, jak danemu terytorium odpowiada określony stan percepcji “x”.

Przyjmijmy, że jest to pierwsza runda gry i zaczyna “prawda”. Zakładamy, że stan percepcji graczy jest zerowy na początku gry. Dla uproszczenia rozważmy zaledwie dwa dostępne terytoria. Jedynym zasobem jest woda, a stanem percepcyjnym opisującym dane terytorium jest próbka gleby, którą każdy z graczy może doświadczyć poprzez dotyk.

Przypominam, że gracze nie mają uprzedniej wiedzy odnośnie świata i wartości dostosowania dla danego terytorium. Te informacje zdobywają dopiero po wybraniu terytorium. W naszym przykładzie maja dostęp do próbek gleby z 2 terytoriów. Załóżmy, że jedna z próbek wykazuje wilgotność na poziomie 25 proc., a druga 75 proc.

Strategia oparta na prawdzie stara się konstruować modele terytoriów tak, by jak najwierniej oddawały informacje sensoryczne. Początkowo modele te będą rudymentarne [szczątkowe]. W przypadku gleby o wilgotności 25 proc. model taki może opisywać szeroki zakres terytoriów, jedne bliższe terenom pustynnym, inne o średnim poziomie wilgotności. Poprzez iterację warunków w kolejnych rundach gry strategia prawdy stara się konstruować modele najwierniej oddające prawdziwą informację o stanie terytoriów stosując twierdzenie Bayesa.

Zamiast budować modele terytoriów takimi, jakimi się wydają, strategia dostosowania korzysta z twierdzenia Bayesa sparametryzowane czasem i mapuje wartość stanów percepcyjnych do wartości dostosowania. Do różnic pomiędzy tymi strategami wrócimy za chwilę, ale najpierw omówimy krótko twierdzenie Bayesa.

Twierdzenie Bayesa, jeden z filarów teorii prawdopodobieństwa i statystyki, odnosi się do metody aktualizowania prawdopodobieństw w oparciu o nowe dane. Wnioskowanie bayesowskie jest standardową metodą w naukach o percepcji.

Eksperyment dotyczący percepcji długości tonu sygnału dźwiękowego

Taki oto przykład: bierzesz udział w eksperymencie dotyczącym percepcji długości tonu sygnałów dźwiękowych. Po kilku testach ustalasz, że średnia długość tonu wynosi 1000 ms. To jest twoja wartość oczekiwana, czy w ujęciu bayesowskim, wartość pierwotna.

Następnie słyszysz ton o ok. połowę krótszy, o dł. 600 ms – jest to wartość poza eksperymentalna [rzeczywistość]. Uwzględniasz wartość oczekiwaną oraz wartością rzeczywistą i otrzymujesz nową wartość szacunkową – 800 ms, zwaną wartością wtórną.

Przykład skrajny, ale obrazuje sens tego o co chodzi. Przy wielu powtórzeniach błąd przewidywania za każdym powtórzeniem maleje zbliżając się do prawdy (wartości prawdziwej). Wróćmy do naszych dwóch rywalizujących graczy. Opiszmy te strategie, które obie bazują na klasycznym modelu nauk o percepcji zwanym BDD – bodziec, decyzja, działanie.

Prawda vs Tylko dostosowanie - BDD - bodziec, decyzja, działanie

Każdy z graczy doświadcza identycznych stanów percepcyjnych, które to stany opisują dane terytorium. Strategia “prawdy” stosuje twierdzenie Bayesa szacując terytoria w oparciu o te bieżące stany percepcyjne oraz poprzednie stany percepcyjne dla konkretnych terytoriów z poprzednich rund gry. Inaczej mówiąc, konstruuje jak najwierniejsze odwzorowanie rzeczywistego świata na podstawie pozyskanych dowodów. Opierając się na tym “prawdziwym” modelu świata porównuje wartości dostosowania dla danych terytoriów i wybiera terytorium o najwyższej wartości dostosowania w podstawie ważonych stanów percepcyjnych.

Strategia ta dokonuje wyboru najpierw na podstawie bayesowskiej mapy estymacji [szacunków] stanów świata, które następnie bierze pod uwagę historyczne dane odnośnie wartości dostosowania.

Strategia nastawiona wyłącznie na dostosowanie na bazie analizy bayesowskiej oblicza wyłącznie oczekiwane wartości dostosowania na podstawie danych stanów percepcyjnych uprzednich stanów percepcyjnych i przypisanych im wartości dostosowania z poprzednich rund rozgrywki. Strategia ta nadaje wagi wartościom dostosowania na podstawie ich wcześniejszych rozkładów i wybiera terytorium dla którego stan percepcyjny zapewnia najwyższą wartość dostosowania. Strategia ta nie dąży do wiernego modelowania obiektywnego stanu świata, lecz jedynie tworzy modele nastawione na dostosowanie.

Te dwie strategie są sobie przeciwstawione w milionach iterowanych symulacji metodą Monte Carlo. Ewolucja jest modelowana równaniem replikatora za pomocą algorytmów genetycznych oraz dynamiki zgonów i narodzin w modelu Morana.

Symulacje te i matematyczna analiza dokonana przez Chetana Prakasha prowadzą niezależnie do tych samych wniosków, a mianowicie, że dostosowanie przebija prawdę.

“Dla nieskończonej klasy wygenerowanych stochastycznie światów oraz losowych stanów tych światów, dowolnie zadanych funkcji dostosowania, organizm, który trafnie opisuje świat nigdy w ramach nieskończonej klasy gier ewolucyjnych nie będzie lepiej przystosowany, niż organizm o równej złożoności, który nie estymuje obiektywnej rzeczywistości, ale nastawia się na wybór adekwatnej funkcji dostosowania”.

Należy szczególnie mocno podkreślić fakt, że zarówno miliony powtórzeń symulowanych gier oraz formalna analiza matematyczna potwierdzają, że odwzorowywanie świata pod kątem prawdy jest zawsze gorszym rozwiązaniem, niż odwzorowywania pod katem dostosowania.

Dr Jordan Peterson:

“Żyjemy w przestrzeni potrzeb i wartości, co jest ideą absolutnie zmieniającą wszystko, bo to jest zupełnie inna sytuacja, niż nawigowanie w przestrzeni faktów. To nie jest to samo pod żadnym względem. Klasyczna naukowa idea mówi mniej więcej tak, że żyjemy w świecie faktów, z których wyciągamy wnioski i na ich podstawie działamy. Wcale nie. Postrzegamy świat jako przestrzeń uprzednio uporządkowaną pod względem istotności jakości na gruncie naszej etyki. Jezu, to jest dziwne…”

Jak nauka osadzona jest w religii – Jonathan Pageau

– Percepcja nie polega na dostrzeganiu prawdy, lecz jej celem jest posiadanie potomstwa. Posłużmy się może przykładem bliższym życiu, odnosząc się do relatywnie prostej sytuacji w początkowych rundach gry.

Zakładamy, że strategie te rozegrały dopiero kilka rund, zamiennie wykonując pierwszy ruch. Przyjmijmy, ze jest remis, a gracze mają dostęp do tych samych informacji. Oba organizmy dążą do maksymalizacji dostosowania stosując swoje strategie.

Prawda vs Tylko dostosowanie - przykład

Strategia nastawiona na prawdę generuje coraz to dokładniejszy model świata i w tym przykładzie strategia ta bazuje na różnicach wilgotności kolejnych próbek gleby.

Możemy dla ułatwienia wyodrębnić określone przedziały wilgotności – bardzo sucho, sucho, wilgotno, bardzo wilgotno.

Bazując na tej kategoryzacji, strategia “prawdy” oszacuje terytoria i porówna wyniki z poprzednich rund, by dokonać najlepszego wyboru.

Strategia nastawiona na dostosowanie natomiast pomija to modelowanie na bazie kryterium prawdziwości i odnosi się bezpośrednio do wygenerowanych przez siebie kategorii, które bliżej odpowiadają wartościom dostosowania.

Skonfrontujmy te dwie strategie na konkretnym przykładzie. Przyjmijmy, że stany percepcyjne w tej rundzie dla obu strategii to “wilgotność 45 proc.” i “wilgotność 70 proc.”

Strategia prawdy sprawdza swoje wartości pierwotne i umieszcza wartość 45 proc. w kategorii “sucho”, a wartość 70 proc. w kategorii “mokro”

Pamiętamy, że wartości dostosowania dla wody opisywane są niemonotoniczną krzywą dzwonową, tak więc na podstawie wcześniejszych rund oczekiwana wartość dopasowania dla przedziału pomiędzy 45 proc. a 70 proc. wilgotności są identyczne, strategia ta losowo wybierze jedną z nich.

Tutaj właśnie przejawia się przewaga strategii “dostosowania”.

Gdyby strategia nastawiona na dostosowania miała pierwszy ruch, skonsultowała by swoje wartości pierwotne, umieściła wilgotność 45 proc. w kategorii “świetna”, a wartość 70 proc. w kategorii “dobra”.

Stany terytoriów nie mają znaczenia dla strategii “dostosowania”. Strategia ta zawsze wybiera najlepszą możliwą opcję, wybierając wartość 45 proc. i tym samym najwyższą oczekiwaną wartość dostosowania.

Strategia prawdy pozostaje z suboptymalnym terytorium. To pokazuję, że zaledwie po kilku rundach i stanach percepcyjnych strategia dostosowanie wychodzi zwycięsko z tej konfrontacji.

“Prawdopodobieństwo dominacji strategii nastawionej wyłącznie na dostosowanie nad strategią nastawioną wyłącznie na prawdę przekracza 50 proc., kiedy wektor stanów percepcyjnych zawiera więcej niż 5 elementów i rośnie monotonicznie do 100 proc., gdy wektor ten rośnie do nieskończoności”.

W istocie analiza matematyczna pokazuje, że po ok. 50 stanach strategia “prawdy” nie ma szans na wygraną. Dostosowanie wygrywa.

Dobór naturalny skutecznie skazuje percepcję tego, co prawdziwe, na wyginięcie. Implikuje to, że gdyby cofnąć się w czasie ewolucji o 3,5 miliardów lat do etapu LUCA, ostatniego uniwersalnego wspólnego przodka wszystkich organizmów, to świat wertykalny [pionowy] został by utracony w zaledwie kilkanaście iterowanych stanów percepcyjnych, nie do odtworzenia nawet przez nas samych.

Jeśli zatem nie postrzegamy rzeczywistości obiektywnej taką, jaką ona jest, to co tak naprawdę postrzegamy?

Hoffman stawia hipotezę, że nasze świadome doświadczenie bazuje na specyficznym dla każdego z gatunków interfejsie, czegoś na wzór pulpitu komputera, który w istocie jest uproszczonym narzędziem skrywającym znaczną część rzeczywistości leżącej u jego podstaw, jak kod w którym został napisany czy fizyczne podzespoły komputera.

Oto główna idea teorii percepcji jako interfejsu, autorstwa Hoffmana, którą kiedyś w przyszłości omówimy.

Póki co skupimy się na teorii “dostosowanie przebija prawdę”. Zapewne macie kilka zastrzeżeń do owych wniosków. Te problemy wraz z dodatkowym komentarzem poruszam w drugiej części tej serii.

Zobacz na: Sztuka życia według stoików – Piotr Stankiewicz
Język jako okno na ludzką naturę – Steven Pinker
Mózgi kobiet i mężczyzn są inaczej zbudowane [okablowane]

 

Teoria ‘Dostosowanie Przebija Prawdę’ – Donald Hoffman

https://rumble.com/v2drc71-teoria-dostosowanie-przebija-prawd-donald-hoffman.html

 

Trzy mózgi

 

Ethos - Pathos - Logos