Slike mozga otkrivaju kako djeluju strategije učenja

Novo istraživačko istraživanje istražuje kako mozak ažurira našu memorijsku banku kako bi poboljšao naša očekivanja od budućih nagrada.

Osvježavanje je neophodno kako bismo mogli točno predvidjeti te nagrade u uvjetima promjenjivog okruženja.

Iako je točno kako mozak orkestrira taj proces i dalje nejasno, novo istraživanje sugerira da naše ponašanje vodi kombinacija dviju različitih strategija učenja.

Članak o djelu pojavit će se u časopisu Neuron.

Jedna prihvaćena strategija učenja, koja se naziva učenje bez modela, oslanja se na usporedbu pokušaja i pogrešaka između nagrade koju očekujemo u određenoj situaciji i nagrade koju zapravo dobivamo.

Rezultat ove usporedbe je generiranje "pogreške predviđanja nagrade", koja odgovara toj razlici.

Na primjer, pogreška predviđanja nagrade može odgovarati razlici između projiciranog novčanog povrata financijskog ulaganja i naše stvarne zarade.

U drugom mehanizmu, koji se naziva učenje temeljeno na modelu, mozak generira kognitivnu mapu okoline koja opisuje odnos između različitih situacija.

"Učenje temeljeno na modelu povezano je s generiranjem" pogreške predviđanja stanja ", koja predstavlja razinu iznenađenja mozga u novoj situaciji s obzirom na njegovu trenutnu procjenu okoliša", kaže Jan Gläscher, postdoktorski znanstvenik na Caltechu i glavni voditelj autor studije.

"Razmislite o situaciji u kojoj uvijek idete istim putem dok se vozite kući nakon posla, ali određenog je dana uobičajeni put blokiran zbog građevinskih radova", kaže Gläscher.

„Sustav učenja bez modela bio bi bespomoćno izgubljen; bavi se samo poduzimanjem radnji koje su u prošlosti bile korisne, pa ako te radnje više ne budu dostupne, neće moći odlučiti kamo dalje.

"Ali sustav zasnovan na modelu mogao bi potražiti svoju kognitivnu mapu i donijeti učinkovit zaobilazni put koristeći alternativni put."

„Iako je jednostavniji mehanizam učenja bez modela dobro proučen i njegov osnovni mehanizam učenja - koji se pokreće pogreškama predviđanja nagrada - relativno je dobro razumljiv, mehanizmi koji leže u osnovi sofisticiranijeg sustava učenja temeljenog na modelu, s bogatom prilagodljivošću i fleksibilnošću , manje su dobro razumljivi ”, kaže John P. O'Doherty, profesor psihologije na Caltechu.

Kako bi dodatno okarakterizirali neurološke podloge ova dva sustava učenja, Gläscher, O'Doherty i njihovi kolege dizajnirali su računalno zasnovan zadatak donošenja odluka koji im je omogućio da mjere kada i gdje mozak izračunava i nagradne i državne pogreške u predviđanju i kako bi se utvrdilo proizvode li dvije vrste pogrešaka zapravo različite neuronske potpise.

U zadatku su ispitanici morali donositi odluke između kretanja lijevo i desno što im je omogućavalo prebacivanje između različitih „stanja” - označenih grafičkim ikonama - u virtualnom okruženju; postupak je sličan onome kretanja u jednostavnoj videoigri.

Svaki izbor lijevo ili desno napravljen u ovom virtualnom okruženju vodio je subjekta u novo stanje. Njihov je cilj bio doći do određene države cilja kako bi dobili novčanu nagradu, "a njihove šanse da završe u tom stanju cilja snažno su ovisile o određenom obrascu sekvencijalnih izbora koje su donijeli", objašnjava O'Doherty.

Sustav zasnovan na modelu može naučiti o strukturi virtualnog okruženja, a zatim upotrijebiti te podatke za izračunavanje radnji potrebnih za dolazak do stanja nagrade, na način analogan načinu na koji šahist može pokušati razmišljati kroz sekvencijalne šahovske poteze potrebne pobijediti u meču.

S druge strane, sustav bez modela naučio bi samo slijepo birati one radnje koje su u prošlosti donosile nagradu, bez procjene posljedica u trenutnoj situaciji.

Osamnaest sudionika skenirano je pomoću funkcionalne magnetske rezonancije dok su učili zadatak. Skeniranje mozga pokazalo je prepoznatljiv, prethodno okarakterizirani neuronski potpis pogreške predviđanja nagrade - nastalu tijekom učenja bez modela - u području usred mozga koje se naziva ventralni striatum.

Tijekom učenja temeljenog na modelu, međutim, neuronski potpis pogreške predviđanja stanja pojavio se u dva različita područja na površini mozga u kori velikog mozga: intraparietalnom sulkusu i bočnom prefrontalnom korteksu.

Ova zapažanja sugeriraju da se dvije jedinstvene vrste signala pogreške računaju u ljudskom mozgu, javljaju se u različitim područjima mozga i mogu predstavljati zasebne računske strategije za vođenje ponašanja.

„Sustav bez modela djeluje vrlo učinkovito u situacijama koje su vrlo automatizirane i ponavljaju se - na primjer, ako redovito idem istim putem kući s posla“, kaže Gläscher, „dok sustav zasnovan na modelu, iako zahtijeva mnogo veće mozgove procesorska snaga, sposobna se fleksibilno prilagoditi novim situacijama, poput potrebe za pronalaženjem nove rute slijedeći blokadu ceste. "

Ova dva različita mehanizma učenja služe komplementarnim ulogama u kontroli ljudskog ponašanja, kaže Gläscher.

„Budući da je procesorska snaga našeg mozga ograničena, nema smisla implementirati računalno intenzivniji sustav zasnovan na modelu za kontrolu svega što radimo. Umjesto toga, bolje se oslanjati na sustav bez modela za puno našeg svakodnevnog ponašanja i koristiti sustav zasnovan na modelu samo za nove ili složene situacije. Važno područje za daljnja istraživanja bit će pokušaj razumijevanja čimbenika koji upravljaju međusobnom interakcijom ovih sustava kako bi se kontroliralo ponašanje i utvrdilo kako se to implementira u mozak. "

Izvor: Kalifornijski institut za tehnologiju

!-- GDPR -->