Az értelemről - 2

2011.04.05. 15:42 Novbert

Az előzőek alapján már felvázolhatunk egy kezdetleges értelmet abból a célból, hogy tulajdonságainak általánosításával esetleg új dolgokat tudjunk meg a fejlett (pl. emberi) értelemről.

Képzeljük el a következőt: Az entitás, amiről beszélünk, egy robot, ami egy négyzetrács rácspontjain mozog. Minden rácspontban jobbra vagy balra, illetve fel vagy le mozoghat. A robot akkumulátorról működik és a mozgás energiába kerül. Bizonyos rácspontok üresek, másoknál viszont a robot bizonyos mennyiségű töltést vihet az akkumulátorára ("táplálkozhat"). Ha ilyenre lép a robot, akkor akkumulátora automatikusan töltődik, és a csomópont üressé válik. Ilyen esetben valahol új töltő csomópont jön létre a rácson (már ha nem akarjuk hogy robotunk végleg lemerüljön). A robot nem képes megállni.

Az értelmes lény rendelkezik sikerfüggvénnyel, más néven boldogságfüggvénnyel, melynek értéke bizonyos környezeti változók értékétől függ. A függvényről annyit tudunk, hogy valószínűleg maximumos, valamint az az intuíciónk, hogy első deriváltja legfeljebb pontszerűen zérus.

Az első feltétel (maximumosság) azt jelenti, hogy az entitás boldogságértékének adott környezetben van egy maximuma, melynél nagyobbat az entitás nem érhet el.
A második feltétel azt jelenti, hogy a meghatározó paraméterek bármilyen változása a boldogság értékét is megváltoztatja - kivéve a maximum és minimumhelyeken (amennyiben ez utóbbiak léteznek egyáltalán).

Robotunk boldogságfüggvénye értelemszerűen az akkumulátor töltöttsége. Maximuma a teljesen feltöltött állapot. A töltöttség minden mozgás után csökken valamilyen mértékben.

Az entitás rendelkezik bizonyos cselekvési térrel, bizonyos cselekvési készletből válogathat. Ne zavarjon össze minket, hogy a való életben ez a cselekvési tér szinte végtelennek tűnik, egy sakkautomata cselekvési tere például már erősen behatárolt a játék szabályai által.

A robot a FEL-LE-JOBBRA-BALRA cselekvések közül választhat minden lépésben. Hogy nem választhatja az egy helyben maradást, az egy logikus opció kihagyásának tűnhet, ugyanakkor egyrészt feleslegesen bonyolítaná a modellt, másrészt ha tartani akarjuk a hipotézist, hogy minden cselekvésnek módosítania kell a boldogságfüggvény értékét, akkor az egy helyben maradáshoz is kellene energiafelhasználást rendelnünk - így viszont ez a cselekvés már alapvetően hasonló lesz a mozgásos cselekvésekhez.
Valójában azt, hogy a robot mozog, csak mi mondjuk, az ő szemszögéből csak arról van szó, hogy választott cselekvései hatására az által érzékelt valóság valamilyen módon változik.

Az entitás érzékeli a valóságot, rendelkezik annak valamilyen képével.

Ezen a ponton szabadon szárnyalhat a fantázia. Elképzelhetünk olyan esetet, amikor a robot minden lépésben bizonyos sugarú környezetét látja, illetve ennek szélsőértékeiként olyan esetet amikor az egész rácsot látja (feltéve hogy a rács véges), illetve amikor csak az aktuális mezőt látja. Esetleg olyan esetet is, amikor nem lát semmit
Egyrészt az az érzésünk, praktikus lenne egy mindent látó robot, de az is igaz, hogy az ilyen totális látás folytán az érzékelés megszűnne a szó szoros értelmében érzékelés (vetület) lenni. A robot ekkor torzítatlanul látná a valóságot (a saját valóságát), holott korábban arra jutottunk, hogy ez a természetben nem fordulhat elő. Az érzékelés mindenképp valamiféle torzítással jár.
Ettől függetlenül - mivel ez csak egy modell - megengedhetjük, hogy robotunk mindent lásson. De hajlok arra, hogy valósághűbb modellt alkothatunk, ha az, amit a robot az egyes csomópontokban lát, csupán valamiféle összegzése az abban az irányban található nem üres csomópontoknak - mondjuk a távolság által súlyozva (a távolabbi kisebb súlyú). Így modellezzük azt, hogy érzékelése nem totális, hogy torzít (hogy távolabbi dolgokat kevésbé lát).

Az entitás képes következtetésre, tehát emlékezik (érzékeli az emlékeit) és elemez, mintázatokat keres és próbál ki.

Itt álljunk meg egy kicsit.
Mit jelent ebben a modellben emlékezni? Emlékezni annyi, mint tudni a korábbi állapotokról, és arról, hogy azok hogyan követték egymást. Korábbi állapotok alatt egyelőre mindazt értjük, aminek az entitás "tudatában van": az érzékelt valóságot, a cselekvést, a boldogságfüggvény értékét, és valamilyen képet az entitás akkori állapotáról. Arról, mit "tudott", mikor az adott érzékelés hatására az adott boldogságérték mellett az adott döntést hozta. Ha ezek közül bármelyiket elhagyjuk, már az értelem egy csökkentett modelljéhez jutunk.

Ha elhagyjuk az érzékelt valóságot az emlékből, akkor az entitás elemzésének tárgya csak az lehet, milyen állapotában mit csinált. Ekkor az entitás "vak" - és jelenlegi állapotában sem képes következtetés levonni az érzékeléséből a tapasztalataira alapozva, mert hiányzik az az emlék, amihez a jelenlegi érzékelés hasonlítható lenne. Ugyanakkor ez az entitás még mindig érzékel valamit a valóságból, amire emlékszik is - a saját boldogságfüggvény-értékét. Úgy érezhetjük, hogy nem veszítünk annyira sokat, ha az egyszerűsített modellből kihagyjuk a valóság érzékelését a boldogságfüggvény érzékelésén kívül

Ha az entitás nem emlékszik a cselekvésre, csak a környezeti képekre, és arra, hogy ezek hogyan következtek egymás után, gyakorlatilag megbénul - hiszen cselekvést kellene meghatároznia olyan adatok alapján, amik önmagukban nem tartalmazzák a cselekvést. Persze elképzelhető, hogy maga a cselekvés a környezeti kép változásaiból kikövetkeztethető, de jelentősen egyszerűsödik a modell, ha az entitás egyszerűen emlékszik rá, pontosan mit csinált.

Ha az entitás nem emlékszik a boldogságfüggvény értékére, akkor az előzőhöz hasonló eredményre jutunk. Ekkor nem tudja, hogy múltbeli cselekedetei hogyan befolyásolták a boldogságértékét, ennélfogva következtetéseket sem tud levonni. A boldogságfüggvény értékére az entitásnak emlékeznie kell, ha sikermaximalizáló stratégiát akar folytatni.

Végül, ha nem emlékszik korábbi tudására, nem lesz képes megítélni korábbi döntéseit. Ez tűnik a legkisebb érvágásnak. Hiszen a sikermaximalizálásban akkor is előre juthat az entitás, ha nem emlékszik korábbi, kisebb tudású állapotára. Másrészt a korábbi állapot teljes képe rendelkezésre áll, ha az előző három paraméter időbeli lefutásának tudatában van. Így ezt a feltételt elhagyhatjuk.

Robotunk tehát emlékszik a cselekvéseire és a boldogságfüggvény-értékeire. Az érzékelést egyelőre elhagyjuk.

Azt is mondjuk, az entitás elemez. Mit jelent itt az elemzés? Mintázatok keresését mindabban, amit tud. De mit értünk, mit érthetünk mintázat alatt?

Az egyszerűség kedvéért tételezzük fel, hogy a robot "vak". Nem képes érzékelni a környezetét, csak a boldogságfüggvényének értékét. Ez esetben a robot teljes tudása minden pillanatban leírható a J-B-F-L (jobb-bal-fel-le) cselekvések és számértékek váltakozó sorozatával. Ha feltesszük, hogy a robot félig feltöltve indul, 50-es boldogságértékkel, (így a teljes feltöltöttség boldogságértéke 100 lesz), és minden lépés egy egységgel csökkenti a boldogságfüggvény értékét, egy ilyen sorozat a következőképp nézhet ki:
50 J 49 B 48 F 47 L 46...
Valójában azt is mondhatjuk, hogy a boldogságfüggvény aktuális értéke kevésbé lényeges, fontosabb, hogy mekkora különbséget okoz a boldogságfüggvényben minden egyes lépés. Így a fenti sorozatot úgy is írhatnánk, hogy
J -1 B -1 F -1 L -1
De az is igaz, hogy a robot számára irreleváns, hogy az egyes lépések mik, míg a boldogságfüggvény folyamatosan csökken, hiszen ez alatt az idő alatt a robot stratégiája nyilvánvalóan rossz. Ez esetben a fenti lépéssort így is írhatjuk:
JBFL -4
Vegyük észre azonban, hogy minden sikert, egy rossz sorozat előz meg; hogy a robot boldogságfüggvénye mindaddig csökken, míg el nem ér egy töltési csomópontba. Az egyes cselekvéssorozatok sikerének mérőszáma végülis ez: Kevesebb energiába került-e eljutni egy csomópontba, mint amennyi energiát a robot a csomópontból felvesz.
Ha például a fenti sorozat következő lépéseként a robot egy +10 értékű csomópontba ér, akkor ezt így is írhatjuk:
JBFLL +5 (a mozgási költség és a nyereség összege)
Ekkor robotunknak már van egy adata egy jó stratégiáról. Azt várjuk, hogy tovább kísérletezzen ezzel a stratégiával, illetve próbáljon ki újakat, ha ez mégsem válik be.

Vegyük észre, mit is nevezünk itt jó stratégiának. Minden olyan mozgássorozatot, melynek egyenlege pozitív. Példánkban a robot teljes cselekvési tere az összes ötvenelemű mozgások tere. Elvileg ezzel tervezhet. Viszont kezdetben, az első pozitív megerősítésig minden mozgás ugyanolyan súlyúnak számít - mínusz egyesnek. A robot elvileg véletlenszerűen mozoghat. De úgy érezhetjük, hogy ebben a mozgástérben ez nem engedhető meg - hiszen a teljesen véletlenszerű mozgás végső soron egyazon lehatárolt területen belüli fel-alá szaladgálást is jelenthet. Ez esetben robotunk nem ismerte fel, hogy bizonyos mozgáskombinációk rossz stratégiának minősíthetők.
Úgy érezhetjük, ha robotunk egyáltalán jutni akar valamire, a negatív visszajelzésekre is figyelnie kell.

Facebook Tumblr Tweet Pinterest Tetszik

Szólj hozzá!

A bejegyzés trackback címe:

https://filozof.blog.hu/api/trackback/id/tr202801990

Kommentek:

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.

Filozóf

Elmélkedések, gondolatmorzsák, töredékek

HTML

Egyéb

Feedek

Linkblog

Friss topikok

Archívum