Vizito de Nobelpremiito al Murcia

II: La Prelego

Kiel ni jam diris pasintnumere, Profesoro Reinhardt Selten unufoje prelegis esperante al ĝenerala publiko je la 6a de marto de 1996 en Murcia. Tio estas la unua fojo kiam oni faris tion. Kajeroj el la Sudo estis tie, kaj ni prenis la prelegon. Ĝi estis jene:

Dankon pro afabla enkonduko. Antaŭ mi parolos pri Teorio de Ludo mi devas enkonduki iom malrapide por preni la malfacilaĵojn klare.

La historio de Ludo Teorio ampleksas 50 jarojn, kaj naskiĝis fare de John von Newman, kvankam ĝi estis nomumita antaŭe.

Kio estas Ludo teorio?

Matematike modeliĝas kaj analizas celkonforman interagon en konflikto kaj interago. Oni trovas aplikadon ĝian en konduto kaj homa kaj besta.

Kion Ludo teorio ne traktas?

Kiel gajni ludante ruleton, kiel riĉiĝi per bona spekulado, kiel bone ludi ŝakon aŭ pokeron. Tio estas, ĉar jam ekzistas difinitajn regulojn kiujn la ludantoj ne povas ŝanĝi, sed ili devas obei.

Se la Ludo Teorio ne povas fari tion, kion ĝi povas fari?

Ĉefe por analizi ĝeneralajn konkludojn pri la logiko de strategia interago. La pli grava estas apliko al teorio kiu modeligas sciencojn kiel ludan matematikon kaj analizan teĥnikon. Sed ankaŭ oni povas apliki ĝin al ekonomioteorio, politikoteorio, militisma kaj biologia evoluteorioj...

Ekzemplo

Kvantovaria oligopolo sen kostoj. Estas merkato en kiu estas tri firmaoj. La Unua, la Dua aŭ la Tria povus produkti la kvanton, kiu povas esti de 0 al 20. Kaj ĉiu firmao produktas, aŭ parton aŭ nulon. Por simpleco, oni ne konsideros la kostojn. La gajno estas kvanto multobligita de la prezo (kvanto*prezo). Imagu, ke ĉiuj vendas malsame. Ne gajnis tiu, kiu havis plej kvanton, sed estas pli konsideroj. Ekzistas eraroj kiuj damaĝas la erarantojn pli ol aliaj. Oni povas demandi sin kiu estas la plej bona maniero por agi. Se firmao atingas la 33% de la merkato, oi faris plej bone, ĉar oni ne povas superi 100%, kaj 33% estas tute atingebla.

Se tiu analizo estas korekta, oni povas fari konstaton, sed oni ne scias tion, kion la konkurenco faros.

Kiam unu scias, ke oni traktos fari 33%, li povas fari pli ol 33%. Sekve, la peljbono estas, ke ĉiu faras 33%, ĉar neniu povus fari pli ol tian pocenton. Tia situacio, 33% por ĉiuj, estas la ekvilibra situacio.

Ekvilibro estas mem-stalibiliga ĝenerala rekomendo, kaj devio ne estas avantaĝa se ĉiu alia sekvas la rekomendon.

Konkludoj

La plej sukcesa ludanto ne necese estas tiu, kiu havas la plej bonan strategion. Eraro povas damaĝi aliajn bonajn ludantojn pli multe ol la reston.

Ekzemplo de ekvilibro:

Ŝtelisto kaj gardisto

Ŝtelisto povas shteli aŭ resti hejme. La gardisto povas gardi aŭ dormi. Se la ŝtelisto ŝtelas kaj la gardisto dormas, la ŝtelisto povas labori. Se la gardisto laboras, la ŝtelisto iras al malliberejo. La prozeso estas: se ŝtelisto ŝtelas, la gardisto dormas malplie. Sekve, la ŝtelisto povas labori malpli. Tial la gardisto dormas plimulte, ois la ŝtelisto povas ŝteli tiom, kiom antaye, sed plue la ŝtelisto povas rabi pli kaj la gardisto dormos malpli. Por rompi la prozeson, oni devas puni plie la gardiston. Tiu dormos malpli, sed la ŝtelisto rabas malpli ofte. La probablo de la ŝtelo ne dependas de la movo de ŝtelo, sed de la potenco de la motivo de la gardisto.

Tio estas grava leciono: ke ne ĉiam oni obtenis la celon, kiun oni volas. Oni devas analizi la profundajn kaŭzojn.

Ripetado ŝanĝigas la ludon

Estas dupolo: firmaoj Unu kaj Du. La prezoj malsamas. Se la prezoj estas egalaj, la firmaoj havos dividon de la merkato. Alie, la pli malalta en prezo ricevos la tutan profiton:

Se la prezo egalas,la profito egalas. Alie, la plej malalta preza firmao ricevas la tutan profiton.

Unufoja ludo

Ekvilibro povas esti BB kaj CC. Se ĉio estas A, ne estas ekvilibro: iu ricevas 5, sed se B devias, oi devias 6. Se ambaŭ ludas, la devio estas 2. Cc donas alian ekvilibron, ĉar ĉiu obtenas bonon 2, kaj se iu devias 1, la alio devias al 0.

Se oni ludas du fojojn

Nova ekvilibro en la duperioda ludo:

Kiam ne ekzistas alternativo unufoje, ekestas je la dua ludo.

Se ludas C,C anstataŭ B,B, la gajninto estas 1, kaj ne estus profitdono.

Fenomeno de signalado

Signalado estas nomo elpensita de Spencer en 1973, kaj en 1975 Zahari renomis oiel kiel handikapiraĵo. Priskribo: en kelkaj partoj oni konkurencas pri egaj ignamoj. La afero ne havas avantaĝon ekonomikan. La kialo estas, ke se viro sukcesas kreskigi la plej altan ignamon, li ricevas grandan prestiĝon kaj pozicion. Se viro povas obteni grandan ignamon, li estas bona agrikulturisto. Eĉ se la procezo celas nur kreskigi egan frukton, la afero estas farinda, ĉar ĝi montras grandan laboreblecon.

Simile okazas en Samoa: viroj suferas vole dolorajn operaciojn tatuajn. Tiel ili montras bonajn kvalitojn por milito, ĉar li toleras doloron. Eĉ hodiaŭ ili portas la tatuaĵojn pri la indeco de familiestro. En ambaŭ kazoj kio gravas estas la kapablo por sendi (aŭ ne sendi) signalon. Viro kiu portas tatuaĵon, montras ke li toleras doloron.

La produktiveco dependas de la signalkapablo. La merkata valoro de p kaj p' estas la meznombroj. La ekvilibro estas p'', kiel la kostoj egalas la kostojn de la aliaj. Maldekstre el p'' ĝi ne estas utila, sed dekstre ĝi jam estas.

Spencer aplikis tiun teorion al edukado. Oni povas havi cinikan vidon pri edukado universitata, ĉar oi estas utila por elsendi signojn: ne gravas tio, kion oni lernas je la unviersitato; kio gravas estas, ke io ajn oni lernas tie estas malfacila. La mesaĝo kiun la universitataj studentoj elsendas estas, ke ili eblas fari oin. Mi, kiel univerzitata profesoro, esperas ke tio ne ĉiam estu vera! Tamen, tiu teorio ne estas tute malvera...

Je bilogio

Ni ĉiu scias pri virpavo, kiu havas multe da plumoj, sed subteni tian plumaron bezonas multan energion. Nur viroj pavaj produktas tiujn belajn plumajn. Pere de la plumaro ili signalas pavinojn, ke siaj genetika materialo estas bona, ĉar ili havas sufiĉe da sano por subteni oin. Aliflanke, havi tiun plumaron estas malavantaoo por la virpavo.

Projektado de meĥanismoj

Usona aŭkcio de radiofrekvencoj en 1994; mallaroaj bandoj por persona komunikado. Tiu, kiu volas aĉeti frekvencon, devas havi ĝin oenerale. La bezonoj de la aĉetantoj estas tre diversaj. Ĉiu fojo kiam iu ofertas, li povas fari proponon por ĉiu frekvenco. Tamen, neniun frekvencon oni vendas ĝis la fino. La aŭkcio finas kiam ne plu estas oferto.

La procezon ilustras la jena grafikaĵo:

La spertoj esperis atingi nur 50 miliononj maksimume. Sed oni obtenis 617! Estas alia klarigo: homa konduto ne estas tiel rigida kiel estas espereble.

Priskriba ludoteorio

Norma ludoteorio analizas strategiajn problemojn supozante plenan raciecon.

Homaj kapabloj de pensado kaj kalkulado ne estas senfinaj. Tial homa racieco estas limigita.

Homaj motivoj estas malpli monolitaj ol ni kutime supozas en ekonomia teorio.

Esplorkampoj: lernprocezoj en ludoj. Alidirektitaj motivoj. Strategia pensado.

Reciprokeco: mi traktas vin kiel vi traktas min. Limigita reciprokeco deformas tion, kion signifcas specifa situacio. Devas esti situacio por diskrimini kiel oni traktas min. Tiam estas limigita la teorio racie.

Ultimatoludo

(ŝuldita al Güth kaj aliaj en 1982)

La ludanto A proponas dividon de 100. La ludanto B aŭ akceptas, aŭ ne akceptas. Se ne, ambaŭ ricevas nenion. Solvo povus esti, ke ludanto A ricevas 99 kaj B nur 1. Se B ne akceptas, estas ribelo kontraŭ ekspluatado, t.e., negativa reciprokeco. Oni faris la eksperimenton dividi $100 po du ludantoj, kaj la propono estis $70 al la A kaj $30 al la B, kiu tute rifuzis kaj lasis la ĉambron. Estis li persono tiel fiera, ke ne komprenis, ke oni volis donaci $30 al li!

Estas ege domaĝe, ke ĉar la tradukado ne estis samtempa, sek sekva, mi ne povis diri pli al vi pro manko da tempo...

Aŭdis kaj skribis Jesuo de las Heras


Reiri al Kajero 31.
Reiri al Esperanto España.