A. Kononovicius, I. Kazakevicius: Valdomų agentų įtaka Kirmano modelio dinamikai

Įrašo "A. Kononovicius, I. Kazakevicius: Valdomų agentų įtaka Kirmano modelio dinamikai" reprezentacinis paveikslėlis

Individų kolektyvinis elgesys sudėtingose socialinėse ir ekonominėse sistemose yra grindžiamas jų bandos jausmu, grupinės elgsenos, bei individualizmu. Bandos jausmo svarba socialinėse ir ekonominėse sistemose sudaro prielaidas manyti, kad turėtų būti galimybė valdyti kolektyvinį individų elgesį. Šiame tekste mes aptariame galimybę valdyti sudėtingas socialinės ir ekonomines sistemas per elementariausio Kirmano agentų modelio prizmę.

Daugeliu atveju į visuomenę galima žiūrėti kaip į didelę neinformuotų agentų populiaciją, kurios nariai negali patys savarankiškai priimti nepriklausomų sprendimų. Tai yra pakankamai realus visuomenės įsivaizdavimas, nes realybėje retas žmogus išmano visas gyvenimiškas sritis. Taigi tokiu atveju didžiai visuomenės daliai reikės sritį išmanančių žmonių patarimo. Šnekant modeliavimo kalba galima tarti, kad tokiu būdu neinformuoti individai tampa priklausomi nuo informuotų. Pastarieji gali sudaryti labai nedidelę sistemos dalį, tačiau jie turėtų sugebėti daryti pastebimą įtaką kolektyviniam elgesiui (tas yra patvirtinta eksperimentiškai [1]). Taigi matome, kad egzistuoja galimybė valdyti visos sistemos elgseną valdant vos mažą dalį ją sudarančių individų.

Valdomų agentų įvedimas

Jau anksčiau esame rašę apie Kirmano bandos jausmo modelį. O dabar originalų modelį papildykime valdomais agentais, bendras skaičius – \( M \). Atkreipkime dėmesį į tai, jog dabar sistema bus sudaryta iš \( N+M \) agentų. Valdomi agentai nuo įprastų agentų skiriasi tuo, kad jiems įtaka gali būti daroma tik iš išorės, kai tuo tarpu įprasti agentai yra veikiami tik vidinių veiksnių. Svarbu pastebėti, kad valdomi agentai nėra įtraukiami, kai skaičiuojame stebimą sistemos būseną, \( X \) ar \( x \). Kitaip tariant valdomi agentai tėra poveikio priemonė.

Atitinkamai modifikuoto Kirmano modelio vieno žingsnio perėjimo tikimybės turi sekančią formą:

\begin{eqnarray} P(X \rightarrow X-1) &=& X [ \sigma_2 + h(N-X) ] \Delta t, \\ P(X \rightarrow X+1) &=& (N-X) [\sigma_1 + h(M+X) ] \Delta t . \end{eqnarray}

Pastebėkite, kad vienintelis skirtumas tarp vieno žingsnio perėjimo tikimybių originaliame ir modifikuotame modelyje tėra vienas papildomas narys, \( (N – X ) M h \Delta t \).

Perrašykime vienintelę pasikeitusią perėjimo tikimybę:

\begin{equation} P(X \rightarrow X+1) = (N-X) [(\sigma_1 + h M)+h X] \Delta t = (N-X) [\tilde{\sigma}_1 + h X] \Delta t. \end{equation}

Taigi, kaip matome, valdomi agentai turi gan ribotą efektą – šiek tiek pasikeičia vieno iš sistemos parametrų prasmė. Tas yra iš esmės panašu į situaciją nagrinėtą [2] darbe, bet esminis skirtumas yra tas, kad mūsų atveju keičiasi individualaus elgesio pobūdis, o [2] darbe buvo keičiamas bandos jausmo parametro supratimas.

Atsižvelgdami į aukščiau aptartus pokyčius galime nesudėtingai užrašyti (pasiremiant ankstesniais rezultatais) tokį agentų modelį atitinkančią stochastinę diferencialinę lygtį:

\begin{eqnarray} \mathrm{d} x &=& [\tilde{\sigma}_1 (1-x) – \sigma_2 x] \mathrm{d} t + \sqrt{2 h x (1-x)} \mathrm{d} W = \nonumber \\ &=& [( \sigma_1 + h M ) (1-x) – \sigma_2 x] \mathrm{d} t + \sqrt{2 h x (1-x)} \mathrm{d} W. \end{eqnarray}

Valdomų agentų daroma įtaka lengvai pastebima užsirašius šio modelio stacionarią tikimybės tankio funkciją:

\begin{equation} p(x) = \frac{\Gamma(\varepsilon_1+\varepsilon_2+M)}{\Gamma(\varepsilon_1+M) \Gamma(\varepsilon_2)} (1-x)^{\varepsilon_2-1} x^{\varepsilon_1+M-1} , \quad \langle x \rangle = \frac{\varepsilon_1+M}{\varepsilon_1+\varepsilon_2+M} , \label{xpdf} \end{equation}

kur \( \varepsilon_i = \sigma_i / h \).

Taigi, kaip matome, iš \eqref{xpdf} lygties, valdomi agentai gali pakeisti vidutinę sistemos būseną link pageidaujamo rezultato. Visai įdomu pastebėti, kad turint fiksuotą ir mažą skaičių valdomų agentų, \( M \), vis tiek galima daryti įtaką be galo didelėms sistemoms.

Keli skirtingi valdomų agentų poveikio scenarijai

Kirmano agentų bandos jausmo modelį galima traktuoti dviem skirtingais būdais [3, 4]. Vienu atveju galime leisti visiems agentams sąveikauti su visais kitais agentais (šis atvejis buvo aptartas anksčiau). O kitu atveju galėtume leisti agentams sąveikauti tik su savo kaimynais (prisiminkite Kirmano modelio palyginimą su Baso modeliu). Jeigu originalų Kirmano modelį galima traktuoti dviem būdais, tai mūsų papildytą modelį galima suprasti keturiais būdais:

  • Paprasti agentai sąveikauja su visais kitais paprastais agentais (neekstensyviai), valdomi agentai sąveikauja su visa sistema (neekstensyviai), (būtent šis atvejis aptartas aukščiau)
  • Paprasti agentai – tik su kaimynais (ekstensyviai), o valdomi – neekstensyviai,
  • Paprasti agentai – neekstensyviai, o valdomi – ekstensyviai,
  • Paprasti agentai – ekstensyviai, valdomi – ekstensyviai.

Toliau mes šiuos keturis būdus sutrumpintai vadinsime naudodami tik du žodžius, kurių pirmasis sąveiką tarp paprastų agentų, o antrasis apibūdins valdomų agentų sąveika su sistema.

Ekstensyvi-ekstensyvi ir neekstensyvi-ekstensyvi sąveika

Aukščiau jau esame aptarę neekstensyvios-neekstensyvios sąveikos atvejį. Ir matėme, kad tokiu atveju galime efektyviai valdyti kolektyvinį elgesį. Bet kas atsitinka, jeigu sąveikos sistemoje yra tik tarp kaimynų (t. y. ekstensyvios, lokalios)? Tokiu atveju vieno žingsnio tikimybės atrodytų taip:

\begin{eqnarray} P(X \rightarrow X-1) &=& X \left[\sigma_2 + \frac{h}{N} (N-X) \right] \Delta t , \\ P(X \rightarrow X+1) &=& (N-X) \left[ \sigma_1 + \frac{h}{N} (M+X) \right] \Delta t. \end{eqnarray}

Iš šios išraiškos matome, kad didelių \( N \) riboje bandos jausmo nariai nyksta. Taip pat nyksta ir narys susijęs su valdomais agentais. Taigi šiuo atveju mes negalime valdyti kolektyvinio sistemos elgesio.

Visgi, jei \( N \) yra baigtinis, o ne begalinis, tai bandos jausmo įtaką galima užfiksuoti atitinkamai pasirenkant tinkamą \( M \) vertę. Tinkamą vertę sufleruotų \( m = M/N = \mathrm{const} \) sąlyga (\( m > 0 \)). Visgi norint išlaikyti galimybę valdyti sistemą tektų \( M \) didinti taip pat sparčiai kaip \( N \), kas nebūtų itin praktiška. Tad galima būtų daryti išvadą, kad tokiu atveju galimybė valdyti išlieka, bet itin apribota.

Akivaizdu, kad analogiškas rezultatas gaunamas ir leidus paprastiems agentams sąveikauti su visais kitais agentais. Juk sistemos valdymo galimybes konkrečiu atveju labiau veikia tai kaip su sistema sąveikauja valdomi agentai. Taigi neekstensyvios-ekstensyvios sąveikos atveju gautume kokybiškai identiškus rezultatus.

Ekstensyvi-neekstensyvi sąveika

Aptarkime ir vienintelį likusį atvejį, kuris mūsų supratimu geriausiai atitiktų, tai kas vyksta realiose socialinėse sistemose. Natūralu įsivaizduoti, kad sąveika tarp paprastų agentų yra ekstensyvi. Juk realybėje paprasti žmonės dažniausiai bendrauja tik su savo aplinka – draugais, kolegomis ar pažįstamais. Paprastų žmonių pažinčių ratas gali būti pačių įvairiausių didžių, bet daugeliu atveju jis vis tiek bus sunkiai palyginamas su visuomenės dydžiu. Visgi mes taip pat turime individų, kurie yra žymūs ir dažnai skleidžia savo įsitikinimus per įvairias informacijos sklaidos priemones. Tokie individai savo nuomonę perduoda visiems, arba pastebimai didelei visuomenės daliai. Taigi sąveika tarp šių individų ir visuomenės yra neekstensyvi.

Jei mes valdome būtent šiuos neekstensyviai sąveikaujančius agentus, tai vieno žingsnio tikimybės turi sekantį pavidalą:

\begin{eqnarray} P(X \rightarrow X-1) &=& X \left[\sigma_2 + \frac{h}{N} (N-X) \right] \Delta t , \\ P(X \rightarrow X+1) &=& (N-X) \left[ \sigma_1 + h M \frac{h}{N} X \right] \Delta t. \end{eqnarray}

Vėlgi mes matome, bandos jausmo nariai vis vien išnyksta didelių \( N \) riboje. Bet dabar neišnyksta nariai atsakingi už valdomų agentų įtaką! Taip pat pastebėkime, kad tokiu atveju makroskopinis modelis yra paprasta diferencialinė lygtis:

\begin{equation} \mathrm{d} x = \left[ (\sigma_1 + h M) (1-x) – \sigma_2 x \right] \mathrm{d} t , \end{equation}

kurios sprendinys eksponentiškai greitai konverguoja į pageidaujamą rezultatą:

\begin{equation} x(t) = \frac{\varepsilon_1+M}{\varepsilon_1+\varepsilon_2+M} + \left( x_0 – \frac{\varepsilon_1+M}{\varepsilon_1+\varepsilon_2+M} \right) \exp(- h [\varepsilon_1+\varepsilon_2+M]) . \end{equation}

Taigi tokiu atveju mes turime idealią galimybę valdyti sistemos elgseną!

Išvados

Taigi yra visai realu valdyti be galo dideles bendruomenes! Tai yra įmanoma dėl bandos jausmo – polinkio perimti kitų žmonių socialinį elgesį, informaciją ir žinias. Esminis faktorius įtakojantis galimybes valdyti kolektyvinį elgesį yra paprastų agentų požiūris į valdomus agentus. Jei šie agentai yra svarbūs, žinomi ir vieši asmenys, tai galimybės valdyti kolektyvinę elgseną, įdedant minimalios pastangas, yra gan didelės. Priešingu atveju norint valdyti kolektyvinę elgseną tektų įdėti nemažai pastangų.

Interaktyvi programėlė

Kviečiame išbandyti interaktyvią Kirmano agentų modelio programėlę, kuri yra papildyta valdomais agentais. Siūlome atkreipti dėmesį į tai, kad programėlėje \( M \) vertės gali būti teigiamos ir neigiamos. Neigiamos \( M \) reikšmės reiškia, kad nurodytas valdomų agentų skaičius yra kitoje būsenoje, nei aprašoma \( x \) kintamuoju. Likusių parametrų interpretacija yra įprastinė.

Kairiame paveiksle vaizduojamas laikinis signalas – raudonais taškais žymima iš modelio gaunama laikinė realizacija, o mėlyna kreivė atitinka teorinį vidurkį. Dešiniajame paveiksle vaizduojama \( x \) tikimybės tankio funkcija. Tikimybės tankio funkcijos grafikas yra pradedamas skaičiuoti iš naujo nuspaudus bet kurį iš programėlės valdymo mygtukų. Mygtukų „Atnaujinti’ ir „Stabdyti“/“Tęsti“ pagalba galima pratęsti seną laikinę realizaciją naudojant naujus parametrus (bet tikimybės tankio funkcija bus pradėta skaičiuoti iš naujo). Spustelėję mygtuką „Pradėti“ visada pradėsite skaičiavimą nuo nulio.

Padėka

Šis tekstas parengtas LMT 2013 metų vasaros praktikos „Sudėtingų stochastinių sistemų valdymas“ (vadovas A. Kononovičius) metu. I. Kazakevičius dėkoja už Lietuvos mokslo tarybos projekto „Studentų mokslinės veiklos skatinimas“ (VP1-3.1-ŠMM-01-V-02-003) paramą. Projektas yra finansuojamas pagal Žmogiškųjų išteklių plėtros veiksmų programos 3 prioritetą „Tyrėjų gebėjimų stiprinimas“ iš Europos socialinio fondo ir Lietuvos Respublikos valstybės biudžeto lėšų.

Literatūra

  • J. R. G. Dyer, A. Johansson, D. Helbing, I. D. Couzin, J. Krause. Leadership, consensus decision making and collective behaviour in humans. Phylosophical Transactions of the Royal Society B 364 (1518), 2009, psl. 781-789. doi: 10.1098/rstb.2008.0233.
  • A. Carro, R. Toral, M. San Miguel. Signal amplification in an agent-based herding model. 2013. arXiv: 1302.6477 [physics.soc-ph].
  • S. Alfarano, T. Lux, F. Wagner. Estimation of Agent-Based Models: The Case of an Asymmetric Herding Model. Computational Economics 26 (1), 2005, psl. 19-49.
  • S. Alfarano, T. Lux, F. Wagner. Time variation of higher moments in a financial market with heterogeneous agents: An analytical approach. Journal of Economic Dynamics and Control 32, 2008, psl. 101-136.
Palikti atsiliepimą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *