श्री भागवत, प्रिझनर्स डिलेमाची चांगली ओळख. दोघांनी एकमेकांविरुद्ध पुरावे देणे याला 'नॅश इक्विलिब्रियम' असे म्हणतात. 'नॅश इक्विलिब्रियम' ही गेम थियरीमधील मुलभूत 'सोल्युशन कॉन्सेप्ट' आहे जी वापरून विविध उदाहरणे सोडवता येतात. 'प्रिझनर्स डिलेमा' या गेममध्ये दोघांना एकाचवेळी (सायमल्टेनीयसली) खेळायचे असल्याने दुसर्याची कृती पाहता येत नाही.
आपण दिलेल्या उदाहरणांतील पहिल्या उदाहरणात राष्ट्रांमधील स्पर्धा तसा 'सायमल्टेनियस फॉर्म' गेम नसून 'सिक्वेन्शियल' (दोन्ही स्पर्धक एकामागून एक खेळतात. उदा. भारताची अणुचाचणी पाहील्यानंतर पाकिस्तानने तसे करणे.) आहे. त्यामुळे पहिल्या उदाहरणात जरी गेम थियरीची तत्त्वे वापरणे शक्य असले तरी ते प्रिझनर्स डिलेमाचे उदाहरण नाही. उरलेल्या दोन उदाहरणातील परिस्थिती थोडीशी किचकट आहे. उदा. दूसर्या उदाहरणात स्टेरॉइड चाचण्या रँडमली होतात की नियमित केल्या जातात वगैरे. जमल्यास आणखी सविस्तर प्रतिसाद लिहीन.
वरील उदाहरणात एका कैद्याचा निर्णय दुसर्या कैद्याच्या शिक्षेवर परिणाम करतो. एकमेकांच्या वर्तनाचे निरीक्षण दोघांनाही करता येत नाही. तेव्हा हा गुंता कसा सोडवता येईल? श्री भागवत यांनी दाखवलेल्या तक्त्यात सर्व शक्यता तसेच दोन्ही कैद्यांवरील त्याचे परिणाम (त्यांना मिळणारे payoffs) मांडता येतात.
१. दोघांनी एकमेकांविरुद्ध पुरावे देणे.
२. दोघांनी गप्प बसणे.
३. 'अ'ने 'ब' विरुद्ध बोलणे व 'ब'ने गप्प बसणे.
४. 'ब'ने 'अ' विरुद्ध बोलणे व 'अ'ने गप्प बसणे.
(दोन्ही कैदी बुद्धिप्रामाण्यवादी (rational या अर्थाने) निर्णय घेतात, हे गृहीतक अपेक्षित आहे.)
'अ' आणि 'ब' एकमेकांचे निर्णय पाहू शकत नसतांना कसा निर्णय घ्यावा. हा खेळ समतल(?) (symmetric) असल्याने फक्त 'अ'बाबत विचार करू. ('ब')ही तसेच खेळेल कारण समतलता(?).
१. समजा 'ब'गप्प बसला तर 'अ'ने पुरावे दिल्यास कमी शिक्षा (सुटका विरुद्ध ६ महिने) होईल.
२. समजा 'ब'ने पुरावे दिले तर 'अ'नेही पुरावे दिल्यास त्यास कमी शिक्षा (१० वर्षे विरुद्ध ५ वर्षे) होईल.
म्हणजेच 'ब'ने कुबलाही निर्णय घेतला तरी 'पुरावे देणे' हा निर्णय घेतल्यास 'अ'ला कमी शिक्षा होईल. 'ब'च्या निर्णयाबाबत सारखाच तर्क लावल्यास दोघे पुरावे देतील.
नॅश इक्विलिब्रियमची ढोबळ व्याख्या करायची झाल्यास अशी करता येईल: अशी स्थिती ज्यात कुठल्याही खेळाडूला आपल्या कृतीला सोडून दुसरी कृती करावीशी वाटण्यात काहीच फायदा दिसत नाही.(No player has an incentive to deviate from their respective strategies.) ही संकल्पना जॉन नॅश यांनी शोधून काढली ज्यामुळे त्यांना अर्थशास्त्रातील नोबेल पारितोषिकही मिळाले.
वरील खेळात दोघांना एकाच वेळी खेळायचे आहे (एकमेकांना पाहू शकत नाही या अर्थाने). प्रत्यक्ष जीवनातील निर्णय गुंतागुंतीचे असतात. दोनपेक्षा अधिक खेळाडू असतात तसेच इतर खेळाडूंच्या शक्यतांचा विचार करावा लागतो. काही खेळात प्रतिस्पर्धी एकमेकांची कृती पाहू शकतात किंवा काही कृती पाहू शकतात तर काही नाही. वर धनंजयने म्हटल्याप्रमाणे काही खेळ पुन्हा पुन्हा (finitely repeated आणि infinitely repeated) खेळले जातात. (या खेळांमध्ये प्रतिस्पर्ध्याविषयी काही एक मत (past belief) असते.) 'नॅश इक्विलिब्रियम' ही संकल्पना वापरून हे खेळ सोडवता येतात.
अक्षय, खुलासेवार प्रतिसादामुळे मुद्दा आणखी स्पष्ट झाला.
ह्या लेखात व प्रतिसादांमधे "खेळा"चा संदर्भ अनेकदा आला म्हणून मला ह्या थेअरीचा संबंध खऱ्या जीवनाशी कसा येऊ शकतो हे लिहावेसे वाटले.
सेल्स मॅनेजर विजयचा जानी दोस्त राघव अचानक त्याला भेटला. कॉलेजनंतर दोघे पहिल्यांदाच भेटत होते. गप्पा-टप्पा झाल्यानंतर चर्चा कामाकडे वळली. राघव एका मोठ्या मल्टीनॅशनल कंपनीत मोठ्या हुद्द्यावर आहे व त्याला काही कामे करुन घ्यायची आहेत. संयोगाने विजयची कंपनी ती सर्व्हीस देऊ शकते.
पण, विजयची जी सेल्स टेरीटरी आहे, त्यात नेमकी राघवची कंपनी येत नाही. त्यामुळे राघव कडून त्याला अधिकृतपणे व्यवसाय मिळवता येत नाही, क्वार्टरचे टारगेटही पूर्ण होण्यास मदत होणार नसते आणि त्या अनुषंगाने त्याचे कमिशनही मिळणार नसते. राघवची कंपनी ज्याच्या टेरीटरीमधे येते तो मुरुगन विजयचा सहकारी.
ह्याठिकाणी विजयला असे वाटू लागते की, राघवचा व्यवसाय मुरुगनलाही मिळाला नाही तर त्याचे टार्गेटही पुर्ण होणार नाही व आपल्याला कमीपणा येणार नाही. व विजय हा लिड मुरुगनपासून लपवून ठेवतो.
हे प्रकार होऊ नये म्हणून, एकमेकांचे लिड एकमेकांना देणे व त्यातून अधिकृतपणे कमिशन व सेल्स पॉइंटस कसे वाटता येतील हा सुज्ञ विचार करणे आवश्यक असते. असे केल्याने सेल्स डिपार्टमेंट ही टीम म्हणून व व्यापकतेने आख्खी कंपनीच यशस्वी होउ शकते.
आणि म्हणूनच असे घडत असते व ते टाळता येऊ शकते ही जाणीव नव्या व्यवस्थापकांना होणे गरजेचे असते म्हणून काही खेळ (गेम्स) तयात केले आहेत.
श्री भागवत, आपण दिलेले उदाहरण योग्य आहे. व्यवस्थापकांना अशा प्रकारे 'न्याय्य वितरण' (fiar allocative distribution) करता येणे आवश्यक आहे. त्यासाठी गेम थियरीचा वापर करून 'सहकार्यपूर्ण खेळ' (Co-operative games) ही एक नवीन उपशाखाच विकसित झाली आहे.
उत्तम ओळख आहे. +१
क्रमिक निर्णयाच्या मुद्द्याबाबतही सहमत आहे. +१
शिवाय,सामान्य जीवनातील अनेक निर्णय एकमेकांच्या आठवणीत राहातात. उदाहरणार्थ मुक्तता/शिक्षा असे आयुष्यात एकदाच खेळायचे पर्याय नसून, पुन्हा-पुन्हा खेळायचे पर्याय आहेत, असे समजा. तरी खेळाच्या निर्णयांत फरक पडतो.
छान लिहिलय...
पुढचा भाग लवकर टाका..
--प्रभो
-----------------------------------------------------------------------
काय सांगावे स्वतः विषयी,आहात तुम्ही सूज्ञ !! एका सारखे एकच आम्ही,बाकी सगळे शून्य !!
नाही; ह्यातून जो संदेश नेत्यांना द्यायचा असतो तो असा की, तुम्ही अशी नुकसानीची परिस्थिती निर्माण होऊ न देता जितके जास्त जिंकता येईल ते जिंका; त्याबद्दल "नॉन-झिरो सम" असा एक कॉन्सेप्ट आहे.
न केलेल्या सौम्य गुन्ह्याबद्दल शिक्षा भोगली की केलेल्या गंभीर गुन्ह्यातुन सुटका मिळते. वकील लोक अशा इष्टापत्ती अशिलावर ओढववुन मूळ (गंभीर गुन्हा)मुद्दा दुर्लक्षित करवतात.
प्रकाश घाटपांडे
आमच्या अनुदिनीत जरुर डोकवा.
>>>इष्टापत्ती अशिलावर ओढववुन मूळ (गंभीर गुन्हा)मुद्दा दुर्लक्षित करवतात.<<<
:-) त्यानंतर मिळणारी साधी कैद, कैद्यांना त्यांचे हक्क मिळावेत म्ह्णूणून मानवी हक्क वाल्यांचे कार्य ह्याबद्दल बरेच लिहिता येईल नाही?
लेख छान.
हे म्हणजे कोकणातल्या 'माझी म्हस मेल्याच दु:ख नाही पण अजून शेजार्याची म्हस दूध कशी देते?' या प्रकारची मनोवृत्ती वाटते.
पुण्याचे पेशवे
आम्ही हल्ली सहीत वाक्यं लिहिणं बंद केले आहे.
Since 1984
प्रिझनर्स डिलेमा ह्या मनोवृतीचा अभ्यास फ्लड आणि ड्रेशील ह्या व्दयीने १९५० साली अमेरीकेत केला. म्हणजेच अशी मनोवृती ही तेथे तर आढळत होती. तुम्ही दाखला दिलेले उदाहरण अगदी ह्याच पठडीतले आहे. ते कोकणातील त्याचे रुप आहे पण ही जगभर आढळणारी मानवी मूल्भूत मनोवृती आहे. त्यास स्थ़ळ-काळ ह्याचे बंधन नाही असेच दिसतेय.
मानसशास्त्राच्या प्रयोगात पाऊलोव चा कुत्र्यावरचा प्रयोग सर्वाना ठाऊक आहे.
असाच एक दुसरा प्रयोग केला गेला. एका पिंजर्यात एक माकड ठेवले गेले. त्यात दोन स्वीचेस सुद्धा ठेवले होते. अ स्वीच दाबला तर चॉकलेट मिळायचे ब स्वीच दाबला तर शॉक बसायचा. हळू हळू माकाड फक्त अ स्वीच दाबायला शिकले. कालांतराने स्वीचेस चे वर्तन बदलले. अ ऐवजी ब स्वीच मुळे चॉकलेट आणि अ स्वीच मुळे शॉक असे केले. माकडाने तेही अंगीकारले.
कालांतराने दोन्ही स्वीचेस चे वर्तन रँडम केले गेले.
माकडाला कळेना कोनता स्वीच दाबल्यानन्तर शॉक बसेल?
माकडाने हा बदल एका वेगळ्याच पद्धतीने अंगीकारला.
ते एकाच वेळेस दोन्ही स्वीचेस दाबू लागले.
हो, पावलाव ह्यांना त्याबद्दल नोबेलही देण्यात आले होते. येथे त्यां च्या प्रयोगाबद्दल अधिक माहिती आहे. व त्यावर एक छोटा खेळही तयार केला आहे तो ही खेळून पाहता येईल- येथे
:S
अवघड आहे! दुसरं काय?
एकानं असं वागायचं, दुसर्यानं तसं...त्यात एकाचं नुकसान दुसर्याचा निदान प्रथमदर्शनी तरी फायदा....एकुण सगळाच विस्कोट!
च्छ्या:! खरंच अवघड आहे हे मानशास्त्रीय घोळ!
प्रतिक्रिया
चांगली ओळख
>>>जमल्यास
नॅश इक्विलिब्रियमविषयी
अक्षय,
बरोबर
>>
+१ आणि +१
+२ आणी +२
+३
एका
मस्त. हे
नाही;
इष्टापत्ती
>>>इष्टापत्
लेख छान. हे
प्रिझनर्स
मानसशास्त्र
पावलाव ह्यांना त्याबद्दल नोबेलही
पाव्लोव
डोक्या आणी
अवघड आहे!
इंटरेस्टि