प्रिझनर्स डिलेमा
मनुष्यबळ विकास व्यवस्थापनाचा (एचआरएम) अभ्यास केलेले आणि "नेतेगिरी" (मराठी- लिडरशिप) चा अभ्यास केलेल्यांना कदाचित माणसाच्या ह्या मानसिक द्वंद्वाची, कलाची माहिती असेल. मला जेव्हा ह्या थेअरीची तोंडओळख झाली तेव्हा मी हरखून गेलो होतो व पटले की, ही एक बहूव्यापी थेअरी आहे. - असे मी का म्हणतो आहे, ते नंतर सांगितलेले आहेच. प्रथम ह्या थेअरीची पार्श्वभूमी (उगम) पाहू व तीचा नेतेगिरीत कसा वापर होतो ते पाहू.
"प्रिझनर्स डिलेमा" ला आपण ह्या गोष्टीपुरते "कैद्यांचा पेच" असे म्हणू.
गृहीत धरा की, एका मोठ्या गुन्ह्यात दोन (अ आणि ब) संशयितांना पकडले आहे. पोलिस त्यांना वेगवेगळ्या कैद-खोलीत डांबून ठेवतात. नंतर पोलिस त्यांना वेगवेगळे भेटून त्यांच्यासमोर एकच आणि तोच प्रस्ताव ठेवतात. प्रस्ताव असा असतो-
चौकटीत दाखवल्याप्रमाणे पोलिस त्या दोघांनाही तो प्रस्ताव समजावुन सांगतात. दोघांनाही त्यातील फायदे व तोटे स्पष्ट दिसतात. दोघेही गप्प बसले तर दोघांचाही त्यात फायदा असतो. पण एक जण गप्प बसला आणि दुसऱ्याने त्याच्याबद्दल पुरावे दिले तर साहजिकच गप्प बसणाऱ्याची मुक संमती आहे असे मानून त्याला गुन्ह्याची सजा मिळणार हे दोघांनाही समजते.
आणि हाच त्यांचा पेच असतो.
पहिल्या मार्गाचा अवलंब केल्यास (दोघांनीही गप्प बसणे), दुसऱ्याची काहीच शाश्वती नसल्यामुळे सरळसरळ आत्महत्या केल्यासारखेच होईल ह्या भीतीने गप्प आपण बसण्याचा मार्ग स्वीकारणे दोघांनाही योग्य वाटत नाही. त्यांना ही जाणीव असते की, त्यामुळे दोघेही कमीत-कमी शिक्षेच्या प्रस्तावाला मुकणार असतात.
तो मार्ग दुसरा मार्ग स्वीकरल्यास (दोघेही एकमेकांबद्दल काही-बाही पुरावे देतील), दोघांनाही १० वर्षांऐवजी ५ वर्षे कैद होईल. आणि हाच मार्ग ते निवडतात. दुसऱ्याला आपल्या गप्प बसण्यामुळे पूर्ण फायदा होईल अ तो सुटेल आणि आपण मात्र १० वर्षे कैदेत खितपत पडून राहू हे शहाणपणाचे त्यांना वाटत नाही. दोघेही गप्प बसतील असा विश्वास त्यांना एकमेकाबद्दल वाटणे शक्य नाही, मग अशा परिस्थितीत ते दोघेही तोंड उघडतात व चक्क दुसऱ्याचा फायदा होऊ नये म्हणून आपले नुकसान स्वीकारतात.
"दुसऱ्याचा फायदा होऊ नये म्हणून आपले नुकसान स्वीकारणे" हाच तो कळीचा मुद्दा, ज्याला कैदयांचा पेच असे म्हणले जाते. मनोभ्यासक ह्या मनोवृत्तीचा बारकाईने अभ्यास करतात व त्याचा संबंध आपल्या रोजच्या आयुष्यात कसा लागू पडतात ते पाहतात.
सांघिक काम- टिमवर्क- हे जितके सोपे वाटते तितकेच अवघड असलेले एक कौशल्य. एकाच छपराखाली एकाच संघटनेत, कंपनीत, कार्यालयात काम करणाऱ्या संघांमधे अशी रस्सीखेच होणे हे नैसर्गिक आहे; पण ते हिताचे नाही. मानवाच्या ह्या अशा मनोवृत्तीची जाण असणे हे प्रत्येक नेत्याचे कर्तव्य आहे. त्यातून मार्ग कसा काढायचा हा लेखाचा एक स्वतंत्र विषय आहे. नेत्यांना ह्याची ओळख एका खेळाव्दारे करुन दिली जाते- "विन ऍज मच ऍज यु कॅन".
पण ह्या मनोवृत्तीचे अस्तित्व कसे व्यापक आहे ह्याची काही उदाहरणे पाहू-
१. दोन शेजारील राष्ट्रे आपल्याकडील शस्त्रसंख्या, वैविध्य, आधुनिकता ह्यांचा विचार करत असतांना, दोघेही एकत्र येऊन शस्त्रांवर होणारा खर्च कमी करु शकतात. पण तसे होत नाही. दोघेही राष्ट्रे आपल्या इतर आवश्यक गुंतवणूकीवर टाच आणून शस्त्रांवर जास्तीत जास्त गुंतवणूक करतात.
२. खेळामधे स्टेरॉइडचा वापर एकाने न करणे व दुसऱ्याने करणे....
३. वातावरणाला घातक अशा वायूंचा उत्सर्ग रोखण्यासाठी काही कठोर बंधंनं स्वतः वर लादून घेणे. पण दुसऱ्या राष्ट्रांनी जर तसे केले नाही तर पहिला त्यात नुकसान करुन घेईल व दुसऱ्या देशातील लोक मजा करतील....
तर, असा आहे प्रिझनर्स डिलेमा!
[माझ्या आधीच्या माहितीत विकिवरुन भार घातली]
|
|
कैदी ब गप्प बसला |
कैदी ब ने, अ बद्दल पुरावे दिले |
|
कैदी अ गप्प बसला |
दोघांना ६ महिन्याची साधी कैद |
कैदी ब ची सुटका, अ ला १० वर्षे कारावास |
|
कैदी अ ने, ब बद्दल पुरावे दिले |
कैदी अ ची सुटका, ब ला १० वर्षे कारावास |
दोघांना ५ वर्षांचा कारावास |
वाचने
7346
वाचनखूण
प्रतिक्रिया
22
श्री भागवत, प्रिझनर्स डिलेमाची चांगली ओळख. दोघांनी एकमेकांविरुद्ध पुरावे देणे याला 'नॅश इक्विलिब्रियम' असे म्हणतात. 'नॅश इक्विलिब्रियम' ही गेम थियरीमधील मुलभूत 'सोल्युशन कॉन्सेप्ट' आहे जी वापरून विविध उदाहरणे सोडवता येतात. 'प्रिझनर्स डिलेमा' या गेममध्ये दोघांना एकाचवेळी (सायमल्टेनीयसली) खेळायचे असल्याने दुसर्याची कृती पाहता येत नाही.
आपण दिलेल्या उदाहरणांतील पहिल्या उदाहरणात राष्ट्रांमधील स्पर्धा तसा 'सायमल्टेनियस फॉर्म' गेम नसून 'सिक्वेन्शियल' (दोन्ही स्पर्धक एकामागून एक खेळतात. उदा. भारताची अणुचाचणी पाहील्यानंतर पाकिस्तानने तसे करणे.) आहे. त्यामुळे पहिल्या उदाहरणात जरी गेम थियरीची तत्त्वे वापरणे शक्य असले तरी ते प्रिझनर्स डिलेमाचे उदाहरण नाही. उरलेल्या दोन उदाहरणातील परिस्थिती थोडीशी किचकट आहे. उदा. दूसर्या उदाहरणात स्टेरॉइड चाचण्या रँडमली होतात की नियमित केल्या जातात वगैरे. जमल्यास आणखी सविस्तर प्रतिसाद लिहीन.
In reply to चांगली ओळख by अक्षय पुर्णपात्रे
>>>जमल्यास आणखी सविस्तर प्रतिसाद लिहीन.
नक्की! भाग-२ काढा ज्यात 'नॅश इक्विलिब्रियम' बद्दलही आणखी माहिती येऊ द्यात. म्हणजे एक लेखमाला तय्यार होईल.
In reply to >>>जमल्यास by अजय भागवत
वरील उदाहरणात एका कैद्याचा निर्णय दुसर्या कैद्याच्या शिक्षेवर परिणाम करतो. एकमेकांच्या वर्तनाचे निरीक्षण दोघांनाही करता येत नाही. तेव्हा हा गुंता कसा सोडवता येईल? श्री भागवत यांनी दाखवलेल्या तक्त्यात सर्व शक्यता तसेच दोन्ही कैद्यांवरील त्याचे परिणाम (त्यांना मिळणारे payoffs) मांडता येतात.
१. दोघांनी एकमेकांविरुद्ध पुरावे देणे.
२. दोघांनी गप्प बसणे.
३. 'अ'ने 'ब' विरुद्ध बोलणे व 'ब'ने गप्प बसणे.
४. 'ब'ने 'अ' विरुद्ध बोलणे व 'अ'ने गप्प बसणे.
(दोन्ही कैदी बुद्धिप्रामाण्यवादी (rational या अर्थाने) निर्णय घेतात, हे गृहीतक अपेक्षित आहे.)
'अ' आणि 'ब' एकमेकांचे निर्णय पाहू शकत नसतांना कसा निर्णय घ्यावा. हा खेळ समतल(?) (symmetric) असल्याने फक्त 'अ'बाबत विचार करू. ('ब')ही तसेच खेळेल कारण समतलता(?).
१. समजा 'ब'गप्प बसला तर 'अ'ने पुरावे दिल्यास कमी शिक्षा (सुटका विरुद्ध ६ महिने) होईल.
२. समजा 'ब'ने पुरावे दिले तर 'अ'नेही पुरावे दिल्यास त्यास कमी शिक्षा (१० वर्षे विरुद्ध ५ वर्षे) होईल.
म्हणजेच 'ब'ने कुबलाही निर्णय घेतला तरी 'पुरावे देणे' हा निर्णय घेतल्यास 'अ'ला कमी शिक्षा होईल. 'ब'च्या निर्णयाबाबत सारखाच तर्क लावल्यास दोघे पुरावे देतील.
नॅश इक्विलिब्रियमची ढोबळ व्याख्या करायची झाल्यास अशी करता येईल: अशी स्थिती ज्यात कुठल्याही खेळाडूला आपल्या कृतीला सोडून दुसरी कृती करावीशी वाटण्यात काहीच फायदा दिसत नाही.(No player has an incentive to deviate from their respective strategies.) ही संकल्पना जॉन नॅश यांनी शोधून काढली ज्यामुळे त्यांना अर्थशास्त्रातील नोबेल पारितोषिकही मिळाले.
वरील खेळात दोघांना एकाच वेळी खेळायचे आहे (एकमेकांना पाहू शकत नाही या अर्थाने). प्रत्यक्ष जीवनातील निर्णय गुंतागुंतीचे असतात. दोनपेक्षा अधिक खेळाडू असतात तसेच इतर खेळाडूंच्या शक्यतांचा विचार करावा लागतो. काही खेळात प्रतिस्पर्धी एकमेकांची कृती पाहू शकतात किंवा काही कृती पाहू शकतात तर काही नाही. वर धनंजयने म्हटल्याप्रमाणे काही खेळ पुन्हा पुन्हा (finitely repeated आणि infinitely repeated) खेळले जातात. (या खेळांमध्ये प्रतिस्पर्ध्याविषयी काही एक मत (past belief) असते.) 'नॅश इक्विलिब्रियम' ही संकल्पना वापरून हे खेळ सोडवता येतात.
In reply to नॅश इक्विलिब्रियमविषयी by अक्षय पुर्णपात्रे
अक्षय, खुलासेवार प्रतिसादामुळे मुद्दा आणखी स्पष्ट झाला.
ह्या लेखात व प्रतिसादांमधे "खेळा"चा संदर्भ अनेकदा आला म्हणून मला ह्या थेअरीचा संबंध खऱ्या जीवनाशी कसा येऊ शकतो हे लिहावेसे वाटले.
सेल्स मॅनेजर विजयचा जानी दोस्त राघव अचानक त्याला भेटला. कॉलेजनंतर दोघे पहिल्यांदाच भेटत होते. गप्पा-टप्पा झाल्यानंतर चर्चा कामाकडे वळली. राघव एका मोठ्या मल्टीनॅशनल कंपनीत मोठ्या हुद्द्यावर आहे व त्याला काही कामे करुन घ्यायची आहेत. संयोगाने विजयची कंपनी ती सर्व्हीस देऊ शकते.
पण, विजयची जी सेल्स टेरीटरी आहे, त्यात नेमकी राघवची कंपनी येत नाही. त्यामुळे राघव कडून त्याला अधिकृतपणे व्यवसाय मिळवता येत नाही, क्वार्टरचे टारगेटही पूर्ण होण्यास मदत होणार नसते आणि त्या अनुषंगाने त्याचे कमिशनही मिळणार नसते. राघवची कंपनी ज्याच्या टेरीटरीमधे येते तो मुरुगन विजयचा सहकारी.
ह्याठिकाणी विजयला असे वाटू लागते की, राघवचा व्यवसाय मुरुगनलाही मिळाला नाही तर त्याचे टार्गेटही पुर्ण होणार नाही व आपल्याला कमीपणा येणार नाही. व विजय हा लिड मुरुगनपासून लपवून ठेवतो.
हे प्रकार होऊ नये म्हणून, एकमेकांचे लिड एकमेकांना देणे व त्यातून अधिकृतपणे कमिशन व सेल्स पॉइंटस कसे वाटता येतील हा सुज्ञ विचार करणे आवश्यक असते. असे केल्याने सेल्स डिपार्टमेंट ही टीम म्हणून व व्यापकतेने आख्खी कंपनीच यशस्वी होउ शकते.
आणि म्हणूनच असे घडत असते व ते टाळता येऊ शकते ही जाणीव नव्या व्यवस्थापकांना होणे गरजेचे असते म्हणून काही खेळ (गेम्स) तयात केले आहेत.
In reply to अक्षय, by अजय भागवत
श्री भागवत, आपण दिलेले उदाहरण योग्य आहे. व्यवस्थापकांना अशा प्रकारे 'न्याय्य वितरण' (fiar allocative distribution) करता येणे आवश्यक आहे. त्यासाठी गेम थियरीचा वापर करून 'सहकार्यपूर्ण खेळ' (Co-operative games) ही एक नवीन उपशाखाच विकसित झाली आहे.
In reply to चांगली ओळख by अक्षय पुर्णपात्रे
उत्तम ओळख आहे. +१
क्रमिक निर्णयाच्या मुद्द्याबाबतही सहमत आहे. +१
शिवाय,सामान्य जीवनातील अनेक निर्णय एकमेकांच्या आठवणीत राहातात. उदाहरणार्थ मुक्तता/शिक्षा असे आयुष्यात एकदाच खेळायचे पर्याय नसून, पुन्हा-पुन्हा खेळायचे पर्याय आहेत, असे समजा. तरी खेळाच्या निर्णयांत फरक पडतो.
सुंदर ओळख..
एकदम नवीन विषय.
पुढच्या लेखाची आतुरतेने वाट बघतोय..
--टुकुल
छान लिहिलय...
पुढचा भाग लवकर टाका..
--प्रभो
-----------------------------------------------------------------------
काय सांगावे स्वतः विषयी,आहात तुम्ही सूज्ञ !! एका सारखे एकच आम्ही,बाकी सगळे शून्य !!
एका वेगळ्या विषया बद्धल वाचायला मिळाले.
मदनबाण.....
"Life is the flower for which love is the honey."
Victor Hugo
मस्त.
हे काहीस फोडा आणि राज्य करा सारख झालं ना?
या वरुन एक जुन्या ढकल पत्रातल माकडांचा डिलेमा आठवला,
जर मिळाला तर टाकेन इथे.
In reply to मस्त. हे by गणपा
नाही; ह्यातून जो संदेश नेत्यांना द्यायचा असतो तो असा की, तुम्ही अशी नुकसानीची परिस्थिती निर्माण होऊ न देता जितके जास्त जिंकता येईल ते जिंका; त्याबद्दल "नॉन-झिरो सम" असा एक कॉन्सेप्ट आहे.
न केलेल्या सौम्य गुन्ह्याबद्दल शिक्षा भोगली की केलेल्या गंभीर गुन्ह्यातुन सुटका मिळते. वकील लोक अशा इष्टापत्ती अशिलावर ओढववुन मूळ (गंभीर गुन्हा)मुद्दा दुर्लक्षित करवतात.
प्रकाश घाटपांडे
आमच्या अनुदिनीत जरुर डोकवा.
In reply to इष्टापत्ती by प्रकाश घाटपांडे
>>>इष्टापत्ती अशिलावर ओढववुन मूळ (गंभीर गुन्हा)मुद्दा दुर्लक्षित करवतात.
:-) त्यानंतर मिळणारी साधी कैद, कैद्यांना त्यांचे हक्क मिळावेत म्ह्णूणून मानवी हक्क वाल्यांचे कार्य ह्याबद्दल बरेच लिहिता येईल नाही?
लेख छान.
हे म्हणजे कोकणातल्या 'माझी म्हस मेल्याच दु:ख नाही पण अजून शेजार्याची म्हस दूध कशी देते?' या प्रकारची मनोवृत्ती वाटते.
पुण्याचे पेशवे
आम्ही हल्ली सहीत वाक्यं लिहिणं बंद केले आहे.
Since 1984
In reply to लेख छान. हे by llपुण्याचे पेशवेll
प्रिझनर्स डिलेमा ह्या मनोवृतीचा अभ्यास फ्लड आणि ड्रेशील ह्या व्दयीने १९५० साली अमेरीकेत केला. म्हणजेच अशी मनोवृती ही तेथे तर आढळत होती. तुम्ही दाखला दिलेले उदाहरण अगदी ह्याच पठडीतले आहे. ते कोकणातील त्याचे रुप आहे पण ही जगभर आढळणारी मानवी मूल्भूत मनोवृती आहे. त्यास स्थ़ळ-काळ ह्याचे बंधन नाही असेच दिसतेय.
मानसशास्त्राच्या प्रयोगात पाऊलोव चा कुत्र्यावरचा प्रयोग सर्वाना ठाऊक आहे.
असाच एक दुसरा प्रयोग केला गेला. एका पिंजर्यात एक माकड ठेवले गेले. त्यात दोन स्वीचेस सुद्धा ठेवले होते. अ स्वीच दाबला तर चॉकलेट मिळायचे ब स्वीच दाबला तर शॉक बसायचा. हळू हळू माकाड फक्त अ स्वीच दाबायला शिकले. कालांतराने स्वीचेस चे वर्तन बदलले. अ ऐवजी ब स्वीच मुळे चॉकलेट आणि अ स्वीच मुळे शॉक असे केले. माकडाने तेही अंगीकारले.
कालांतराने दोन्ही स्वीचेस चे वर्तन रँडम केले गेले.
माकडाला कळेना कोनता स्वीच दाबल्यानन्तर शॉक बसेल?
माकडाने हा बदल एका वेगळ्याच पद्धतीने अंगीकारला.
ते एकाच वेळेस दोन्ही स्वीचेस दाबू लागले.
In reply to मानसशास्त्र by विजुभाऊ
In reply to पावलाव ह्यांना त्याबद्दल नोबेलही by अजय भागवत
पाव्लोव यांना नोबेल पचनक्रिये/यंत्रणे वरील संशोधना करता दिले होते ना?
डोक्या आणी आवाक्या बाहेरचा विषय ..पण प्रतिसादातुन आलेले विवेचन आवडले...
सू हा स...
:S
अवघड आहे! दुसरं काय?
एकानं असं वागायचं, दुसर्यानं तसं...त्यात एकाचं नुकसान दुसर्याचा निदान प्रथमदर्शनी तरी फायदा....एकुण सगळाच विस्कोट!
च्छ्या:! खरंच अवघड आहे हे मानशास्त्रीय घोळ!
इंटरेस्टिंग माहिती. अक्षय आणि विजुभाऊ यांचे प्रतिसादही वाचनिय.
चांगली ओळख