मराठी साहित्य, संस्कृती आणि लेखनाचे व्यासपीठ

प्रिझनर्स डिलेमा

अजय भागवत · · जनातलं, मनातलं
मनुष्यबळ विकास व्यवस्थापनाचा (एचआरएम) अभ्यास केलेले आणि "नेतेगिरी" (मराठी- लिडरशिप) चा अभ्यास केलेल्यांना कदाचित माणसाच्या ह्या मानसिक द्वंद्वाची, कलाची माहिती असेल. मला जेव्हा ह्या थेअरीची तोंडओळख झाली तेव्हा मी हरखून गेलो होतो व पटले की, ही एक बहूव्यापी थेअरी आहे. - असे मी का म्हणतो आहे, ते नंतर सांगितलेले आहेच. प्रथम ह्या थेअरीची पार्श्वभूमी (उगम) पाहू व तीचा नेतेगिरीत कसा वापर होतो ते पाहू. "प्रिझनर्स डिलेमा" ला आपण ह्या गोष्टीपुरते "कैद्यांचा पेच" असे म्हणू. गृहीत धरा की, एका मोठ्या गुन्ह्यात दोन (अ आणि ब) संशयितांना पकडले आहे. पोलिस त्यांना वेगवेगळ्या कैद-खोलीत डांबून ठेवतात. नंतर पोलिस त्यांना वेगवेगळे भेटून त्यांच्यासमोर एकच आणि तोच प्रस्ताव ठेवतात. प्रस्ताव असा असतो-

 

कैदी ब गप्प बसला

कैदी ब ने, अ बद्दल पुरावे दिले

कैदी अ गप्प बसला

दोघांना ६ महिन्याची साधी कैद

कैदी ब ची सुटका,

अ ला १० वर्षे कारावास

कैदी अ ने, ब बद्दल पुरावे दिले

कैदी अ ची सुटका,

 ब ला १० वर्षे कारावास

दोघांना ५ वर्षांचा कारावास

चौकटीत दाखवल्याप्रमाणे पोलिस त्या दोघांनाही तो प्रस्ताव समजावुन सांगतात. दोघांनाही त्यातील फायदे व तोटे स्पष्ट दिसतात. दोघेही गप्प बसले तर दोघांचाही त्यात फायदा असतो. पण एक जण गप्प बसला आणि दुसऱ्याने त्याच्याबद्दल पुरावे दिले तर साहजिकच गप्प बसणाऱ्याची मुक संमती आहे असे मानून त्याला गुन्ह्याची सजा मिळणार हे दोघांनाही समजते. आणि हाच त्यांचा पेच असतो. पहिल्या मार्गाचा अवलंब केल्यास (दोघांनीही गप्प बसणे), दुसऱ्याची काहीच शाश्वती नसल्यामुळे सरळसरळ आत्महत्या केल्यासारखेच होईल ह्या भीतीने गप्प आपण बसण्याचा मार्ग स्वीकारणे दोघांनाही योग्य वाटत नाही. त्यांना ही जाणीव असते की, त्यामुळे दोघेही कमीत-कमी शिक्षेच्या प्रस्तावाला मुकणार असतात. तो मार्ग दुसरा मार्ग स्वीकरल्यास (दोघेही एकमेकांबद्दल काही-बाही पुरावे देतील), दोघांनाही १० वर्षांऐवजी ५ वर्षे कैद होईल. आणि हाच मार्ग ते निवडतात. दुसऱ्याला आपल्या गप्प बसण्यामुळे पूर्ण फायदा होईल अ तो सुटेल आणि आपण मात्र १० वर्षे कैदेत खितपत पडून राहू हे शहाणपणाचे त्यांना वाटत नाही. दोघेही गप्प बसतील असा विश्वास त्यांना एकमेकाबद्दल वाटणे शक्य नाही, मग अशा परिस्थितीत ते दोघेही तोंड उघडतात व चक्क दुसऱ्याचा फायदा होऊ नये म्हणून आपले नुकसान स्वीकारतात. "दुसऱ्याचा फायदा होऊ नये म्हणून आपले नुकसान स्वीकारणे" हाच तो कळीचा मुद्दा, ज्याला कैदयांचा पेच असे म्हणले जाते. मनोभ्यासक ह्या मनोवृत्तीचा बारकाईने अभ्यास करतात व त्याचा संबंध आपल्या रोजच्या आयुष्यात कसा लागू पडतात ते पाहतात. सांघिक काम- टिमवर्क- हे जितके सोपे वाटते तितकेच अवघड असलेले एक कौशल्य. एकाच छपराखाली एकाच संघटनेत, कंपनीत, कार्यालयात काम करणाऱ्या संघांमधे अशी रस्सीखेच होणे हे नैसर्गिक आहे; पण ते हिताचे नाही. मानवाच्या ह्या अशा मनोवृत्तीची जाण असणे हे प्रत्येक नेत्याचे कर्तव्य आहे. त्यातून मार्ग कसा काढायचा हा लेखाचा एक स्वतंत्र विषय आहे. नेत्यांना ह्याची ओळख एका खेळाव्दारे करुन दिली जाते- "विन ऍज मच ऍज यु कॅन". पण ह्या मनोवृत्तीचे अस्तित्व कसे व्यापक आहे ह्याची काही उदाहरणे पाहू- १. दोन शेजारील राष्ट्रे आपल्याकडील शस्त्रसंख्या, वैविध्य, आधुनिकता ह्यांचा विचार करत असतांना, दोघेही एकत्र येऊन शस्त्रांवर होणारा खर्च कमी करु शकतात. पण तसे होत नाही. दोघेही राष्ट्रे आपल्या इतर आवश्यक गुंतवणूकीवर टाच आणून शस्त्रांवर जास्तीत जास्त गुंतवणूक करतात. २. खेळामधे स्टेरॉइडचा वापर एकाने न करणे व दुसऱ्याने करणे.... ३. वातावरणाला घातक अशा वायूंचा उत्सर्ग रोखण्यासाठी काही कठोर बंधंनं स्वतः वर लादून घेणे. पण दुसऱ्या राष्ट्रांनी जर तसे केले नाही तर पहिला त्यात नुकसान करुन घेईल व दुसऱ्या देशातील लोक मजा करतील.... तर, असा आहे प्रिझनर्स डिलेमा! [माझ्या आधीच्या माहितीत विकिवरुन भार घातली]

वाचने 7345 वाचनखूण प्रतिक्रिया 22

श्री भागवत, प्रिझनर्स डिलेमाची चांगली ओळख. दोघांनी एकमेकांविरुद्ध पुरावे देणे याला 'नॅश इक्विलिब्रियम' असे म्हणतात. 'नॅश इक्विलिब्रियम' ही गेम थियरीमधील मुलभूत 'सोल्युशन कॉन्सेप्ट' आहे जी वापरून विविध उदाहरणे सोडवता येतात. 'प्रिझनर्स डिलेमा' या गेममध्ये दोघांना एकाचवेळी (सायमल्टेनीयसली) खेळायचे असल्याने दुसर्‍याची कृती पाहता येत नाही. आपण दिलेल्या उदाहरणांतील पहिल्या उदाहरणात राष्ट्रांमधील स्पर्धा तसा 'सायमल्टेनियस फॉर्म' गेम नसून 'सिक्वेन्शियल' (दोन्ही स्पर्धक एकामागून एक खेळतात. उदा. भारताची अणुचाचणी पाहील्यानंतर पाकिस्तानने तसे करणे.) आहे. त्यामुळे पहिल्या उदाहरणात जरी गेम थियरीची तत्त्वे वापरणे शक्य असले तरी ते प्रिझनर्स डिलेमाचे उदाहरण नाही. उरलेल्या दोन उदाहरणातील परिस्थिती थोडीशी किचकट आहे. उदा. दूसर्‍या उदाहरणात स्टेरॉइड चाचण्या रँडमली होतात की नियमित केल्या जातात वगैरे. जमल्यास आणखी सविस्तर प्रतिसाद लिहीन.

In reply to by अक्षय पुर्णपात्रे

अजय भागवत Mon, 11/23/2009 - 10:23
>>>जमल्यास आणखी सविस्तर प्रतिसाद लिहीन. नक्की! भाग-२ काढा ज्यात 'नॅश इक्विलिब्रियम' बद्दलही आणखी माहिती येऊ द्यात. म्हणजे एक लेखमाला तय्यार होईल.

In reply to by अजय भागवत

वरील उदाहरणात एका कैद्याचा निर्णय दुसर्‍या कैद्याच्या शिक्षेवर परिणाम करतो. एकमेकांच्या वर्तनाचे निरीक्षण दोघांनाही करता येत नाही. तेव्हा हा गुंता कसा सोडवता येईल? श्री भागवत यांनी दाखवलेल्या तक्त्यात सर्व शक्यता तसेच दोन्ही कैद्यांवरील त्याचे परिणाम (त्यांना मिळणारे payoffs) मांडता येतात. १. दोघांनी एकमेकांविरुद्ध पुरावे देणे. २. दोघांनी गप्प बसणे. ३. 'अ'ने 'ब' विरुद्ध बोलणे व 'ब'ने गप्प बसणे. ४. 'ब'ने 'अ' विरुद्ध बोलणे व 'अ'ने गप्प बसणे. (दोन्ही कैदी बुद्धिप्रामाण्यवादी (rational या अर्थाने) निर्णय घेतात, हे गृहीतक अपेक्षित आहे.) 'अ' आणि 'ब' एकमेकांचे निर्णय पाहू शकत नसतांना कसा निर्णय घ्यावा. हा खेळ समतल(?) (symmetric) असल्याने फक्त 'अ'बाबत विचार करू. ('ब')ही तसेच खेळेल कारण समतलता(?). १. समजा 'ब'गप्प बसला तर 'अ'ने पुरावे दिल्यास कमी शिक्षा (सुटका विरुद्ध ६ महिने) होईल. २. समजा 'ब'ने पुरावे दिले तर 'अ'नेही पुरावे दिल्यास त्यास कमी शिक्षा (१० वर्षे विरुद्ध ५ वर्षे) होईल. म्हणजेच 'ब'ने कुबलाही निर्णय घेतला तरी 'पुरावे देणे' हा निर्णय घेतल्यास 'अ'ला कमी शिक्षा होईल. 'ब'च्या निर्णयाबाबत सारखाच तर्क लावल्यास दोघे पुरावे देतील. नॅश इक्विलिब्रियमची ढोबळ व्याख्या करायची झाल्यास अशी करता येईल: अशी स्थिती ज्यात कुठल्याही खेळाडूला आपल्या कृतीला सोडून दुसरी कृती करावीशी वाटण्यात काहीच फायदा दिसत नाही.(No player has an incentive to deviate from their respective strategies.) ही संकल्पना जॉन नॅश यांनी शोधून काढली ज्यामुळे त्यांना अर्थशास्त्रातील नोबेल पारितोषिकही मिळाले. वरील खेळात दोघांना एकाच वेळी खेळायचे आहे (एकमेकांना पाहू शकत नाही या अर्थाने). प्रत्यक्ष जीवनातील निर्णय गुंतागुंतीचे असतात. दोनपेक्षा अधिक खेळाडू असतात तसेच इतर खेळाडूंच्या शक्यतांचा विचार करावा लागतो. काही खेळात प्रतिस्पर्धी एकमेकांची कृती पाहू शकतात किंवा काही कृती पाहू शकतात तर काही नाही. वर धनंजयने म्हटल्याप्रमाणे काही खेळ पुन्हा पुन्हा (finitely repeated आणि infinitely repeated) खेळले जातात. (या खेळांमध्ये प्रतिस्पर्ध्याविषयी काही एक मत (past belief) असते.) 'नॅश इक्विलिब्रियम' ही संकल्पना वापरून हे खेळ सोडवता येतात.

In reply to by अक्षय पुर्णपात्रे

अजय भागवत Mon, 11/23/2009 - 22:46
अक्षय, खुलासेवार प्रतिसादामुळे मुद्दा आणखी स्पष्ट झाला. ह्या लेखात व प्रतिसादांमधे "खेळा"चा संदर्भ अनेकदा आला म्हणून मला ह्या थेअरीचा संबंध खऱ्या जीवनाशी कसा येऊ शकतो हे लिहावेसे वाटले. सेल्स मॅनेजर विजयचा जानी दोस्त राघव अचानक त्याला भेटला. कॉलेजनंतर दोघे पहिल्यांदाच भेटत होते. गप्पा-टप्पा झाल्यानंतर चर्चा कामाकडे वळली. राघव एका मोठ्या मल्टीनॅशनल कंपनीत मोठ्या हुद्द्यावर आहे व त्याला काही कामे करुन घ्यायची आहेत. संयोगाने विजयची कंपनी ती सर्व्हीस देऊ शकते. पण, विजयची जी सेल्स टेरीटरी आहे, त्यात नेमकी राघवची कंपनी येत नाही. त्यामुळे राघव कडून त्याला अधिकृतपणे व्यवसाय मिळवता येत नाही, क्वार्टरचे टारगेटही पूर्ण होण्यास मदत होणार नसते आणि त्या अनुषंगाने त्याचे कमिशनही मिळणार नसते. राघवची कंपनी ज्याच्या टेरीटरीमधे येते तो मुरुगन विजयचा सहकारी. ह्याठिकाणी विजयला असे वाटू लागते की, राघवचा व्यवसाय मुरुगनलाही मिळाला नाही तर त्याचे टार्गेटही पुर्ण होणार नाही व आपल्याला कमीपणा येणार नाही. व विजय हा लिड मुरुगनपासून लपवून ठेवतो. हे प्रकार होऊ नये म्हणून, एकमेकांचे लिड एकमेकांना देणे व त्यातून अधिकृतपणे कमिशन व सेल्स पॉइंटस कसे वाटता येतील हा सुज्ञ विचार करणे आवश्यक असते. असे केल्याने सेल्स डिपार्टमेंट ही टीम म्हणून व व्यापकतेने आख्खी कंपनीच यशस्वी हो‍उ शकते. आणि म्हणूनच असे घडत असते व ते टाळता येऊ शकते ही जाणीव नव्या व्यवस्थापकांना होणे गरजेचे असते म्हणून काही खेळ (गेम्स) तयात केले आहेत.

In reply to by अजय भागवत

श्री भागवत, आपण दिलेले उदाहरण योग्य आहे. व्यवस्थापकांना अशा प्रकारे 'न्याय्य वितरण' (fiar allocative distribution) करता येणे आवश्यक आहे. त्यासाठी गेम थियरीचा वापर करून 'सहकार्यपूर्ण खेळ' (Co-operative games) ही एक नवीन उपशाखाच विकसित झाली आहे.

In reply to by अक्षय पुर्णपात्रे

अजय भागवत Tue, 11/24/2009 - 06:34
>> 'सहकार्यपूर्ण खेळ' अक्षय, धन्यवाद!!! आणखी एका ज्ञान शाखेची ओळख करुन दिलीत!! उपयोग होईल मला ह्या माहितीचा.

In reply to by अक्षय पुर्णपात्रे

धनंजय Mon, 11/23/2009 - 10:28
उत्तम ओळख आहे. +१ क्रमिक निर्णयाच्या मुद्द्याबाबतही सहमत आहे. +१ शिवाय,सामान्य जीवनातील अनेक निर्णय एकमेकांच्या आठवणीत राहातात. उदाहरणार्थ मुक्तता/शिक्षा असे आयुष्यात एकदाच खेळायचे पर्याय नसून, पुन्हा-पुन्हा खेळायचे पर्याय आहेत, असे समजा. तरी खेळाच्या निर्णयांत फरक पडतो.

टुकुल Mon, 11/23/2009 - 11:10
सुंदर ओळख.. एकदम नवीन विषय. पुढच्या लेखाची आतुरतेने वाट बघतोय.. --टुकुल

प्रभो Mon, 11/23/2009 - 11:18
छान लिहिलय... पुढचा भाग लवकर टाका.. --प्रभो ----------------------------------------------------------------------- काय सांगावे स्वतः विषयी,आहात तुम्ही सूज्ञ !! एका सारखे एकच आम्ही,बाकी सगळे शून्य !!

मदनबाण Mon, 11/23/2009 - 12:37
एका वेगळ्या विषया बद्धल वाचायला मिळाले. मदनबाण..... "Life is the flower for which love is the honey." Victor Hugo

गणपा Mon, 11/23/2009 - 13:08
मस्त. हे काहीस फोडा आणि राज्य करा सारख झालं ना? या वरुन एक जुन्या ढकल पत्रातल माकडांचा डिलेमा आठवला, जर मिळाला तर टाकेन इथे.

In reply to by गणपा

अजय भागवत Mon, 11/23/2009 - 13:37
नाही; ह्यातून जो संदेश नेत्यांना द्यायचा असतो तो असा की, तुम्ही अशी नुकसानीची परिस्थिती निर्माण होऊ न देता जितके जास्त जिंकता येईल ते जिंका; त्याबद्दल "नॉन-झिरो सम" असा एक कॉन्सेप्ट आहे.

न केलेल्या सौम्य गुन्ह्याबद्दल शिक्षा भोगली की केलेल्या गंभीर गुन्ह्यातुन सुटका मिळते. वकील लोक अशा इष्टापत्ती अशिलावर ओढववुन मूळ (गंभीर गुन्हा)मुद्दा दुर्लक्षित करवतात. प्रकाश घाटपांडे आमच्या अनुदिनीत जरुर डोकवा.

In reply to by प्रकाश घाटपांडे

अजय भागवत Mon, 11/23/2009 - 13:30
>>>इष्टापत्ती अशिलावर ओढववुन मूळ (गंभीर गुन्हा)मुद्दा दुर्लक्षित करवतात. :-) त्यानंतर मिळणारी साधी कैद, कैद्यांना त्यांचे हक्क मिळावेत म्ह्णूणून मानवी हक्क वाल्यांचे कार्य ह्याबद्दल बरेच लिहिता येईल नाही?

लेख छान. हे म्हणजे कोकणातल्या 'माझी म्हस मेल्याच दु:ख नाही पण अजून शेजार्‍याची म्हस दूध कशी देते?' या प्रकारची मनोवृत्ती वाटते. पुण्याचे पेशवे आम्ही हल्ली सहीत वाक्यं लिहिणं बंद केले आहे. Since 1984

In reply to by llपुण्याचे पेशवेll

अजय भागवत Mon, 11/23/2009 - 17:52
प्रिझनर्स डिलेमा ह्या मनोवृतीचा अभ्यास फ्लड आणि ड्रेशील ह्या व्दयीने १९५० साली अमेरीकेत केला. म्हणजेच अशी मनोवृती ही तेथे तर आढळत होती. तुम्ही दाखला दिलेले उदाहरण अगदी ह्याच पठडीतले आहे. ते कोकणातील त्याचे रुप आहे पण ही जगभर आढळणारी मानवी मूल्भूत मनोवृती आहे. त्यास स्थ़ळ-काळ ह्याचे बंधन नाही असेच दिसतेय.

विजुभाऊ Mon, 11/23/2009 - 15:00
मानसशास्त्राच्या प्रयोगात पाऊलोव चा कुत्र्यावरचा प्रयोग सर्वाना ठाऊक आहे. असाच एक दुसरा प्रयोग केला गेला. एका पिंजर्‍यात एक माकड ठेवले गेले. त्यात दोन स्वीचेस सुद्धा ठेवले होते. अ स्वीच दाबला तर चॉकलेट मिळायचे ब स्वीच दाबला तर शॉक बसायचा. हळू हळू माकाड फक्त अ स्वीच दाबायला शिकले. कालांतराने स्वीचेस चे वर्तन बदलले. अ ऐवजी ब स्वीच मुळे चॉकलेट आणि अ स्वीच मुळे शॉक असे केले. माकडाने तेही अंगीकारले. कालांतराने दोन्ही स्वीचेस चे वर्तन रँडम केले गेले. माकडाला कळेना कोनता स्वीच दाबल्यानन्तर शॉक बसेल? माकडाने हा बदल एका वेगळ्याच पद्धतीने अंगीकारला. ते एकाच वेळेस दोन्ही स्वीचेस दाबू लागले.

In reply to by विजुभाऊ

अजय भागवत Mon, 11/23/2009 - 18:00
हो, पावलाव ह्यांना त्याबद्दल नोबेलही देण्यात आले होते. येथे त्यां च्या प्रयोगाबद्दल अधिक माहिती आहे. व त्यावर एक छोटा खेळही तयार केला आहे तो ही खेळून पाहता येईल- येथे

सूहास Mon, 11/23/2009 - 17:56
डोक्या आणी आवाक्या बाहेरचा विषय ..पण प्रतिसादातुन आलेले विवेचन आवडले... सू हा स...

धमाल मुलगा Mon, 11/23/2009 - 18:00
:S अवघड आहे! दुसरं काय? एकानं असं वागायचं, दुसर्‍यानं तसं...त्यात एकाचं नुकसान दुसर्‍याचा निदान प्रथमदर्शनी तरी फायदा....एकुण सगळाच विस्कोट! च्छ्या:! खरंच अवघड आहे हे मानशास्त्रीय घोळ!