प्रिझनर्स डिलेमा

मनुष्यबळ विकास व्यवस्थापनाचा (एचआरएम) अभ्यास केलेले आणि "नेतेगिरी" (मराठी- लिडरशिप) चा अभ्यास केलेल्यांना कदाचित माणसाच्या ह्या मानसिक द्वंद्वाची, कलाची माहिती असेल. मला जेव्हा ह्या थेअरीची तोंडओळख झाली तेव्हा मी हरखून गेलो होतो व पटले की, ही एक बहूव्यापी थेअरी आहे. - असे मी का म्हणतो आहे, ते नंतर सांगितलेले आहेच. प्रथम ह्या थेअरीची पार्श्वभूमी (उगम) पाहू व तीचा नेतेगिरीत कसा वापर होतो ते पाहू. "प्रिझनर्स डिलेमा" ला आपण ह्या गोष्टीपुरते "कैद्यांचा पेच" असे म्हणू. गृहीत धरा की, एका मोठ्या गुन्ह्यात दोन (अ आणि ब) संशयितांना पकडले आहे. पोलिस त्यांना वेगवेगळ्या कैद-खोलीत डांबून ठेवतात. नंतर पोलिस त्यांना वेगवेगळे भेटून त्यांच्यासमोर एकच आणि तोच प्रस्ताव ठेवतात. प्रस्ताव असा असतो-

कैदी ब गप्प बसला

कैदी ब ने, अ बद्दल पुरावे दिले

कैदी अ गप्प बसला

दोघांना ६ महिन्याची साधी कैद

कैदी ब ची सुटका,

अ ला १० वर्षे कारावास

कैदी अ ने, ब बद्दल पुरावे दिले

कैदी अ ची सुटका,

ब ला १० वर्षे कारावास

दोघांना ५ वर्षांचा कारावास

चौकटीत दाखवल्याप्रमाणे पोलिस त्या दोघांनाही तो प्रस्ताव समजावुन सांगतात. दोघांनाही त्यातील फायदे व तोटे स्पष्ट दिसतात. दोघेही गप्प बसले तर दोघांचाही त्यात फायदा असतो. पण एक जण गप्प बसला आणि दुसऱ्याने त्याच्याबद्दल पुरावे दिले तर साहजिकच गप्प बसणाऱ्याची मुक संमती आहे असे मानून त्याला गुन्ह्याची सजा मिळणार हे दोघांनाही समजते. आणि हाच त्यांचा पेच असतो. पहिल्या मार्गाचा अवलंब केल्यास (दोघांनीही गप्प बसणे), दुसऱ्याची काहीच शाश्वती नसल्यामुळे सरळसरळ आत्महत्या केल्यासारखेच होईल ह्या भीतीने गप्प आपण बसण्याचा मार्ग स्वीकारणे दोघांनाही योग्य वाटत नाही. त्यांना ही जाणीव असते की, त्यामुळे दोघेही कमीत-कमी शिक्षेच्या प्रस्तावाला मुकणार असतात. तो मार्ग दुसरा मार्ग स्वीकरल्यास (दोघेही एकमेकांबद्दल काही-बाही पुरावे देतील), दोघांनाही १० वर्षांऐवजी ५ वर्षे कैद होईल. आणि हाच मार्ग ते निवडतात. दुसऱ्याला आपल्या गप्प बसण्यामुळे पूर्ण फायदा होईल अ तो सुटेल आणि आपण मात्र १० वर्षे कैदेत खितपत पडून राहू हे शहाणपणाचे त्यांना वाटत नाही. दोघेही गप्प बसतील असा विश्वास त्यांना एकमेकाबद्दल वाटणे शक्य नाही, मग अशा परिस्थितीत ते दोघेही तोंड उघडतात व चक्क दुसऱ्याचा फायदा होऊ नये म्हणून आपले नुकसान स्वीकारतात. "दुसऱ्याचा फायदा होऊ नये म्हणून आपले नुकसान स्वीकारणे" हाच तो कळीचा मुद्दा, ज्याला कैदयांचा पेच असे म्हणले जाते. मनोभ्यासक ह्या मनोवृत्तीचा बारकाईने अभ्यास करतात व त्याचा संबंध आपल्या रोजच्या आयुष्यात कसा लागू पडतात ते पाहतात. सांघिक काम- टिमवर्क- हे जितके सोपे वाटते तितकेच अवघड असलेले एक कौशल्य. एकाच छपराखाली एकाच संघटनेत, कंपनीत, कार्यालयात काम करणाऱ्या संघांमधे अशी रस्सीखेच होणे हे नैसर्गिक आहे; पण ते हिताचे नाही. मानवाच्या ह्या अशा मनोवृत्तीची जाण असणे हे प्रत्येक नेत्याचे कर्तव्य आहे. त्यातून मार्ग कसा काढायचा हा लेखाचा एक स्वतंत्र विषय आहे. नेत्यांना ह्याची ओळख एका खेळाव्दारे करुन दिली जाते- "विन ऍज मच ऍज यु कॅन". पण ह्या मनोवृत्तीचे अस्तित्व कसे व्यापक आहे ह्याची काही उदाहरणे पाहू- १. दोन शेजारील राष्ट्रे आपल्याकडील शस्त्रसंख्या, वैविध्य, आधुनिकता ह्यांचा विचार करत असतांना, दोघेही एकत्र येऊन शस्त्रांवर होणारा खर्च कमी करु शकतात. पण तसे होत नाही. दोघेही राष्ट्रे आपल्या इतर आवश्यक गुंतवणूकीवर टाच आणून शस्त्रांवर जास्तीत जास्त गुंतवणूक करतात. २. खेळामधे स्टेरॉइडचा वापर एकाने न करणे व दुसऱ्याने करणे.... ३. वातावरणाला घातक अशा वायूंचा उत्सर्ग रोखण्यासाठी काही कठोर बंधंनं स्वतः वर लादून घेणे. पण दुसऱ्या राष्ट्रांनी जर तसे केले नाही तर पहिला त्यात नुकसान करुन घेईल व दुसऱ्या देशातील लोक मजा करतील.... तर, असा आहे प्रिझनर्स डिलेमा! [माझ्या आधीच्या माहितीत विकिवरुन भार घातली]

लेखनविषय:	संस्कृती समाज जीवनमान तंत्र राहणी
लेखनप्रकार	प्रकटन माध्यमवेध माहिती आस्वाद

वाचने 7367

प्रतिक्रिया 22

प्रतिक्रिया

चांगली ओळख

अक्षय पुर्णपात्रे सोमवार, 23/11/2009 10:09

श्री भागवत, प्रिझनर्स डिलेमाची चांगली ओळख. दोघांनी एकमेकांविरुद्ध पुरावे देणे याला 'नॅश इक्विलिब्रियम' असे म्हणतात. 'नॅश इक्विलिब्रियम' ही गेम थियरीमधील मुलभूत 'सोल्युशन कॉन्सेप्ट' आहे जी वापरून विविध उदाहरणे सोडवता येतात. 'प्रिझनर्स डिलेमा' या गेममध्ये दोघांना एकाचवेळी (सायमल्टेनीयसली) खेळायचे असल्याने दुसर्‍याची कृती पाहता येत नाही. आपण दिलेल्या उदाहरणांतील पहिल्या उदाहरणात राष्ट्रांमधील स्पर्धा तसा 'सायमल्टेनियस फॉर्म' गेम नसून 'सिक्वेन्शियल' (दोन्ही स्पर्धक एकामागून एक खेळतात. उदा. भारताची अणुचाचणी पाहील्यानंतर पाकिस्तानने तसे करणे.) आहे. त्यामुळे पहिल्या उदाहरणात जरी गेम थियरीची तत्त्वे वापरणे शक्य असले तरी ते प्रिझनर्स डिलेमाचे उदाहरण नाही. उरलेल्या दोन उदाहरणातील परिस्थिती थोडीशी किचकट आहे. उदा. दूसर्‍या उदाहरणात स्टेरॉइड चाचण्या रँडमली होतात की नियमित केल्या जातात वगैरे. जमल्यास आणखी सविस्तर प्रतिसाद लिहीन.

>>>जमल्यास

अजय भागवत सोमवार, 23/11/2009 10:23

>>>जमल्यास आणखी सविस्तर प्रतिसाद लिहीन. नक्की! भाग-२ काढा ज्यात 'नॅश इक्विलिब्रियम' बद्दलही आणखी माहिती येऊ द्यात. म्हणजे एक लेखमाला तय्यार होईल.

नॅश इक्विलिब्रियमविषयी

अक्षय पुर्णपात्रे सोमवार, 23/11/2009 22:03

वरील उदाहरणात एका कैद्याचा निर्णय दुसर्‍या कैद्याच्या शिक्षेवर परिणाम करतो. एकमेकांच्या वर्तनाचे निरीक्षण दोघांनाही करता येत नाही. तेव्हा हा गुंता कसा सोडवता येईल? श्री भागवत यांनी दाखवलेल्या तक्त्यात सर्व शक्यता तसेच दोन्ही कैद्यांवरील त्याचे परिणाम (त्यांना मिळणारे payoffs) मांडता येतात. १. दोघांनी एकमेकांविरुद्ध पुरावे देणे. २. दोघांनी गप्प बसणे. ३. 'अ'ने 'ब' विरुद्ध बोलणे व 'ब'ने गप्प बसणे. ४. 'ब'ने 'अ' विरुद्ध बोलणे व 'अ'ने गप्प बसणे. (दोन्ही कैदी बुद्धिप्रामाण्यवादी (rational या अर्थाने) निर्णय घेतात, हे गृहीतक अपेक्षित आहे.) 'अ' आणि 'ब' एकमेकांचे निर्णय पाहू शकत नसतांना कसा निर्णय घ्यावा. हा खेळ समतल(?) (symmetric) असल्याने फक्त 'अ'बाबत विचार करू. ('ब')ही तसेच खेळेल कारण समतलता(?). १. समजा 'ब'गप्प बसला तर 'अ'ने पुरावे दिल्यास कमी शिक्षा (सुटका विरुद्ध ६ महिने) होईल. २. समजा 'ब'ने पुरावे दिले तर 'अ'नेही पुरावे दिल्यास त्यास कमी शिक्षा (१० वर्षे विरुद्ध ५ वर्षे) होईल. म्हणजेच 'ब'ने कुबलाही निर्णय घेतला तरी 'पुरावे देणे' हा निर्णय घेतल्यास 'अ'ला कमी शिक्षा होईल. 'ब'च्या निर्णयाबाबत सारखाच तर्क लावल्यास दोघे पुरावे देतील. नॅश इक्विलिब्रियमची ढोबळ व्याख्या करायची झाल्यास अशी करता येईल: अशी स्थिती ज्यात कुठल्याही खेळाडूला आपल्या कृतीला सोडून दुसरी कृती करावीशी वाटण्यात काहीच फायदा दिसत नाही.(No player has an incentive to deviate from their respective strategies.) ही संकल्पना जॉन नॅश यांनी शोधून काढली ज्यामुळे त्यांना अर्थशास्त्रातील नोबेल पारितोषिकही मिळाले. वरील खेळात दोघांना एकाच वेळी खेळायचे आहे (एकमेकांना पाहू शकत नाही या अर्थाने). प्रत्यक्ष जीवनातील निर्णय गुंतागुंतीचे असतात. दोनपेक्षा अधिक खेळाडू असतात तसेच इतर खेळाडूंच्या शक्यतांचा विचार करावा लागतो. काही खेळात प्रतिस्पर्धी एकमेकांची कृती पाहू शकतात किंवा काही कृती पाहू शकतात तर काही नाही. वर धनंजयने म्हटल्याप्रमाणे काही खेळ पुन्हा पुन्हा (finitely repeated आणि infinitely repeated) खेळले जातात. (या खेळांमध्ये प्रतिस्पर्ध्याविषयी काही एक मत (past belief) असते.) 'नॅश इक्विलिब्रियम' ही संकल्पना वापरून हे खेळ सोडवता येतात.

अक्षय,

अजय भागवत सोमवार, 23/11/2009 22:46

अक्षय, खुलासेवार प्रतिसादामुळे मुद्दा आणखी स्पष्ट झाला. ह्या लेखात व प्रतिसादांमधे "खेळा"चा संदर्भ अनेकदा आला म्हणून मला ह्या थेअरीचा संबंध खऱ्या जीवनाशी कसा येऊ शकतो हे लिहावेसे वाटले. सेल्स मॅनेजर विजयचा जानी दोस्त राघव अचानक त्याला भेटला. कॉलेजनंतर दोघे पहिल्यांदाच भेटत होते. गप्पा-टप्पा झाल्यानंतर चर्चा कामाकडे वळली. राघव एका मोठ्या मल्टीनॅशनल कंपनीत मोठ्या हुद्द्यावर आहे व त्याला काही कामे करुन घ्यायची आहेत. संयोगाने विजयची कंपनी ती सर्व्हीस देऊ शकते. पण, विजयची जी सेल्स टेरीटरी आहे, त्यात नेमकी राघवची कंपनी येत नाही. त्यामुळे राघव कडून त्याला अधिकृतपणे व्यवसाय मिळवता येत नाही, क्वार्टरचे टारगेटही पूर्ण होण्यास मदत होणार नसते आणि त्या अनुषंगाने त्याचे कमिशनही मिळणार नसते. राघवची कंपनी ज्याच्या टेरीटरीमधे येते तो मुरुगन विजयचा सहकारी. ह्याठिकाणी विजयला असे वाटू लागते की, राघवचा व्यवसाय मुरुगनलाही मिळाला नाही तर त्याचे टार्गेटही पुर्ण होणार नाही व आपल्याला कमीपणा येणार नाही. व विजय हा लिड मुरुगनपासून लपवून ठेवतो. हे प्रकार होऊ नये म्हणून, एकमेकांचे लिड एकमेकांना देणे व त्यातून अधिकृतपणे कमिशन व सेल्स पॉइंटस कसे वाटता येतील हा सुज्ञ विचार करणे आवश्यक असते. असे केल्याने सेल्स डिपार्टमेंट ही टीम म्हणून व व्यापकतेने आख्खी कंपनीच यशस्वी हो‍उ शकते. आणि म्हणूनच असे घडत असते व ते टाळता येऊ शकते ही जाणीव नव्या व्यवस्थापकांना होणे गरजेचे असते म्हणून काही खेळ (गेम्स) तयात केले आहेत.

बरोबर

अक्षय पुर्णपात्रे सोमवार, 23/11/2009 23:35

श्री भागवत, आपण दिलेले उदाहरण योग्य आहे. व्यवस्थापकांना अशा प्रकारे 'न्याय्य वितरण' (fiar allocative distribution) करता येणे आवश्यक आहे. त्यासाठी गेम थियरीचा वापर करून 'सहकार्यपूर्ण खेळ' (Co-operative games) ही एक नवीन उपशाखाच विकसित झाली आहे.

>>

अजय भागवत मंगळवार, 24/11/2009 06:34

>> 'सहकार्यपूर्ण खेळ' अक्षय, धन्यवाद!!! आणखी एका ज्ञान शाखेची ओळख करुन दिलीत!! उपयोग होईल मला ह्या माहितीचा.

+१ आणि +१

धनंजय सोमवार, 23/11/2009 10:28

उत्तम ओळख आहे. +१ क्रमिक निर्णयाच्या मुद्द्याबाबतही सहमत आहे. +१ शिवाय,सामान्य जीवनातील अनेक निर्णय एकमेकांच्या आठवणीत राहातात. उदाहरणार्थ मुक्तता/शिक्षा असे आयुष्यात एकदाच खेळायचे पर्याय नसून, पुन्हा-पुन्हा खेळायचे पर्याय आहेत, असे समजा. तरी खेळाच्या निर्णयांत फरक पडतो.

+२ आणी +२

टुकुल सोमवार, 23/11/2009 11:10

सुंदर ओळख.. एकदम नवीन विषय. पुढच्या लेखाची आतुरतेने वाट बघतोय.. --टुकुल

+३

प्रभो सोमवार, 23/11/2009 11:18

छान लिहिलय... पुढचा भाग लवकर टाका.. --प्रभो ----------------------------------------------------------------------- काय सांगावे स्वतः विषयी,आहात तुम्ही सूज्ञ !! एका सारखे एकच आम्ही,बाकी सगळे शून्य !!

एका

मदनबाण सोमवार, 23/11/2009 12:37

एका वेगळ्या विषया बद्धल वाचायला मिळाले. मदनबाण..... "Life is the flower for which love is the honey." Victor Hugo

मस्त. हे

गणपा सोमवार, 23/11/2009 13:08

मस्त. हे काहीस फोडा आणि राज्य करा सारख झालं ना? या वरुन एक जुन्या ढकल पत्रातल माकडांचा डिलेमा आठवला, जर मिळाला तर टाकेन इथे.

नाही;

अजय भागवत सोमवार, 23/11/2009 13:37

नाही; ह्यातून जो संदेश नेत्यांना द्यायचा असतो तो असा की, तुम्ही अशी नुकसानीची परिस्थिती निर्माण होऊ न देता जितके जास्त जिंकता येईल ते जिंका; त्याबद्दल "नॉन-झिरो सम" असा एक कॉन्सेप्ट आहे.

इष्टापत्ती

प्रकाश घाटपांडे सोमवार, 23/11/2009 13:21

न केलेल्या सौम्य गुन्ह्याबद्दल शिक्षा भोगली की केलेल्या गंभीर गुन्ह्यातुन सुटका मिळते. वकील लोक अशा इष्टापत्ती अशिलावर ओढववुन मूळ (गंभीर गुन्हा)मुद्दा दुर्लक्षित करवतात. प्रकाश घाटपांडे आमच्या अनुदिनीत जरुर डोकवा.

>>>इष्टापत्

अजय भागवत सोमवार, 23/11/2009 13:30

>>>इष्टापत्ती अशिलावर ओढववुन मूळ (गंभीर गुन्हा)मुद्दा दुर्लक्षित करवतात. :-) त्यानंतर मिळणारी साधी कैद, कैद्यांना त्यांचे हक्क मिळावेत म्ह्णूणून मानवी हक्क वाल्यांचे कार्य ह्याबद्दल बरेच लिहिता येईल नाही?

लेख छान. हे

llपुण्याचे पेशवेll सोमवार, 23/11/2009 14:40

लेख छान. हे म्हणजे कोकणातल्या 'माझी म्हस मेल्याच दु:ख नाही पण अजून शेजार्‍याची म्हस दूध कशी देते?' या प्रकारची मनोवृत्ती वाटते. पुण्याचे पेशवे आम्ही हल्ली सहीत वाक्यं लिहिणं बंद केले आहे. Since 1984

प्रिझनर्स

अजय भागवत सोमवार, 23/11/2009 17:52

प्रिझनर्स डिलेमा ह्या मनोवृतीचा अभ्यास फ्लड आणि ड्रेशील ह्या व्दयीने १९५० साली अमेरीकेत केला. म्हणजेच अशी मनोवृती ही तेथे तर आढळत होती. तुम्ही दाखला दिलेले उदाहरण अगदी ह्याच पठडीतले आहे. ते कोकणातील त्याचे रुप आहे पण ही जगभर आढळणारी मानवी मूल्भूत मनोवृती आहे. त्यास स्थ़ळ-काळ ह्याचे बंधन नाही असेच दिसतेय.

मानसशास्त्र

विजुभाऊ सोमवार, 23/11/2009 15:00

मानसशास्त्राच्या प्रयोगात पाऊलोव चा कुत्र्यावरचा प्रयोग सर्वाना ठाऊक आहे. असाच एक दुसरा प्रयोग केला गेला. एका पिंजर्‍यात एक माकड ठेवले गेले. त्यात दोन स्वीचेस सुद्धा ठेवले होते. अ स्वीच दाबला तर चॉकलेट मिळायचे ब स्वीच दाबला तर शॉक बसायचा. हळू हळू माकाड फक्त अ स्वीच दाबायला शिकले. कालांतराने स्वीचेस चे वर्तन बदलले. अ ऐवजी ब स्वीच मुळे चॉकलेट आणि अ स्वीच मुळे शॉक असे केले. माकडाने तेही अंगीकारले. कालांतराने दोन्ही स्वीचेस चे वर्तन रँडम केले गेले. माकडाला कळेना कोनता स्वीच दाबल्यानन्तर शॉक बसेल? माकडाने हा बदल एका वेगळ्याच पद्धतीने अंगीकारला. ते एकाच वेळेस दोन्ही स्वीचेस दाबू लागले.