क्रिकेट आणि स्टॅटिस्टिक्स - १ : तोंडओळख

Primary tabs

राजेश घासकडवी's picture
राजेश घासकडवी in क्रिडा जगत
20 Feb 2011 - 6:28 am

स्टॅटिस्टिक्स - हा शब्द उच्चारला की लोकांच्या मनात वेगवेगळ्या प्रतिमा निर्माण होतात. बऱ्याच लोकांना सर्वात प्रथम मनात येतं ते 'देअर आर लाइज, देअर आर अटर लाईज अँड देन देअर इज स्टॅटिस्टिक्स', 'स्टॅटिस्टिक्स हे बिकिनीसारखं आहे, बरंच काही दाखवतं, पण महत्त्वाचं तेवढं झाकून ठेवतं'वगैरेसारखे क्लिशे. हे अर्थातच दुर्दैवाचं आहे. कारण योग्य पद्धतीने वापरलं तर स्टॅटिस्टिक्स खोटं बोलत नाही. ते वापरून माणसं खोटं बोलतात, अंतिम सत्य सांगितल्याचा आव आणून. आपल्या स्वार्थासाठी खोटं बोलून त्याला शास्त्राचा आधार आहे असं दाखवणारी माणसं असतात, हे सर्वांनाच ठाऊक आहे. पण त्यात स्टॅटिस्टिक्सचा दोष कसा काय? म्हणजे अणूबॉंब तयार करून हिरोशिमा-नागासाकीची अपरिमित हानी करण्याबद्दल भौतिकशास्त्राला जबाबदार धरण्यासारखं वाटतं. आणि बिकिनीबाबत बोलायचं तर स्टॅटिस्टिक्समुळे सत्याने पांघरलेला बुरखा फाडून निदान ते बिकिनीपर्यंत तरी अनावृत्त होतं हे कुठेच गेलं...

स्टॅटिस्टिक्स शब्दाच्या इतरही काही अर्थछटा आहेत. एकेकाळी व्हायटल स्टॅटिस्टिक्स नावाचा प्रकार असायचा. वेगवेगळ्या नट्यांची, मॉडेल्सची मापं ३६-२४-३६ वगैरे स्वरूपात लिहिणं. पोलिटिकल करेक्टनेसच्या लाटेमध्ये बहुधा ते मागे पडलं असावं. निवडणुकांच्या वेळी स्टॅटिस्टिक्सचा प्रचंड पूर येतो. ट्रेंड, जनमत पोल, स्विंग व्होट्स, प्रेडिक्शन्स वगैरे शब्दांचा मारा होतो. कधीकधी ठार चुकीचे निष्कर्ष काढून हे पोलिटिकल पंडित देखील स्टॅटिस्टिक्सला बदनाम करतात.

एकंदरीतच सध्या अस्तित्वात असलेल्या विद्यानुसार भविष्याबाबत निष्कर्ष काढण्यासाठी स्टॅटिस्टिक्सचा वापर होतो. ''आत्ता' वरून उद्याची विद्या' (पन इंटेंडेड) असा स्टॅटिस्टिक्सकडे बघण्याचा दृष्टिकोन असतो. तो अर्थातच पूर्णपणे चूक नाही. इतिहासावरून काही धडे घेता येतात, काही अटकळी बांधता येतात. सूर्य जर गेली शेकडो वर्षं पूर्वेकडे उगवत असेल तर उद्याही पूर्वेकडेच उगवेल असं अनुमान बांधता येतं. मात्र जोवर इतिहासाच्या घटनांचे नियम लक्षात येत नाहीत तोवर केवळ आत्तापर्यंतचा ट्रेंड बघून त्यावरून निष्कर्ष काढले तर ते साफ चुकीचे ठरू शकतात.

सप्टेंबर २००८. अमेरिकेत गेली काही वर्षं फुगत असलेला घरांच्या किमतींचा फुगा फुटला. आणि त्यांच्या किमतीच्या आधारे काढलेली कर्जं बुडित जायला लागली. त्या कर्जांवर बेतलेल्या सिक्युरिटीज मातीमोल ठरायला लागल्या. त्यांमध्ये गुंतवणुक करणाऱ्या आर्थिक संस्थांना हादरे बसायला लागले. अमेरिकन शेअर बाजार कोसळायला सुरूवात झाली. शेअर्सच्या किमतींची सरासरी दाखवणारा डाउ जोन्स इंडेक्स ४५ टक्क्यांनी आपटला. लाखो लोक बेघर झाले, दीड दोन कोटी लोकांच्या नोकऱ्या गेल्या.

हे सर्व होणार हे सांगता आलं असतं का? जर कोणी डाउ जोन्स इंडेक्स च्या चढत्या आलेखाकडे बघितलं तर आदल्या पन्नास वर्षांत तो साधारण आठ-नऊ टक्क्यांनी वाढलेला आहे. अधनंमधनं खाली जातो, पण वरही येतो. २००८ आधीची डाउ जोन्सची आकडेवारी बघितली तरी सहा महिन्यात तो ४५% नी आपटेल असं कोणीही भाकित करू शकलं नसतं.

तेव्हा निव्वळ आकडेवारीवरून ढोबळ भाकित करणं चुकीचं ठरू शकतं. उदाहरणार्थ 'गेले सहा महिने क्ष स्टॉक दरमहा एक टक्क्याने वाढतो आहे. तेव्हा पुढच्या महिन्यातही तो एक टक्क्याने वर जाईल' असं म्हणणं धोकादायक ठरू शकतं. ती कंपनी फायदेशीर ठरण्यासाठी त्यांची उत्पादनं चांगली आहेत का, त्यांना मागणी आहे का, त्या कंपनीला स्पर्धा किती आहे, कंपनीची मॅनेजमेंट कशी आहे, कंपनीला कर्ज आहे का या सर्व गोष्टींचा विचार करावा लागतो, निव्वळ बॉटम लाईनचा विचार पुरेसा होत नाही.(त्यातही मेख अशी आहे की कंपनीची मूलभूत माहितीदेखील आकडेवारीतूनच घ्यावी लागते. म्हणजे स्टॅटिस्टिक्सपासून सुटका नाही) हे सगळं चांगलं असेल, आणि खरोखरच तिच्या शेअरच्या वाढीचा दर दरमहा एक टक्का असला तरीही ती वाढ त्याच गतीने कायम होईल असं नाही. पुढच्या महिन्यात दोन टक्के खाली जाईल, नंतरच्या महिन्या चार टक्के वर, असं खांबावर चढणाऱ्या माकडासारखं वर खाली करत वर जाऊ शकेल. नक्की किती माहितीवरून नक्की किती पुढची भाकितं किती निश्चितपणे करता येतील हा कळीचा मुद्दा आहे.

क्रिकेटच्या बाबतीत देखील हेच लागू होतं. एखादा खेळाडू सरासरी ४० धावा करत असेल, तर याचा अर्थ असा होत नाही की तो पुढच्या इनिंगमध्ये बरोब्बर ४० धावा करून बाद होईल. काही वेळा तो शून्यावर बाद होईल, तर कधी सेंचुरी मारेल. हे माहीत असूनही अनेक वेळा 'सचिन तेंडुलकरने गेल्या सहा इनिंग्समध्ये सरासरी १७ ने धावा केल्या. त्याचा फॉर्म गेला आहे. त्याने आता लवकरच रिटायर व्हावं' अशी विधानं वाचतो. म्हणजे वाचायचो. साहेबांना एवढ्यात तरी काही बोलण्याची हिंमत होऊ नये असा जबरदस्त फॉर्म आहे. पण सांगायचा मुद्दा असा की फॉर्मात असणं किंवा नसणं, हे नेहेमीच्या कमीजास्त रन होण्याचा भाग आहे की खरोखरच त्या खेळाडूच्या कौशल्यात काही कमी जास्त होतंय हे कसं ठरवायचं? मुळात फॉर्म म्हणजे काय? किंवा चांगला बॅट्समन नक्की कसा ठरवावा? निव्वळ गेल्या काही इनिंग्जमधली धावसंख्या पाहून हे ठरवता येईल का? हाच विचार बोलर्सविषयी करता येईल का? किंवा त्याहीपलिकडे जाऊन क्रिकेटचे काही मूलभूत 'स्थिरांक' आहेत का? ते बदलत आहेत का?

या व अशा इतर प्रश्नांची उत्तरं शोधण्याचा या मालेत प्रयत्न आहे. विशिष्ट खेळाडूंकडे न बघता संपूर्ण खेळाकडे बघण्याचा उद्देश आहे. विश्वचषक स्पर्धा चालू असल्यामुळे मी फक्त वन डे इंटरनॅशनल खेळांकडे बघणार आहे. त्यामुळे मी 'क्रिकेट'विषयी चर्चा करत असलो तरी विशिष्ट आकडेवारी केवळ त्याच फॉर्मॅटला लागू आहेत. आशा अशी आहे की मांडलेला दृष्टिकोन इतर फॉर्मॅटनाही लागू होईल, फक्त आकडे बदलतील. शक्यतोवर तांत्रिक शब्द न वापरता चर्चा करण्याचा विचार आहे. आकडेवारीमध्येदेखील तीन दशांश स्थळांपर्यंत अचूक उत्तर काढण्यापेक्षा सोपी, साधारण ठोकताळ्याची गणितं करण्याकडे माझा कल राहील.

जाताजाता एक प्रश्न. या विश्वचषकात एकोणपन्नास चुरशी होणार आहेत. तर या एकोणपन्नासांपैकी बरोब्बर एक मॅच टाय होण्याची शक्यता किती? बरोब्बर दोन मॅच टाय होण्याची शक्यता किती? हे उत्तर तुम्ही कसं काढलंत?

क्रिकेट

प्रतिक्रिया

आनंदयात्री's picture

20 Feb 2011 - 7:04 am | आनंदयात्री

क्रिकेटच्या मॅचचे खालीलपैकी एका फलित असू शकते.
१. अ टिम जिंकली
२. ब टिम जिंकली
३. टाय झाली
४. रद्द झाली (पाउसपाणी, मारामार्‍या ईटीसी)

मग एक मॅच टाय होण्याची प्रोबॅबिलिटी १/४ निघते. पण असे वाटते आपल्याला या प्रॉबॅबिलिटीत काही इंटरेस्ट नाही.

गृहितक: मॅचचे उत्तर टाय झाली किंवा टाय झाली नाही या दोन पैकी एक असु शकते.
नंबर ऑफ मॅचेसः ४९

शक्यता १:

टायः १
टाय झाली नाही : ४८

प्रोबॅबिलिटी: १/४९

शक्यता २:

टायः २
टाय झाली नाही : ४८

प्रोबॅबिलिटी: २/४९

(चुकले तर ढक्कल पास करा मालक ;) )

-
(ढक्कलपास विंजेनेर)

आंद्या नापास

धनंजय's picture

20 Feb 2011 - 10:49 am | धनंजय

ख त र ना क !

गुर्जी शैक्षणिक फायदा घेतील इतपत भरपूर मालमसाला दिलेला आहे.

विजुभाऊ's picture

20 Feb 2011 - 11:14 am | विजुभाऊ

स्टेटॅटीक्स सिद्ध करू शकते की तुम्ही ५०% प्रेगनन्ट असू शकता

क्लिंटन's picture

20 Feb 2011 - 11:52 am | क्लिंटन

तर या एकोणपन्नासांपैकी बरोब्बर एक मॅच टाय होण्याची शक्यता किती? बरोब्बर दोन मॅच टाय होण्याची शक्यता किती?

जरी कोणत्याही सामन्याचा अ टिम जिंकली, ब टिम जिंकली, टाय आणि मॅच रद्द झाली या चार पैकी एक निकाल लागत असला तरी कोणताही सामना टाय व्हायची शक्यता १/४ नाही हे दिसतेच.तेव्हा हे चार सरफेस असलेला एक "फासा" आहे अशी कल्पना केली तर तो फासा "unbiased" नक्कीच नाही.आणि बहुतांश सामन्यांचे निकाल लागतात आणि टाय सामने फारच थोडे (बहुदा २% पेक्षा कमी) असतात हे लक्षात घेता तो फासा "unbiased" नाही हे लक्षात येईल.तेव्हा कोणताही सामना टाय व्हायची probability किती हे काढायला हवे.ते काढणार कसे हा कळीचा मुद्दा आहे.फायनान्समध्ये अशा कोणत्याही गोष्टीची probability काढायची असेल तर सर्वसाधारणपणे पुढील मार्ग असतात तेच मार्ग इथे उपयोगी होतात का ते बघू या:

१. जर का यापूर्वीच्या सामन्यांच्या विदामध्ये सर्व प्रकारच्या शक्यतांचा (हवामान, पिचची स्थिती आणि इतर अनेक घटक) यांचा समावेश झाला असेल आणि यापूर्वी खेळल्या गेलेल्या सामन्यांमध्ये किती सामने टाय झाले हे बघून मग कोणताही सामना टाय व्हायची probability काढावी. म्हणजेच सामन्याच्या निकालावर परिणाम करणारे समजा १५ (कदाचित जास्तही) घटक असतील (या घटकांमध्ये हवामान,पिच याबरोबरच एखाद्या संघाचे ढिसाळ क्षेत्ररक्षण,काही चांगल्या खेळाडूंचे अपयश इत्यादी अनेक गोष्टींचा समावेश असेल) आणि यापूर्वी झालेल्या सर्व एकदिवसीय सामन्यांमध्ये त्या १५ घटकांचा समावेश होऊन आपले sample space पुरेसे मोठे असेल तर या मार्गाने उत्तर काढता येईल.

पण क्रिकइन्फोवरून समजते की काल खेळला गेलेला भारत विरूध्द बांगलादेश हा ३१०० वा एकदिवसीय सामना होता.तेव्हा ३१०० हे sample space या उदाहरणातील गुंतागुंत लक्षात घेता पुरेसे आहे असे वाटत नाही.१९९६ च्या विश्वचषकात दुबळ्या केनियाकडून पराभूत होणाऱ्या वेस्ट इंडिजच्या संघाने नंतर त्या स्पर्धेत त्यापूर्वी अपराजित राहिलेल्या दक्षिण आफ्रिकेचा उपांत्यपूर्व फेरीत पराभव केला पण पुढे त्याच संघाने उपांत्य सामन्यात ऑस्ट्रेलियाविरूध्द विजयश्रीच्या जबड्यातून पराभव खेचून आणला!! अशी अनेक उदाहरणे देता येऊ शकतील.या सर्व गोष्टींसाठी अनेक वेगवेगळे घटक कारणीभूत असतील. तेव्हा या सगळ्या अनेकविध घटकांचा interplay एकाच वेळी होऊन आपल्याला वापरता येईल इतका मोठा विदा आपल्याकडे नाही असे म्हणता येईल.

म्हणजेच ही historic data पध्दत उपयोगी पडणार नाही.

२. कोणत्याही सामन्याच्या निकालावर परिणाम करणाऱ्या १५/२०/२५ किंवा जितके असतील तितके घटक ओळखावेत आणि या घटकांची वेगवेगळी किंमत घेऊन Computer simulations करावीत.उदाहरणार्थ स्टिव वॉचा हर्शेल गिब्जने झेल सोडला हा त्या सामन्याच्या निकालावर परिणाम करणारा घटक होताच.असे एखाद्या खेळाडूने करणे, किंवा सचिन तेंडुलकरसारख्या एखाद्या खेळाडूने ० ते २०० (कदाचित २५० सुध्दा) धावा काढणे इत्यादी इत्यादी अनेकविध घटक आहेत त्यांना computer simulation करून वेगवेगळ्या किंमती द्याव्यात आणि संगणकावर सामने simulate करावेत.असे अनेक सामने simulate करून त्यापैकी किती सामने टाय होतात ते बघावे. या प्रकाराला Monte Carlo Simulations म्हणतात. फायनान्समध्ये एकावेळी ५ किंवा फारतर १० घटकांचा निकालावर परिणाम होईल असे असताना Monte Carlo Simulations करताना एक मिलियन simulations करणे ही गोष्ट फारशी आश्चर्यकारक नाही.तेव्हा इथे बरेच जास्त घटक निकालावर परिणाम करत आहेत तेव्हा त्यापेक्षा जास्त (कदाचित १०० मिलियन सुध्दा) simulations करून त्यापैकी किती सामने टाय होतात हे बघावे आणि त्यावरून कोणताही सामना टाय व्हायची probability किती हे बघावे. यातही समजा काही घटक आपण विचारात घेतले नाहीत तर मात्र आपले उत्तर चुकेल.

एकदा हे सगळे उपद्व्याप करून एखादा सामना टाय व्हायची शक्यता किती (समजा ती शक्यता P असेल) हे कळले की मग पुढचा भाग सोपा आहे. मग binomial distribution वापरून आपल्याला प्रश्नाची उत्तरे कळू शकतील.

म्हणजे बरोब्बर १ सामना टाय व्हायची शक्यता: ४९ C १ गुणिले P गुणिले (१-P) चा ४८ वा घात
आणि बरोब्बर २ सामने टाय व्हायची शक्यता: ४९ C २ गुणिले P चा वर्ग गुणिले (१-P) चा ४७ वा घात

पण या सगळ्यात कळीचा मुद्दा आहे P ची किंमत किती हा!!

रमताराम's picture

20 Feb 2011 - 4:23 pm | रमताराम

बहुतेक मुद्यांशी सहमत.

तो फासा "unbiased" नाही हे लक्षात येईल.
+१००. आपल्या आयुष्यात बहुतेक समस्या 'इक्वि-प्रोबेबल' शक्यतांनी बनलेल्या असत नाही, व्यवहारातील फासा बहुधा बायस्डच असतो. अन-बायस्ड फासा अथवा इक्वि-प्रोबेबल इवेन्ट्स ही संख्याशास्त्राची निव्वळ सुरवात आहे. संख्याशास्त्राच्या आमच्या अभ्यासक्रमात आम्ही लवकरच त्यांना विसरून जातो.

विदा वापरून काढलेली प्रोबॅबिलिटी ही तेव्हाच वॅलिड मानता येते जेव्हा जमा केलेला विदाची परिस्थिती नि आजची परिस्थिती जवळजवळ तीच असते. उदा. तुमचे महिन्याचे सरासरी वीजबिल १०० रू असेल नि या महिन्याचे १५० रू आले तर यात बदललेल्या वीज टॅरिफचा सहभाग असू शकतो. मागच्या आठ महिन्यांची सरासरी काढली असेल नि त्यासाठी पावसाळ्याचे नि हिवाळ्याचे आठ महिन्यांचा विदा वापरून आलेला निष्कर्ष उन्हाळ्याच्या चार महिन्यात कसा चुकतो हे दाखवणे हे संख्याशास्त्राची मर्यादा नव्हे तर असा निष्कर्ष काढणार्‍याचे अज्ञान दाखवते.

कोणताही निष्कर्ष काढताना जमवलेला विदा हा करावयाच्या अभ्यासावरून काय असावा (त्यातले आकडे नव्हे, कोणकोणती मोजमापे करावीत), कुठला विदा आवश्यक आहे, कोणते घटक अधिक परिणामकारक असतील, कोणते दुय्यम असतील, इतर अनेक न मोजलेल्या घटकांमुळे जास्तीतजास्त किती 'संभाव्य एरर' असू शकेल, ती 'एरर' जर फार अधिक असेल तर त्या दुय्यम समजलेला कोणता/ते घटक दखलपात्र घरून त्यांच्याशी संबंधित विदा जमा करणे आवश्यक आहे हे तपासणे इ. अनेक टप्पे यात येतात. पुन्हा निवडलेले घटक हे 'प्रत्यक्ष परिणाम' करणारे घटक आहेत की अप्रत्यक्ष परिणाम करणारे यावरून त्यांना अभ्यासात नक्की कसे स्थान द्यायचे हे ठरते. उदा. एखाद्या परफॉर्मन्सबाबत स्पर्धक स्त्री आहे की पुरूष हे महत्त्वाचे ठरत असेल तर तिथे त्या निकषावर स्वतंत्र गट करून अभ्यास केला जातो तर त्यांचे वय हा जर परिणाम करणारा घटक असेल तो कोवेरिएट अर्थात सरल घटक म्हणून वापरला जातो. हे सारे सारे लक्षात घ्यावे लागते. उचलला विदा नि काढला निष्कर्ष इतके सरळ असत नाही.

हे मात्र खरे कि विविध माध्यमातून केलेले सर्वे नि त्यातून काढलेले निष्कर्ष बहुधा असेच अनभिज्ञ लोकांनी काढलेले असतात. सध्या क्रिकेटबद्दल बोलतोय म्हणून एक प्रसिद्ध नि अनेकांचे लाडके उदाहरण घेतो.

सचिन तेंडुलकर हा देशासाठी खेळत नाही, किंवा तो खेळतो तेव्हा आपण हरतो असे एक ऑस्ट्रेलियन प्रॉपगंडाला बळी पडलेले आपले देशी लोक करत असतात. आणखी हेच लोक असे म्हणतात की जेव्हा संघाला गरज असते वा महत्त्वाच्या सामन्यात तो खेळत नाही. (दोन्ही तर्क एकत्र केले तर आपण महत्त्वाचे सामने नेहमीच जिंकतो असा एक मजेदार तर्क देता येईल, पण ते जाऊ दे.) तसा मी सचिनची सर्व शतके केलेल्या सामन्यात भारताची यशाची टक्केवारी सत्तर टक्क्याहुन अधिक आहे हे दाखवून दिले आहे. पण आता आमचेच खरे म्हटल्यावर मग 'स्टॅटिस्टिक्स/नंबर्स डोन्ट टेल एवरिथिंग' हे आणखी अडाणी समर्थन दिले जाते. पण ते असो. तर सांगायचा एक मुद्दा हा की एका विद्वानांनी वरील समज 'संख्याशास्त्राच्या सहाय्याने सिद्ध' केल्याचा दावा केला होता नि त्यांचे हे तथाकथित 'संशोधन' एका प्रसिद्ध इंग्रजी वृत्तपत्राच्या पहिल्या पानावर प्रसिद्ध झाले होते. उत्सुकतेने मी वाचले नि ह. ह. पु. वा. इथे कळीचा मुद्दा असा होता की 'संघाला गरज होती तेव्हा...' आता संघाला गरज असलेले सामने विदा म्हणून एकत्र करायचे तर ती गरज डिफाईन करायला हवी ना.

आता इथेच तर गंमत आहे. साहेबांनी 'भारत पराभूत झालेले' सामेन 'संघाला गरज असलेले सामने म्हणून विचारात घेतले होते. वरवर पाहता बरोबर वाटते ना? पण गंमत म्हणजे सचिनने भारताला गरज असताना तारले आहे असे सामने या विदामधे मुळातच येत नाहीत, आहे की नाही गंमत. आता भारत पराभूत झाला असेल तर त्या सचिनसारखा महत्त्वाचा मोहरा चालला नाही म्हणूनच हे सहज समजण्यासारखेच आहे की, त्याला संख्याशास्त्र कशाला हवे. थोडक्यात विदाच सोयीचा निवडला. पण निष्कर्ष मात्र विदा ज्याचा निवडला तेवढ्यापुरता मर्यादित न ठेवता 'जनरालाईज' केला, हे अज्ञान किंवा खोटारडेपणा यापैकी काहीही असू शकेल. गंमत म्हणजे यावर भारत जिंकलेले सामने जमा केले तर तिथेही तो बहुतेक वेळा यशस्वी झालेला दिसून येईल, म्हणून सचिन खेळतो तेव्हा भारत जिंकतो असा निष्कर्ष काढता येऊ शकतो (जो तितकाच चुकीचा आहे). यावर तपशीलवार प्रतिसाद मी त्या वृत्तपत्राला पाठवला, जो अर्थातच त्यांनी छापला नाही. (आपण असले मूर्ख 'संशोधन' तेही देशाचा यूथ आयकॉन असलेल्या सचिनबद्दल - प्रसिद्ध केले हा आपलाच गाढवपणा ते कशाला कबूल करतील.)

असो .इतके पुरे. बाकीचे आगामी मालिकेत लिहू.

(संख्याशास्त्री)रमताराम

राजेश घासकडवी's picture

20 Feb 2011 - 7:52 pm | राजेश घासकडवी

उत्तर काढण्याची पद्धत अचूक आहे.

पण या सगळ्यात कळीचा मुद्दा आहे P ची किंमत किती हा!!

तुम्ही मॉंटे कार्लो सिम्युलेशनमध्ये जितक्या बारीकसारीक गोष्टींचा विचार न करता आपल्याला काही मॉडेल तयार करता येतं का, व त्यावरून ही P ची किंमत काढता येतं का हे पहाण्याचा या लेखमालेचा प्रयत्न आहे.

म्हणजेच ही historic data पध्दत उपयोगी पडणार नाही.

हे मात्र पटलं नाही. ३१०० निरीक्षणं एखादं वितरण निश्चित करायला पुरेसे असावेत. टाय होऊ शकतील असे काही सामने एक टीम जिंकते तर काही दुसरी. पण दुसऱ्यांदा बॅटिंग करणारी टीम किती रननी मॅच जिंकली किंवा हरली याचंही शून्याभोवती वितरण असेलच ना. त्या वितरणाचा अंदाज आपल्याला काही सोप्या गृहितकांवरून करता आला तर ती गृहितकं व्हॅलिडेट करता येतील. (याला मर्यादा आहेत, पण त्यांचाही विचार करू.)

क्लिंटन's picture

20 Feb 2011 - 8:49 pm | क्लिंटन

असे सोपे मॉडेल तयार करता आले तर फारच उत्तम. त्यासाठी शुभेच्छा.

"p" काढण्यासाठी ऐतिहासिक आत्त पुरेसे नाही, याबद्दल क्लिंटनशी सहमत.

सिद्धांत शक्य तितका जास्तीतजास्त सोपा असावा, पण त्याहून सोपा असू नये.

आणि खर्‍याखुर्‍या क्रिकेटशी संबंध सुटेल इतके सुलभीकरण असू नये.

विकिपेडियावर या दुव्यावर पुढील परिच्छेद वाचला :

Tied matches were relatively rare in the first two decades of ODIs. ODIs had been played for 13 years before the first tie in 1984, in the 247th ODI. There was a gap of 5 years until the second tied ODI, in 1989, in the 567th ODI. However, since 1991, a further 21 tied ODIs have occurred in approximately 2,400 matches.

त्यामुळे ऐतिहासिक आत्तावरून इतकेच कळते, की "p"चे सोपे गणित केले तर कुठलेही उत्तर खर्‍याखुर्‍या क्रिकेटशी संबंधित राहाणार नाही.

(शेवटचे प्रश्न खेळकर विनोद आहेत असे मला वाटले होते. क्रिकेटमधील वेगळा कुठला प्रश्न स्टॅटिस्टिक्सच्या वर्णनासाठी घ्यावा ही श्री. घासकडवी यांना माझी विनंती. शाळेमधील गणितांत स्थिर बाजारभाव, न-बदलणारे व्याजदर... वगैरे अशी उदाहरणे घेतात. जेणेकरून सुलभीकृत गणितांची फलिते त्या सोप्या उदाहरणांत खरोखर लागू होतात. क्रिकेटमधील असेल कुठले उदाहरण घ्यावे.)

राजेश घासकडवी's picture

22 Feb 2011 - 12:41 am | राजेश घासकडवी

तुम्ही दिलेल्या उदाहरणात 'पहिल्या टायसाठी तब्बल १३ वर्ष' व त्यानंतर 'दुसऱ्यासाठी अजून ५ वर्षं' हे थोडं दिशाभूल करणारं आहे. १९७१ साली जेव्हा एक दिवसीय सामने सुरू झाले तेव्हा वर्षाला वीसेक सामनेच होत. त्यामुळे टाय होण्याची दर मॅचमागे शक्यता तितकीच असली तरी काळ खूपच जास्त जात असे. पहिली टाय व्हायला २४७ वा सामना उजाडला. दर शंभरात ०.७४% शक्यता असेल तर हा आकडा आश्चर्यकारक नाही. तसंच पहिल्या सातशे खेळांत ४ सामने टाय झाले. तेसुद्धा ३१०० मध्ये २३ शी विसंगत नाही.

टाय होण्याची शक्यता ही एक दिवसीय क्रिकेटच्या अधिक मूलभूत गुणधर्मांवरून काढता आली तर उत्तम.

भडकमकर मास्तर's picture

20 Feb 2011 - 1:05 pm | भडकमकर मास्तर

क्रिकेट आवडते म्हणून वाचायला घेतले...
लेख भारी आहे...

त्यावरील चर्चा त्याहून भारी....

समजून घ्यायचा यथामति प्रयत्न करत आहे...

सीझन बॉल आपल्या शिवणीचा झुर्र असा आवाज करत डोक्यावरून निघून जातो त्याची आठवण झाली...

सहज's picture

20 Feb 2011 - 2:01 pm | सहज

क्रिकेट आवडते म्हणून धागा उघडला बघतो तर काय? ज्यांची हयात कायम लिंबूटिंबू प्लेयर म्हणून गेली (असणार) अश्या लोकांचे गुफ्तगू चालले आहे.

चालू द्या.

रमताराम's picture

20 Feb 2011 - 3:33 pm | रमताराम

कारण योग्य पद्धतीने वापरलं तर स्टॅटिस्टिक्स खोटं बोलत नाही. ते वापरून माणसं खोटं बोलतात, अंतिम सत्य सांगितल्याचा आव आणून. आपल्या स्वार्थासाठी खोटं बोलून त्याला शास्त्राचा आधार आहे असं दाखवणारी माणसं असतात, हे सर्वांनाच ठाऊक आहे. पण त्यात स्टॅटिस्टिक्सचा दोष कसा काय?

याबद्दल घासकडवी साहेबांना आमच्याकडून ब्लेजर, १०१/- रू रोख नि श्रीफळ देण्यात येत आहे. अर्थात आम्ही फक्त फटू टाकण्यावर कटवणार नाही. ्पुढील कट्ट्याला (आम्हाला निमंत्रण मिळाल्यास) प्रत्यक्ष भेटीत त्यांचा सत्कार (मूळ अर्थाने) करण्यात येईल.

बाकी स्टॅटिस्टिक्सला शिव्या देणारे वा टर उडवणारे कोणत्याही पुराव्याशिवाय -किंवा ढीगभर विरोधी पुरावा असूनही - दृष्टीआडच्या सृष्टीवर मात्र १००% टक्के विश्वास ठेवतात ही गंमत आम्ही रोज अनुभवतो. असो.

आमच्या प्रस्तावित संख्याशास्त्र ओळख मालिकेमधे संख्याशास्त्रावरील आक्षेपांचा यथोचित समाचार घेतला जाईल असे जाहीर करतो. (केव्हा लिहिणार असे खरडीतून विचारू नये, अपमान होईल... व्य. नि. वा इमेल मधून विचारले तरीसुद्धा!)

३_१४ विक्षिप्त अदिती's picture

21 Feb 2011 - 9:56 am | ३_१४ विक्षिप्त अदिती

कार्यबाहुल्यामुळे रुमाल टाकत आहे. वेळ मिळाला की मैदानात उतरून प्रतिसाद देतेच. तोपर्यंत ही फक्त पोच.

निखिल देशपांडे's picture

21 Feb 2011 - 1:44 pm | निखिल देशपांडे

आज वर एकुण ३१०२ एकदिवसीय सामने खेळण्यात आले आहेत. त्यात फक्त २० सामने हे टाय अवस्थेत संपले आहे. आणि त्या प्रत्येक सामन्याचा नं ह्या दुव्यावर उपल्बध आहे. पहिला टाय झालेल्या सामन्याचा क्रमांक २४७ होता व दुसरा टाय झालेला सामना ५६७ तिसरा ६९०... अशी सिक्वेन्स काढुन पुढच्या टाय होणार्‍या मॅच चा नं सुचवता येईल का??? म्हणजे या सिक्वेन्सचा आणि वरच्या प्रॉबॅब्लिटी गणिताचे एकत्रीकरण करुन काही उत्तर निघु शकते का???

छोटा डॉन's picture

21 Feb 2011 - 3:29 pm | छोटा डॉन

पहिला टाय झालेल्या सामन्याचा क्रमांक २४७ होता व दुसरा टाय झालेला सामना ५६७ तिसरा ६९०... अशी सिक्वेन्स काढुन पुढच्या टाय होणार्‍या मॅच चा नं सुचवता येईल का???

बापरे !!!
चक्क फिक्सिंग ???

बाकी वर चालु असलेली आकडेवारी, ठोकताळे आणि इतर सांख्यिकी मजेशीर आहे असे सांगतो.

अवांतर :
परवा काय झालं माहित आहे का, मँचेश्टर युनायटेडचा 'वेन रुनी' आपलं उगाच येड्यासारखं धावत होता डी-च्या जस्ट आलीकडुन, अचानक त्याला बॉल थोडासा त्याच्याकडे येताना दिसला, बॉ किंचित उंचीवर आणि त्याच्याहुन दुर असा तिरक्य दिशेने चालला होता, ह्या पठ्ठ्याने १ सेकंदात ( किंवा त्या पेक्षा कमी ) झट्टदिशी कोलांटी उडी मारुन लाथेने बॉल जाळ्यात ढकलला आणि मॅन्-युने मॅच जिंकली.
काढा आता आकडेवारी आणि तत्सम :)

- छोटा डॉन

नितिन थत्ते's picture

21 Feb 2011 - 3:44 pm | नितिन थत्ते

डकवर्थ आणि लुईस या दोन संख्याशास्त्रज्ञांनी कमी वेळ झालेल्या सामन्याचा निकाल लावण्याची पद्धत काढली आहे आणि ती वापरली जात आहे. त्या पद्धतीविषयी बहुतेक क्रिकेट समालोचक नाखूष आहेत.

त्या पद्धतीने काढलेले निष्कर्ष चुकतात. (म्हणजे क्रिकेटच्या खर्‍यास्वरूपाशी ते साधर्म्य राखत नाहीत-सोप्या शब्दात - दोघांना क्रिकेटमधलं काही कळत नाही.) आणि कधीकधी ते अन्यायकारक दिसतात. (१९९२ चा विष्वचषकातील द आफ्रिका आणि इंग्लंड यांच्यातला सामना).

त्यावरही प्रकाश टाकावा अशी अपेक्षा.

रमताराम's picture

21 Feb 2011 - 6:48 pm | रमताराम

त्या पद्धतीने काढलेले निष्कर्ष चुकतात.
मुळात हा निष्कर्ष तुम्ही कसा काढलात ते सांगा अगोदर.

आमच्या मते डकवर्थ-लुईस ही पद्धत अतिशय उत्तम आहे. त्या दोघांनी क्रिकेट या खेळाचा नि एकुण शक्यतांचा जितका बारकाईने अभ्यास केला आहे तेवढा खुद्द खेळाडूंनी अथवा त्यांच्या कोचनेही कधी केला नसेल. विचारांचे नि तर्काचे, चिकाटीचे एकुणच वावडे असल्याने त्यातील गुंतागुंत बहुतेकांना समजत नसल्याने ती चुकीची आहे असे म्हणणे बहुतेकांच्या दृष्टीने सोयीचे असते इतकेच.

ता.क. १९९२ च्या सामन्यात (तोच ज्या १ चेंडूत २२ धावांचे हास्यास्पद गणित काढेल होते तोच म्हणताय ना?) डकवर्थ्-लुईस नियम अस्तित्वात आलेला नव्हता. तेव्हा ओवर कमी करताना पहिल्या डावातील सर्वात कमी धावा केलेल्या ओवर्स चढत्या क्रमाने काढून टाकल्या जात. इंग्लंडच्या डावात दोन मेडन ओवर्स पडल्याने द. आफ्रिकेच्या टार्गेटमधून दोन ओवर्स कमी झाल्या पण धावांचे टार्गेट तेच राहिले होते. किंबहुना या सामन्यानंतरच एखाद्या अधिक चांगल्या नियमाचा शोध सुरू झाला नि डकवर्थ्-लुईस नियम अस्तित्त्वात आला.

नितिन थत्ते's picture

21 Feb 2011 - 7:08 pm | नितिन थत्ते

१९९२ विश्वचषकाबाबतच्या दुरुस्ती साठी धन्यवाद.

ड-लु नियमाची नक्की डिटेल्स माहिती नाहीत. वाचलेल्या माहितीनुसार संपलेल्या ओव्हर आणि गेलेल्या विकेट यानुसार किती धावा व्हायला हव्या याचे गणित केले जाते असे वाटते. (तुम्हाला नियम माहिती असेल तर माहिती द्यावी).

संपलेल्या ओव्हर नुसार टार्गेट काढणे म्हणजे क्रिकेटच्या डावात समान गतीने धावा होतात असे गृहीत धरणे आहे. तसेच गेलेल्या विकेटप्रमाणे टारगेट काढणे म्हणजे शेवटाचे फलंदाज जास्त धावा काढू शकतात हे नाकारणे आहे.

वरील लॉजिकमध्ये चूक असेल तर सांगावे.

मला आत्ता नक्की आठवत नाही पण २००३ च्या विश्वचषकाचा अंतिम सामना हरण्यामागे डकवर्थ लुईस नियमाचा (उलटा) हात होता असे काहीसे वाचल्याचे आठवते. पाऊस पडण्याची शक्यता आहे आणि ड-लु लागू होईल म्हणून भारताने ड-लु टार्गेटवर लक्ष ठेवून जरुरीपेक्षा वेगाने धावा काढायचा प्रयत्न केला आणि त्यात विकेट्स घालवल्या. नंतर मात्र सामना पूर्णवेळ चालला असे स्पष्टीकरण ऐकल्याचे आठवते.

रमताराम's picture

21 Feb 2011 - 9:56 pm | रमताराम

संपलेल्या ओव्हर नुसार टार्गेट काढणे म्हणजे क्रिकेटच्या डावात समान गतीने धावा होतात असे गृहीत धरणे आहे. तसेच गेलेल्या विकेटप्रमाणे टारगेट काढणे म्हणजे शेवटाचे फलंदाज जास्त धावा काढू शकतात हे नाकारणे आहे.
दोन्ही गृहितके चुकीची आहेत असा माझा समज आहे. संपलेल्या ओवर्सनुसार टार्गेट काढत असले तरी याचा अर्थ समान गतीने धावा होतात असे मुळीच नाही. एकेक षटक संपल्यानंतर काढलेले टार्गेट एकाच गतीने वाढत नाही! त्रैराशिकाचा नियम इथे लागू पडत नाही. अशीच गोष्ट विकेट्सची आहे. मूळ गोष्ट अशी आहे की अनेक निकष लक्षात घेतले जातात, निव्वळ धावगती नि विकेट्स नव्हेत.
संपूर्ण नियम सांगणे शक्यच नाही (एकाहुन अधिक धाग्यांचा निबंध होईल तो) गुगलून मिळेलच. फक्त काही घटक सांगतो.

पहिला डाव अपूर्ण असताना पाऊस आल्यास वाया गेलेल्या वेळानुसार षटके कमी होतात. पण एवढेच नव्हे तर प्रत्यक्षात डाव संपल्यावर जेवढ्या धावा होतात त्यापेक्षा अधिक टार्गेट दिले जाते. हा एक नियम बहुधा सर्वांनाच जाचक वाटतो. या मागचा तर्क असा आहे की फलंदाजी करणार्‍या संघाने ५० षटकांचा प्लान बनवलेला असतो अचानक मधेच काही षटके वाय गेल्याने तो बदलावा लागतो. यात काही तोटे असे, १. पाचहून कमी षटके शिल्लक राहिली नि बॅटिंग पॉवरप्ले अजून घेतलेला नसेल (पूर्ण खेळात शेवटची पाच षटके घ्यावीत असे ठरवून) तर फलंदाजी करणार्‍या संघाला तो तोटा होतो. २. एखाद्या गोलंदाजाने आधीच दहा षटके टाकून घेतली असतील पण जर सरासरीनुसार प्रत्येक गोलंदाजाला मिळणारी षटके जर कमी झाली (समजा ८) तर आधीच टाकून झालेली षटके हिशोबातून काढून टाकता येत नाहीत. आता हा जर डेल स्टेन सारखा भरात असलेला गोलंदाज असेल तर गोलंदाजी करणार्‍या संघाला मोठा फायदाच म्हणायचा. हे आणि यासारख्या अनेक शक्यता ध्यानात घेऊन हे नियम बनवले आहेत. त्यातील गुंतागुंत सगळी समजून आली नाही तर अन्याय्य वाटणे सहज शक्य आहे.

अधिक माहितीसाठी या दुक्कलीचे हे संस्थळच पहा.

रमताराम हे एक उदाहरण पहा
भारत इंग्लंड २००८ चौथ्या वन डे मॅच मध्य पहिल्या डावात पावसाने दोनदा व्यत्य आणला भारताने सामना २२ ओव्हर्स चा ठेवण्यात आला. भारताए २२ ओव्हर्स मध्ये भारताने चार बाद १६४ धावा केल्या. डकवर्थ लुईस निइयमानुसार इंग्लंडला २२ ओव्हर्स मध्ये १९८ धावांचे टारगेट ठेवण्यात आले.
इंग्लंद ने २२ ओव्हर्स मध्ये ८ बाद १७८ धावा केल्या . भारत१९ धावानी जिंकला
याचेच दुसरे उदाहरण
या वर्षी जानेवारीत दक्षीण अफ्रीकेत खेळण्यात आलेल्या वन डे त पावसाचा व्यत्य येवून सामना ४६ ओव्हर्स चा ठरवला गेला.
दक्षीण अफ्रीकेने ९ बाद २५० धावा केल्या.डकवर्थ लुईस नियमानुसार भारताला २६८ धावांचे टारगेट देण्यात आले. भारत ३३ ओव्हर्स मध्ये सर्व बाद २३४ झाले दक्षीण अफ्रीका ३३ धावानी जिंकली