छन्दोरचना

माहितगार's picture
माहितगार in जे न देखे रवी...
10 Apr 2014 - 10:40 pm

प्रा.माधव त्रिंबक पटवर्धन (माधव जूलियन) ह्यांचा छन्दोरचना हा ग्रंथ प्रथम १९२७ साली प्रसिद्ध झाला. त्यात आणखी भर घालून हाच ग्रंथ १९३७ मध्ये छापून प्रसिद्ध झाला. (संदर्भ) या ग्रंथात काव्य रचनेमध्ये वापराची विविध प्रकारचे छंद, जाती आणि वृत्ते यांचा परिचय करून दिलेला आहे.

मराठी विकिस्रोतावर माधव जूलियन लिखीत छन्दोरचना चे OCR वापरून युनिकोडीकरण करुन झालेले आहे. पण मुद्रीत शोधनाचे आणि मुद्रित शोधनाच्या पडताळ्णी/दुरुस्ती अशा दोन्ही स्टेजचे काम बाकी आहे. मुद्रीत शोधनाचे आणि मुद्रित शोधनाच्या पडताळ्णी/दुरुस्तीनंतर ग्रंथातील माहिती शोधणे अभ्यासणे संदर्भ देणे या क्रिया अत्यंत सुलभ होऊ शकतील.

कवि आणि काव्यप्रेमींनी ग्रंथाच्या मूळाबर हुकूम मुद्रीत शोधनाचे आणि मुद्रित शोधनाच्या पडताळ्णी या दोन्ही प्रक्रीयापार पाडण्यात सक्रीय सहभाग घ्यावा असे आवाहन आहे.

.
.
.
(*तळटिप: मराठी विकिस्रोत प्रकल्पाबद्दल अधिक माहिती या ऑनलाईन सादरीकरणात सुद्धा उपलब्ध आहे.)
.
.
.

गझल, सुरेश भट हे
मराठी विकिंवर उपरोक्त लेख आहेत. या लेखात लिहिण्या सारखं तुम्हा रसिंकांकडे बरेच काही आहेच. मराठी गझल रसिकांना त्यांच्या आवडीचे वाचन आणि लेखन घडत राहो ही शुभेच्छा.

* छन्दोरचना

*धागा विकिपीडियाकरता असल्यामुळे नित्या प्रमाणे आपले या धाग्यावरील लेखन प्रताधिकार मुक्त होत आहे. विषयांतर टाळण्यासाठी आणि चर्चा सहभागा साठी आपणा सर्वांना धन्यवाद

मराठी गझलकवितागझलतंत्र

प्रतिक्रिया

प्रा.डॉ.दिलीप बिरुटे's picture

13 Apr 2014 - 10:27 am | प्रा.डॉ.दिलीप बिरुटे

छ्न्दोरचना. मराठी विकिवर पाहतांना मला विशेष आनंद झाला.

-दिलीप बिरुटे

माहितगार's picture

13 Apr 2014 - 10:52 am | माहितगार

युनिकोडीकरणा साठी टंकन करण्यात कुणी काव्यप्रेमी पुढाकार घेतील या आशेने मराठी विकिस्रोत प्रकल्पावर चढवले आहे. नुसते वाचता येईलच पण टायपींग करत करत वाचल्यास होतकरू काव्य रसिकांना अभ्यास करण्याची संधीही मिळेल यास्तव.

माहितगार's picture

17 May 2017 - 8:19 am | माहितगार

छन्दोरचना चे OCR वापरून युनिकोडीकरण करुन झालेले आहे. पण मुद्रीत शोधनाचे आणि मुद्रित शोधनाच्या पडताळ्णी/दुरुस्ती अशा दोन्ही स्टेजचे काम बाकी आहे. मुद्रीत शोधनाचे आणि मुद्रित शोधनाच्या पडताळ्णी/दुरुस्तीनंतर ग्रंथातील माहिती शोधणे अभ्यासणे संदर्भ देणे या क्रिया अत्यंत सुलभ होऊ शकतील. हि माहिती देण्याच्या दृष्टीने धागा वर काढत आहे.

हे काम कसे करता येईल? मला शक्य झाल्यास मदत करायला आवडेल.

गीतारहस्यच्या निमीत्ताने मागे मिपावर चर्चा झालेली आहे त्याचे संदर्भ घेऊन प्रतिसाद थोड्या वेळाने लिहितो. प्रतिसादासाठी आभार.

माहितगार's picture

17 May 2017 - 3:27 pm | माहितगार

आता धागा लेखात विकिस्रोताची प्राथमीक ओळख करुन देणारे ऑनलाईन सादरीकरण जोडले आहे. मराठी विकिस्रोतात पुर्वी पूर्ण टंकन करावे लागत होते ते काम OCR अ‍ॅटोमॅटीकली वेगाने करुन देऊ लागले आहे. कॉपीराईटमुक्त ग्रंथाची स्कॅन कॉपी विकिमिडीया कॉमन्स या बंधू प्रकल्पात चढवलेली असते जसे File:छन्दोरचना.djvu. त्या नंतर मराठी विकिस्रोत mr.wikisource.org वर File एवजी 'अनुक्रमणिका' शब्द म्हणजे अनुक्रमणिका:छन्दोरचना.djvu लिहिले कि ग्रंथाची सर्व स्कॅन केलेली पृष्ठे (चित्र रुपात) दिसू लागतात.

त्या नंतरची स्टेप स्कॅन केलेल्या पुस्तकाचे OCR ने युनिकोडीकरण केले जाते. (छन्दोरचना बाबत स्कॅन आणि युनिकोडीकरण या स्टेप पार पडलेल्या आहेत.) स्कॅन केलेल्या पुस्तकाचे OCR ने युनिकोडीकरण होताना सॉफ्टवेअरला चित्र-खुणा समजत नसल्यामुळे मजकुरात gibberish अनावश्यक अनाकलनीय अक्षरे येतात ती वगळावयाची असतात, तर ग्रंथातील मजकुरातील काही अक्षरे अस्पष्ट असणे किंवा पुस्तकाचे सपाट स्कॅन होऊ न शकल्यामुळे काही अक्षरे/शब्द OCR कडून चुकीचे उमटलेले असतात.

१) मुद्रीत शोधनाच्या प्रक्रीयेत gibberish अनावश्यक अनाकलनीय अक्षरे काढून टाकणे आणि अस्पष्टता किंवा इतर कारणामुळे अक्षर/शब्दातील/ वाक्यातील त्रुटी स्कॅन केलेल्या चित्रात पडताळून पहात दुरुस्त करणे हि कामे मुख्यत्वे करावी लागतात.

अनुक्रमणिका:छन्दोरचना.djvu वर गेल्या नंतर क्रमांक १ पासून एक एक पान (संपादनवर टिचकी मारुन) उघडत जायचे, संपादन खिडकीच्या उजवीकडे किंवा वर मूळ स्कॅन केलेले ग्रंथपानाचे चित्र पाहता येते, सोबत OCR कडून युनिकोडीतत झालेला मजकुर दिसत असतो. दोन्हीतील प्रत्येक अक्षर/शब्द/वाक्य वाचत युनिकोडीतत झालेला मजकुर स्कॅन केलेले ग्रंथपानाचे चित्रात म्हणजे मूळ ग्रंथात जसा दिसतो तसा आहे याची खात्री करणे आणि तो जसाच्या तसा नसेल तर सुयोग्य दुरुस्ती करुन मुळाबर हुकूम होईल हे पहाण्याचे साधे सोपे काम येथील मुद्रीत शोधनात असते. (शुद्धलेखन वगैरेचे नियम न लावता संदर्भ ग्रंथ मुळात आहे तसा जपला जातो, संपादकांना वेगळ्या टिपा स्वतंत्रपणे नमुद करुन जोडता येतात पण त्या बद्दलची स्टेप प्रत्यक्षात नंतर येते) प्रत्येक पानाचे मुद्रीत शोधन करुन झाले की ते जतन (प्रकाशित/सेव्ह करावयाचे).

२) पहिली स्टेप झाली की त्यानंतरची स्टेप मुद्रीत शोधन बरोबर झाल्याची खातरजमा/पडताळणी करण्याची असते. खातरजमा/पडताळणी स्टेप नंतर पान पुन्हा एकदा जतन/सेव्ह केले जाते.

३) त्या नंतरची स्टेप स्टाईल गाईड व अत्यावश्यक टिपा जोडणे अशी असते.

४) त्या नंतरची स्टेप ग्रंथातील पाने बर्‍याचदा लहान आकाराची असतात अथवा वाचन संगणक सुलभ नसते त्या पानांचे एकत्रित सादरीकरण करणे

साहाय्यासाठीची सहाय्य:Page status आणि सहाय्य:Proofread

तांत्रिक गोष्टीत गरजे प्रमाणे इंग्रजी विकिस्रोतातून साहाय्य घेतले जाते. कॉपीराईट नियमावली आणि मराठी विकिस्रोतासाठी कोणता निर्णय/संकेत(नियम) चांगला याचे निर्णय मात्र मराठी विकिस्रोताने (म्हणजे मराठी लोकांनी) स्वतंत्रपणे घ्यावयाचे असतात.

शंका व्यनि पेक्षा धाग्यावर विचारल्यास नेहमी विचारलेल्या प्रश्नांचे संकलन आणि उपलब्धता तयार करणे सोपे जाते.

धन्यवाद आणि शुभेच्छा

आदूबाळ's picture

17 May 2017 - 10:48 am | आदूबाळ

कोणता OCR वापरला आहे याची माहिती मिळेल का?

माहितगार's picture

17 May 2017 - 2:16 pm | माहितगार

गूगलचा गूगल-डॉक्स(ड्राईव्ह) सोबत उपलब्ध होणारा. पुर्वी एक-एक पान करावे लागत होते ते आता ग्रंथाचे सलग करता येते आणि बॉटने विकिस्रोतावर अतीवेगाने पान निर्मिती साधता येण्याबाबत काही प्रगती साधली गेली आहे. MKCL ग्रंथोत्तेजक सभा आणि इतर काही ग्रंथालयांचे सहकार्य मिळत आहे. या बाबत अधिक माहिती सदस्य_चर्चा:सुबोध_कुलकर्णी इथे अथवा त्यांना विकिवरुन इमेल पाठवून घेता येईल. ते या विषयावर कार्यशाळासुद्धा घेत असतात.