"कुठे काय" विषयी थोडेसे...
नमस्कार
(ह्या संकेतस्थळावर इतर संकेतस्थळांविषयीचा मजकूर वाचला आणि हा लेख लिहिण्यास धीर आला. सदर लेख ही कुठल्याही प्रकारची जाहिरात समजू नये तसेच सदर संकेतस्थळाच्या नियमांत बसत नसल्यास काढून टाकला तरी चालेल.)
मी मराठीतली काही प्रमुख संकेतस्थळे नेहेमी वाचतो. अर्थात प्रत्येक वेळी सर्वच मजकूर वाचायला जमतो असे नाही. पण गेल्या काही महिन्यांमधे मी वैयक्तिकरीत्या जास्त कार्यमग्न झालो आणि त्याचप्रमाणे संकेतस्थळांवर होणार्या लिखाणाची वारंवारिताही वाढलेली दिसली. बराच चांगला मजकूर वाचायचा राहून जाउ लागला आणि प्रत्येक वेळी सगळीच्या सगळी स्थळे बघणे अवघड होउन बसले. ह्यावर काही उपाय केला पाहीजे असे माझ्या मनाने घेतले आणि मग मी त्या दृष्टीने शोध घ्यायला सुरुवात केली. सगळ्यात प्रथम विचार मनात आला तो आरएसएस फीड चा. पण त्यात २ अडचणी दिसल्या - सगळ्या संकेतस्थळांचा फीड नव्हता आणि ज्यांचा होता तो माझ्या दृष्टीने उपयोगाचा नव्हता. मग नजर गेली 'मराठी ब्लॉग विश्व ' वर - अर्थात ते फक्त ब्लॉग पुरतेच मर्यादित होते. पण आपणही अशाच प्रकारचे काही तरी करावे ह्या विचाराने उचल खाल्ली.
मग शोधता शोधता नजर पडली - 'स्क्रीन स्क्रेपिंग' वर - तसच काहीसं करुन बघायच अस ठरवल. मग एक संकेतस्थळ निवडल - छोटासा कोड लिहिला आणि संपूर्ण मजकूर माझ्या संगणकावर उतरवून घेण्यात मला यश मिळाले. नंतरची पायरी म्हणजे - त्यातल्या हव्या त्या विभागाच्या हव्या त्या नोंदी वेगळ्या काढणे. हे काम अर्थात थोडे किचकट होते आणि आधी कधी केले नसल्यामुळे नीटशी कल्पना नव्हती. अजून तपास करता 'रेग्युलर एक्स्प्रेशन्स' वापरावी लागतील असे कळले. हे काम थोडे परिचयाचे असले तरी एवढ्या मोठ्या प्रमाणावर आधी केले नव्हते. इथे मदतीला धावून आले - एक सर्वांगसुंदर एप्लिकेशन 'एक्स्प्रेस्सो ' - रेग्युलर एक्स्प्रेशन्स लिहिणार्यांसाठी गरजेची गोष्ट. ह्याच्यामुळे काम खूपच भरभर होउ लागले. एकदाची समस्या एका संकेतस्थळापुरती सुटली आणि मार्ग सापडला.
मग विचार सुरु झाला - की एकापेक्शा अधिक संकेतस्थळे जर जोडायची असतील (आणि तशी गरज अर्थातच होतीच) - तर नीट विचार करुन 'आराखडा' ठरवावा लागेल.
विचारात घेतलेल्या गरजा अशा होत्या -
१ आज्ञावलीत बदल न करता गरजेप्रमाणे संकेतस्थळे जोडता यायला हवीत.
२ संकेतस्थळांचे विभाग (कथा, कविता, चर्चा) नीट हाताळता यायला हवेत.
३ एखादे संकेतस्थळ जर एखाद्या दिवशी उघडत नसेल तर ती बाब नीट हाताळता यायला हवी.
४ बर्याच स्थळांवर 'अर्धवट दुवे' असतात - ती व्यवस्थित हाताळली गेली पाहिजे.
५ कुठे कमी तर कुठे जास्त पोस्ट्स ची संख्या नीट हाताळता यायला हवी.
६ आज्ञावलीत कुठेही हार्ड कोडींग नको.
७ मजकूराचे 'बाह्यांग' (दर्शनिय स्वरुप) हे 'साचा' (टेंप्लेट) स्वरुपातच वापरावे.
८ मुख्यपृष्ठावर 'सगळे एकत्रित' दिसले पाहीजे -ते सुद्धा दिलेल्या संख्येच्या प्रमाणातच.
एवढा सगळा विचार केल्यावर मग 'बाह्य विदा मदतीने' (मेटा डाटा) हा प्रश्न बर्याच अंशी सोपा करता येईल असा विचार केला आणि 'बाह्य विदा' एक्सएमएल मधे साठवायचे ठरविले. चुकादुरुस्तीस सोपे जावे म्हणून डॉट नेट मधे करायचे ठरविले. जमले. मग अजून संकेतस्थळे जोडली. पहा - "कुठे काय" - सध्या दर दोन तासांनी अद्ययावत होते.
सध्याच्या आवृत्तीतील अडचणी
- सगळ्याच संकेतस्थळांची दिनांक निर्देशन रचना सारखी नसल्यामुळे सगळीकडून नीट तारखा मिळणे कठिण जाते.
- त्याचमुळे (आणि वेगळ्या आराखड्यामुळे / आज्ञायनामुळे) तारीखवार वर्गवारी सध्या शक्य होत नाहीये
उपयोग
- सगळ्या संकेतस्थळांवरील माहिती एकत्रित एकाच ठिकाणी
- संकेतस्थळांवरील भार थोडातरी कमी होईल (अशा गोड स्वप्नात दंग :) )
- अजून कुठल्याही अशाच प्रकारच्या योजनेसाठी उपयोग
(हे सगळे लिहिण्याचे कारण म्हणजे एकतर आपल्यापर्यंत हे पोचवावे आणि ही जी आज्ञावली आहे तीचा इतर बाबतीत अगदी सहज उपयोग करुन घेण्यासारखा आहे. उदाहरणार्थ : सध्या अर्थिक मंदी असल्यामुळे बरेच लोक नोकर्या शोधत आहेत - अशावेळी ही आज्ञावली वापरुन एक 'सगळ्या नोकरी शोध संकेतस्थळांवरचा' विदा एकत्र करुन प्रदर्शित करणे सहज शक्य आहे.)
भविष्यातील योजना
१ मुक्तस्त्रोत भाषेत आज्ञायन
२ होस्टींग सर्व्हर वर स्थापना आणि तिथूनच अद्ययावत करण्याची सोय (हा प्रकार महाग आहे असे समजते)
३ गुगल विजेट्स सारखी 'उघड झाप'
आपल्या सूचनांचे स्वागत आहे. कोणाला इच्छा असल्यास आज्ञावली उपलब्ध करुन दिली जाईल.
आपला नम्र
-- वाचक
वाचने
4989
वाचनखूण
प्रतिक्रिया
22
उपक्रम छान आहे.
उपक्रम
एकदम आवडलेल आहे
In reply to एकदम आवडलेल आहे by गोगोल
अजुन एक
In reply to अजुन एक by गोगोल
माझ्या
मला लूक
In reply to मला लूक by भडकमकर मास्तर
+१
वाचकराव
तुमचा
शुभेच्छा
In reply to शुभेच्छा by सहज
मी होमपेज
स्तुत्य उपक्रम!
उत्तम
मस्त आहे
स्क्रीन स्क्रेपिंग
आणखी एक ,
आवडला प्रकार
धन्यवाद आणि काही उत्तरे
"कुठे काय" ला स्वत:चे घर
खूप आयटीवालं टेक्निकल असल्यामुळे पूर्णपणे डोक्यावरून गेले
In reply to खूप आयटीवालं टेक्निकल असल्यामुळे पूर्णपणे डोक्यावरून गेले by सुधीर काळे
साईट कशी वाटली ते तरी सांगा
खूप छान