शोधयंत्राचा शोध - भाग १ - प्रस्तावना
(ह्या लेखमालेचे काही भाग याआधी माझ्या अनुदिनीवर आणि दुसऱ्या एका मराठी संकेतस्थळावर प्रकाशित झालेले आहेत. उरलेले भाग येथे प्रकाशित करण्याचा मानस आहे. त्याची पार्श्वभूमी मिळावी, म्हणून आधीच्या भागांची संपादित आवृत्ती येथे आधी प्रकाशित करतो आहे.)
[श्रेय अव्हेर: प्रस्तुत लेखक शोधयंत्राच्या विकसनासाठी एका संस्थेत कार्यरत आहे. परंतु ह्या लेखातील मते सर्वस्वी त्याचीच आहेत. त्या संस्थेचा येथील व्यक्त केलेल्या मतांशी काहीही संबंध नाही. तसेच ह्या संस्थेच्या शोधयंत्राविषयी आजवर प्रकाशित न झालेली माहिती लेखकाने गुप्तच ठेवलेली आहे. त्याविषयी पृच्छा करू नये :-)]
तुम्ही गूगल, याहू, मायक्रोसॉफ्ट ह्या संस्थांची नावे ऐकली असतीलच. पण इंकटूमी, आल्टाव्हिस्टा, ऑलदवेब, ओव्हर्चर ही नावे आठवतात का तुम्हाला? विश्वजाळावर आपल्याला हव्या त्या विषयाबद्दल काय लिहिले आहे ही माहिती करून घेण्यासाठी तुम्ही गूगलचे शोधयंत्र वापरले असेल. विश्वाजालाच्या एकूण प्रवाशांपैकी ६० टक्के प्रवासी गूगलचे शोधयंत्र वापरतात. ३० टक्के याहू! वापरतात, १५ टक्के मायक्रोसॉफ्टचे शोधयंत्र वापरतात. (ह्या आकड्यांची बेरीज शंभर पेक्षा जास्त होते, त्याने गोंधळून जाऊ नका. काहीजण एकापेक्षा जास्त शोधयंत्रे वापरतात.) गूगलच्या ह्या लोकप्रियतेमुळेच नुकतेच शब्दकोशात 'गूगल' हे क्रियापद 'शोध घेणे' ह्या अर्थाने अंतर्भूत करण्यात आले आहे.
हे शोधयंत्र कसे काम करते? पहिल्यांदा हे कुणी विकसित केले? गूगलचे शोधयंत्र इतके लोकप्रिय का झाले? गूगल आणि इतर शोधयंत्रात फरक काय ? आपल्याला शोधयंत्राचा फायदा होतो कारण हवी ती माहिती चुटकीसरशी मिळू शकते. पण जे लोक संकेतस्थळांवर ही माहिती चढवतात, त्यांना शोधयंत्रांचा काय फायदा आहे ? आणि एवढ्या मोठ्या विश्वजाळावरच्या माहितीचा शोध ही शोधयंत्रे निमिषार्धात घेतात तरी कशी? गूगल आणि याहू सारख्या संस्था आपल्याला ही शोधयंत्र फुकट वापरू देतात. मग त्याच्या विकसनासाठी लागणारा पैसा त्यांना कुठून मिळतो? ही एवढी बलाढ्य शोधयंत्रे अस्तित्वात असताना गेल्या वर्षात विश्वजाळावरील माहिती शोधून काढण्यासाठी सुमारे वीस ते पंचवीस नवीन शोधयंत्रांच्या संस्था स्थापन झाल्यात. त्यांचा कसा निभाव लागेल? मराठी भाषेसाठी वेगळे शोधयंत्र का नसावे?
ह्या आणि अशाच अनेक प्रश्नांची उत्तरे देण्याचा प्रयत्न मी ह्या लेखमालेत करीत आहे. यातील बरीच माहिती इंग्रजीत विकिपीडिया सारख्या स्थळावर उपलब्ध आहे. काही आठवणीतून लिहिली आहे. तपशिलात चुका आढळल्यास दुरुस्ती करावी ही विनंती.
विश्वजाल लोकप्रिय होण्या आधीही आपण सगळ्यांनी शोधयंत्रासारखी सुविधा वापरली आहे. अगदी आपल्या पाठ्यपुस्तकांत, संदर्भग्रंथांतून वापरली आहे. ही सुविधा म्हणजे अशा पुस्तकांच्या शेवटच्या काही पानावर असलेली शब्द सूची (इंडेक्स). एखाद्या पुस्तकात आपल्याला हव्या असणाऱ्या विषयावर माहिती कुठे दिली आहे, हे शोधायचे असेल, तर आपण ते पुस्तक सुरुवातीपासून वाचतो का ? तसे केले तरी माहिती सापडेलच, पण त्यापेक्षाही सोपा मार्ग म्हणजे त्या पुस्तकाच्या शब्द सूचीत तो शब्द कुठल्या पानावर आहे हे बघायचे. तो पृष्ठक्रमांक बघून थेट त्या पानावर जायचे, आणि मग फक्त त्या पानावरच त्या शब्दाचा शोध घ्यायचा.
हे तुम्ही एकदा जरी केले असेल, तर शोधयंत्रे कशी काम करतात हे तुम्हाला कळले आहे असे समजा. कारण वरवर पाहता, शोधयंत्राचा कृतिक्रम (अल्गोरिदम) हा अगदी आपल्या पुस्तकातला एखादा शब्द शोधण्याच्या कृतिक्रमासारखाच आहे.
पण पुस्तकातली ही शब्दसूची लेखक किंवा प्रकाशक कशी तयार करतो, ह्याचा विचार आपण केला आहे का? शोधयंत्राच्या विकसनात हा सर्वात महत्वाचा कृतिक्रम आहे. आपल्याला हव्या असणाऱ्या विषयाला धरून विश्वजालावरची माहिती कशी दाखवता येते, हे त्या विषयांची किंवा शब्दांची सूची कशी तयार करण्यात आली आहे यावर मुख्यत: अवलंबून असते. ह्या संबंधी खोलात जाण्या आधी आपण पुढच्या लेखात थोडा इतिहास बघू या.
[ गृहपाठ: गूगल अथवा याहूच्या शोधयंत्राला भेट देऊन आपल्या आवडत्या विषयावरील माहिती शोधा. त्या शोधयंत्राने शोधलेली माहिती तुम्हाला हव्या असलेल्या विषयाला धरून आहे का याचा अभ्यास करा.]
- प्रतिसाद देण्यासाठी येण्याची नोंद करा किंवा सदस्य व्हा

चांगला उपक्रम
सर्किटराव,
शोधयंत्राबद्दल प्रचंड कुतूहल आहे. या विषयावर मराठीतून लेखन करण्याच्या तुमच्या उपक्रमास मनःपूर्वक शुभेच्छा!
शैलेश
सहमत..
शोधयंत्राबद्दल प्रचंड कुतूहल आहे. या विषयावर मराठीतून लेखन करण्याच्या तुमच्या उपक्रमास मनःपूर्वक शुभेच्छा!
सुंदर लेख. शैलेश यांच्याशी सहमत आहे.
- माधवी.
गृहपाठ
दुसर्या संकेतस्थळावर जेव्हा मी ही अपूर्ण लेखमाला लिहिली होती, तेव्हा मला लक्षात आलं होतं की अनेक वाचकांनी 'छान, छान' असे प्रतिसाद लिहिलेत, परंतु दिलेला गृहपाठ कुणीच केला नव्हता. ह्या स्थळावर माहितीच्या अभिलाषेने येणार्या वाचकांकडून एक अपेक्षा आहे की त्यांनी दिलेला गृहपाठ व्यवस्थित करावा.
ह्या लेखाच्या वाचकांसाठी मी आणखी एक गृहपाठ देतोय. आपल्या नावविषयी शोधयंत्रांवर शोध घ्या. किती दुवे मिळतात ? आपण इतर संकेतस्थळांवर आपली टोपणनावे वापरत असाल्, त्या नावांनीही शोध घ्या.
उपक्रम हे नवीन संकेतस्थळ, आणि पूर्वीचे मराठी संकेतस्थळ ह्यात तुमचे टोपणनाव सारखे असेल, तर त्या नावाने घेतलेल्या शोधातून प्रत्येक संकेतस्थळातले किती दुवे मिळतात ?
ह्या प्रश्नांची उत्तरे ह्या लेखमालेच्या प्रतिसादात अपेक्षित आहेत.
- मिलिंद
उदाहरणार्थ
उदाहरणार्थ मी माझ्या 'सर्किट' ह्या टोपणनावाचा शोध घेतला असताना, मुन्नाभाई चित्रपटातले काही संवाद विश्वजालावर गूगलला सापडले. तो सर्किट अर्थातच मी नाही.
पहिल्या पानावर मुन्नाभाई चित्रपटाव्यतिरीक्त जे दुवे होते, त्यात संजोपरावांच्या अनुदिनीवरचा 'पहिला दिवस' ह्या लेखातला माझा उल्लेख, आणि मनोगत ह्या संकेतस्थळावरच्या 'शब्दसाधना-भूमिका' ह्या लेखावर मी दिलेला प्रतिसाद, हे दोन माझा उल्लेख करणारे दोन दुवे होते. तोच शोध याहूत घेतला असताना, त्या शोधाच्या निकालातील पहिल्या पानात मनोगतावर कुठल्या तरी नाट्य ह्या कार्यक्रमाच्या घोषणेवर मी देलेल्या एका प्रतिसादाचा उल्लेख होता.
असे का झाले ?
माझ्या खर्या नावाचा उल्लेख केला तर मात्र पहिल्या पानावर जे सर्व दुवे येतात, ते खरेच माझ्याबद्दल आहेत.
- मिलिंद
माझा शोध!
मी माझ्या अत्त्यानंद ह्या नावाने (रोमन आणि देवनागरी) गुगलवर शोध घेतला असता माझ्या जालनिशी बरोबरच इतर काही लोकांच्या जालनिशीवरील माझ्या प्रतिक्रिया,तसेच मराठी ब्लॉगनेट वगैरे ठिकाणी उल्लेख सापडतोय.तसेच प्रमोद देव(देवनागरी) ह्या नावाने शोध घेतला असताही बर्याच ठिकाणी उल्लेख सापडतोय. मात्र pramod deo ह्या नावाने शोध घेतला असता मात्र महाराष्ट्र विद्युत नियमन प्राधिकरणाचे अध्यक्ष डॉ. प्रमोद देव ह्यांच्याबद्दलचे उल्लेख सापडत आहे.
छान
[उपसंपादक महोदय/या, ह्या प्रतिसादात व्यक्तिगत उल्ल्लेख असले, तरी रोख व्यक्तिगत नाही. कृपया नोंद घ्यावी. - मिलिंद]
प्रमोदकाका,
आपल्या आत्मशोधातून एक छान मुद्दा मिळाला. त्याविषयी येथे लिहितो.
देवनागरीत प्रमोद देव असा शोध, आणि रोमन लिपीतही त्याच नावाचा शोध घेतल्यास आपल्याला वेगवेगळी उत्तरे मिळाली.
ह्यातून हे सिद्ध होते, की लिप्यंतरण गूगल सारख्या बलाढ्य शोधयंत्राला अजूनही ज्ञात नाही.
समजा दुसर्या एका संस्थेने असे शोधयंत्र बनवले, की ज्यात ही लिप्यंतराची सोय असेल, तर त्याचा इतर भाषांसाठी (विशेषतः उच्चारानुसार लिहिण्यात येणार्या भाषांसाठी) उपयोग होऊ शकेल का ?
बहुसंख्य लोकांना (ज्यांना देवनागरी लिपी कळते) प्रमोद देव म्हणजेच pramod deo हे कळू शकते, तर शोधयंत्राच्या संगणकाला हे कळण्यासाठी काय करावे लागेल ?
आणि असे कळल्यास शोधयंत्राची सुविधा अधिक चांगली बनवता येईल का ?
याचाच अर्थ, शोधयंत्रे अजूनही बाळबोध/प्राथमिक स्वरूपातच आहेत. ह्यांत आणखी जास्त सुविधा करता येतील, नाही का ?
विचार करण्यासारखी गोष्ट आहे.
(गृहपाठ केल्याबद्दल आभारी आहे.)
- मिलिंद
मीपण केला गृहपाठ
मराठीत माझे पूर्ण नाव टंकून शोध केला असता फक्त माझी अनुदिनीच दिसली. (काही वर्षापूर्वी मला कोणीतरी 'तू केलेल्या पोळ्या तूच खा' म्हणायचे तसे 'तू लिहीलेलं सगळं तूच शोध आणि तूच वाच!') आंग्ल भाषेत टंकून शोध घेतला असता माझ्याच नावाची कोणी व्यक्ती शास्त्रीय संगीतात नाव कमावून आहे असे दिसते. (ती जेकील मी हाईड.ती सूर मी असूर.) तसेच माझ्या नावाची कोणी व्यक्ती पी एच डी आणि माझ्या नावाची कोणीतरी नासात आहे हे पाहून छान वाटले.
एकंदर शोधयंत्राला अजून मराठी लिपीची नीटशी सवय नाही असे दिसते. (जर असा काही कोड लिहीला आणि त्यात उच्चाराप्रमाणे अक्षरगटाचे मिळून एक मराठी अक्षर अशी व्याख्या प्रत्येक अक्षरासाठी लिहीली तर? उदा. के कॅपिटल एस एच ही अक्षरे एकत्र मिळाली की मराठी 'क्ष' आणि इंग्रजी के एस एच शोधा, कॅपिटल एन मिळाला की मराठी ण साठी शोधा असे.अर्थात तसे केलेही असेल त्यांनी आधीच.)
सुचवून बघा
उदा. के कॅपिटल एस एच ही अक्षरे एकत्र मिळाली की मराठी 'क्ष' आणि इंग्रजी के एस एच शोधा, कॅपिटल एन मिळाला की मराठी ण साठी शोधा असे.अर्थात तसे केलेही असेल त्यांनी आधीच.
नाही. माझ्या माहितीत तरी अशी सोय अद्याप ह्या तीन मोठ्या शोधयंत्रात नाही. (मध्यंतारी भारतीय भाषांसाठी बनवलेल्या गुरुजी.कॉम ह्या शोधयंत्राविषयी वाचले होते. त्यांनी अशी सोय केली असल्यास माहिती नाही.)
लिप्यंतरासाठी (ट्रान्सलिटरेशन) बरेच पर्याय आहेत. त्यातला सर्वात जुना (माझ्या माहितीतला, हे सांगणे न लगे) हा पर्याय श्री. अविनाश चोपडे ह्यांनी सुमारे १७ वर्षांपूर्वी आय-ट्रान्स ह्या आज्ञावलीसाठी निर्माण केलेला आहे. तो सहज वापरता येऊ शकला असता. पण कदाचित इतर भाषांत शोध घेणारे ग्राहक इतक्या मोठ्या संख्येने ह्या शोधयंत्रांना मिळाले नसावे. म्हणून ह्या कामाला महत्व देण्यात आले नाही.
ह्यातून दुसरा एक (वरवर अगदी साहजिक वाटणारा) मुद्दा मांडू इच्छितो. ग्राहकांच्या मागणीनुसार आणि मागणी करणार्यांची संख्या जास्त असेल तरच, संकेतस्थळांवरती, अथवा तंत्रज्ञानाधारित संस्थांकडून सुविधा उपलब्ध होत असतात.
- मिलिंद
याहू
बहुधा याच कारणामुळे काही दिवसांपूर्वी ७ प्रादेशिक भाषांमध्ये याहूने सुविधा चालू केली तेव्हा मराठीचा त्यात समावेश केला गेला नाही.
मात्र मराठीपेक्षा कमी भाषकसंख्या असलेल्या कन्नड, तमीळ, मल्याळम आणि गुजराती यांचा समावेश केला गेला.
दुवा
संख्या जास्त असली तरी मराठी भाषकांकडून तशी मागणी नसावी.
मराठीवर काम सुरू आहे
याहू!चे मराठी चावडी चे काम सुरू आहे असे खात्रीलायक सूत्रांकडून कळते.
- मिलिंद
मुंजाला पर्याय
१३ (अशुभ) पानांचे आले हे बघून बरे वाटले !
हरवलेले गवसले
उडालेला लेख सापडला.
धन्यवाद मिलींद साहेब
आताच कॉपी पेस्ट करुन साठवून ठेवलाय.
ज्यांना लेखावर अभिप्राय द्यायचे असतील त्यांनी गुगल मध्ये जाउन पारावरचा मुंजा हे मराठीत लिहावे लिहीलेला लेख तेथे गवसेल.
हिप् हिप् हुर्रे
मुंजासाहेब
उपक्रमावरून काढून टाकला असला, तरी सुदैवाने गूगलने त्याची साचवण केली, त्यामुळे हा उत्कृष्ट लेख वाचायला मिळाला !
शोधयंत्रांचे असेही उपयोग होतात. गूगलचा विजय असो !
आता तुम्ही तो साठवून ठेवला आहेच.
तेव्हा आपल्या अनुदिनीवर (किंवा त्या दुसर्या संकेतस्थळावर) सदर लेख आणि त्याचे पुढचे भाग प्रकाशित करावे, ही नम्र विनंती.
आपल्या निरीक्षणशक्तीचे कौतुक करावेसे वाटते.
लेख खरोखरच सुंदर आहे.
- मिलिंद
सापडलेला लेख
ज्या सदस्यांना सदर लेख शोधण्याचा उत्साह नाही त्यांच्यासाठी हा दुवा.
- मिलिंद
अनुदिनी
अनुदिनीवर लिहीण्या इतपत अजून मराठी साईटस् वर सवय नाही कींवा तेव्ह्ढे काही लिहलेलेही नाहीए. इतर साईट्स् पैकी मी फक्त मायबोलीचा सदस्य आहे व माझे शब्द मनोगत येथे वाचन करतो. सर्वच साईट्स चे मेंबर होण्यात अर्थ नाही असे मला वाटते म्हणुन होत नाही. असेही कटू अनुभव सर्वच ठिकाणी येतात मग सगळीकडे मेंबरशीप घेण्यात काय अर्थ आहे ते नाही कळत. मराठीत लिहीत्या/वाचता येण्याजोग्या अजून कोणत्या साईटस् आहेत त्याची माहीती देवू शकाल का ?
धन्यवाद.
छान/क्रियापद/गृहपाठ
लेखमालिका पुन्हा सुरू झाली ते बरे झाले.
हो. googling मराठीत गुगलणे/गुगलून काढणे हे सर्रास वापरले जाते. पण गूगल चा मात्र या प्रकाराला विरोध आहे. अधिक माहिती इथे.
वर दिलेल्या बातमीचा शोध गूगल वापरूनच घेतला आहे. आपण शोधासाठी काय शब्द भरतो, शब्दरचना कशी करतो त्यानुसार निकालात बराच फरक पडतो असे वाटते.
बरोबर आहे
आपण शोधासाठी काय शब्द भरतो, शब्दरचना कशी करतो त्यानुसार निकालात बराच फरक पडतो असे वाटते.
सर्व शोधयंत्रांचे मनकवडे बनण्याचे प्रयत्न सुरू आहेतच. बुश असे लिहिले तर तुम्हाला अमेरिकेच्या अध्यक्षाविषयी माहिती शोधायची आहे की झाडाझुडपांविषयी हे शोधयंत्राला कसे कळू शकेल, ह्याबद्दल बरेच संशोधन सुरू आहे.
- मिलिंद
गृहपाठ
पूर्ण नाव :
पदवीप्रदान समारंभ, याहू व्यक्तिमत्व, गूगल ग्रूप्स मधील पाने, इत्यादी (१ पान)
ई-नाव :
विकीपीडिया, स्टंबल, ब्लॉगस्पॉट, गूगल अर्थ, वर्डप्रेस, डिलीशिअस वरील सदस्यत्व व इतरांच्या अनुदिन्यांवरील प्रतिसाद , (८ पाने)
असंबद्ध विशेष : याच नावाचा एक 'ट्रस्ट'
टोपण नाव :
अनेक, बहुभाषीय पाने
~ तो ~
एक शंका
सर्किटसर,
सर्वप्रथम हा विषय आणि त्यावरील लिखाण पुनःश्च सुरू केल्याबद्दल अभिनंदन! (याचे आतील कारण असे की पूर्वी या विषयावरील सर्वच भाग वाचले नव्हते. आता वाचण्याचा मानस आहे. असो.)
मी गृहपाठ केला नाही. शिक्षक शाळेत शिकवताना, बाकाखाली वही लपवून घरी न केलेला अभ्यास साइड बाय साइड वर्गातच उरकणार्या विद्यार्थांत माझी गणना करावी. (ह. घ्या.) मनोगत किंवा उपक्रम यापेक्षा जास्त वेळ गूगल आणि विकिवर काहीतरी शोधण्यात जातो.
(शेवटच्या बाकावरील) प्रियाली.
एक शंका:
गूगलवर एक शब्द शोधला, जसे "पार्थेनॉन" तर सर्वात प्रथम विकिपीडियाचा दुवा दिसतो. असे बर्याच शब्दांसाठी होते. येथे बहुधा १००% संबंध (रेलेवन्स्) शोधला जातो असे वाटते. तो कसा याचा खुलासा कदाचित आपण येत्या लेखात कराल असे वाटते परंतु शोधयादीत विकिपीडियाच सर्वप्रथम दिसतो असे का? (म्हणजे प्रायॉरिटी सेटींग असते का?)
विकीपीडिया
संबंधाच्या अचूकतेवर (ऍक्यूरेट रेलेवंस) वर भर दिला जातोच. हे पुढच्या भागांत येईलच. पण जी पृष्ठे त्या विषयासंबंधी आहेत, त्यांचा आपापसात क्रम ठरवण्यासाठी जी पद्धत वापरण्यात येते, त्यातून विकीपीडियाची पृष्ठे पहिल्या क्रमांकावर यायचीच असे नाही. त्यामुळे गूगल आणि याहूने आपापल्या कृतिक्रमांत बदल करून विकीपीडियाचे महत्व कृत्रिमतेने (आर्टिफिशिअली) वाढवले आहे.
- मिलिंद (सर)
ता.क. पहिल्या वर्गातच स्कॉलरशिपची तयारी करायला घ्यावी अशी शंका आली आपल्याला :-)
पेज रँक
मला माझ्या मित्राने पेज रँकबद्दल सांगितलेले स्मरते. त्यावरुन क्रमांक ठरविले जातात असेही कळाले. याचा विचार करता आणि विकिपेडीयाचे पेज रँक काढले असता संबंध बरोबर जुळतो असे निदर्शनास आले आहे. बाकी आपण सांगाल ते बरोबरच असेल यात शंका नाही. (पण म्हणून मला आलेल्या शंकेला कोणी "लघुशंका" म्हणू नये ही अपेक्षा)
अनिरुद्ध दातार
सर्किटदादा..
लवकर शोधयंत्र या विषयावर लेख लिहा. याविषयी माहीती जाणून घ्यायला आवडेल आणि गृहपाठ का दिलात तो करता येत नाही म्हणूनच तुमचा क्लास लावला की.
आपला(विधार्थी)
कॉ.विकि
लेखमाला
या लेखमालेचे काही भाग वाचले होते. सर्व भाग वाचायला आवडेल.
गृहपाठ :
नाव : राजेंद्र क्षीरसागर
माझे जुने संकेतस्थळ, काही शोधनिबंध, एक प्रोजेक्ट मिटींगचा कार्यक्रम
अनुदिनी येणे अपेक्षित होते पण तसे झाले नाही. मात्र पहिल्या पानावरील सर्व दुवे माझेच होते.
इ-नाव दिल्यावर काहीच येत नाही. :(
राजेंद्र
गृहपाठ
साचा - काय शोधले, शोधयंत्राचे नाव(एकूण दुवे, कामाचा दुवा कितवा होता)
प्रयोग आणि निकाल -
पुण्यातील मिसळमंदिरे - गुगल (०), याहू! (०), एमएसएन(०)
पुणे मिसळ - गुगल (२१, नाही), याहू! (१९, पांचवी नोंद), एमएसएन(५, नाही) (विजेता, याहू! शोधयंत्र. यशस्वी दुवा - http://www.manogat.com/taxonomy/term/78?page=5).
pune misal - गुगल (८६३, पहिलीच नोंद), याहू! (८३९, चौथी नोंद), एमएसएन(६०५, पहिलीच नोंद) (विजेता, याहू! कारण मी जे शोधत होतो त्याचा नेमका दुवा तेथे मिळाला. यशस्वी दुवा - http://sigfood.org/Pune?page=2).
shailesh khandekar - गुगल, याहू! आणि एमएसएन या तीनही शोधयंत्रात सगळ्यात पहिलाच दुवा हा माझ्या अनुदिनीचा येतो. एकूण किती दुवे येतात ते मुद्दाम मोजले नाही.
शैलेश खांडेकर - गुगलमध्ये पहिला दुवा मराठी विकिपिडीयाचा येतो, दुसराच दुवा अनुदिनीचा येतो. याहू! आणि एमएसएन मध्ये पहिलाच दुवा अनुदिनीचा येतो.
कुतूहल -- इंग्रजीत कर्ता आणि कर्म यांचा संबंध नेमका व्यक्त करण्यासाठी सहसा इतर शब्दांचा आधार घ्यावा लागतो. जसे - misal in pune, परंतू शोधयंत्रे in, of सारखे शब्द गाळतात. हे एका दृष्टीने योग्य आहे. मराठीत विभक्तीमुळे हे काम सोपे होते, जसे "पुण्यातील मिसळ". शोधयंत्रे मराठीच्या या गुणधर्माचा वापर त्यांच्या कृतिक्रमात करतात का?
शैलेश
मस्त
वर्गात नेहमी एखाद दुसरा विद्यार्थी असा असतो, की धड्याच्या शेवटीचे एक गणित सोडव म्हटले असले, तरी सगळी गणिते सोडवतो. शैलेश हे तसेच अभ्यासू विद्यार्थी आहेत, हे वरील प्रतिसादावरून स्पष्ट होते :-)
वेगवेगळ्या शोधयंत्रांत वेगवेगळे दुवे येण्याचे कारण म्हणजे त्यांनी वापरलेले कृतिक्रम, विविध स्थळांना दिलेले महत्व, इत्यादि.
गूगल, याहू, आणि मायक्रोसॉफ्ट ही शोधयंत्रे सध्यातरी इंग्रजीव्यतिरीक्त काही थोड्या भाषांचेच विश्लेषण करतात. उदा. चिनी, जपानी, कोरियन, फ्रेंच, जर्मन्.
मराठी, हिंदी वगैरे शब्दांचे पृथक्करण करण्याच्या भानगडीत पडता नाहीत.
ह्या शब्दांचे पृथक्करण करणारा (त्यापासून मूळ शब्द वेगळा करणारा) कृतिक्रम आपल्या डोक्यात असेल, तर सरळ बंगलोर ला जाऊन याहू! च्या कार्यालयात अर्ज करा. (मी पाठवले आहे असे सांगा, म्हणजे मला रेफरल मिळेल. :-)
- मिलिंद
उत्तम
लेखमालेचा विषय आणि कल्पना उत्तम आहे. मनोगतावर प्रकाशित झालेले लेख तेव्हा वाचलेले होतेच. मात्र येथे संपादित आवृत्ती असल्याने पुन्हा वाचते आहे.
गृहपाठ -
गृहपाठ केला. देवनागरी आणि रोमन अशा दोन्ही लिपींमध्ये माझे नाव देऊन याहू व गुगलच्या शोधयंत्रामध्ये शोध घेतला. अपेक्षित दुवे मिळाले. देवनागरीतून शोध घेतला असता याहू व गुगल मध्ये माझ्या दोन्ही अनुदिन्यांचे (वातकुक्कुट, विवस्वान)दुवे सापडले. मात्र रोमन लिपीतून् शोध घेता गुगलने दोन्ही अनुदिन्या दाखवल्या, याहू ने मात्र एकच (वातकुक्कुट) दाखवली. असे का झाले असावे? वातकुक्कुटावर लेखांची संख्या विवस्वानाच्या तुलनेत अधिक आहे. त्यामुळे वातकुक्कुटावर माझे नाव विवस्वानाच्या तुलनेत जास्त वेळा आलेले आहे. ह्या वारंवारितेचा संबंध याहूने एक अनुदिनी वगळण्याशी असावा का?
अवांतर -
ही लेखमाला आधी मनोगतावर प्रसिद्ध झाली होती. असे असताना लेखामध्ये आणि प्रतिसादामध्ये मनोगताचा स्पष्ट उल्लेख न करता "दुसरे एक मराठी संकेतस्थळ" असा उल्लेख केलेला खटकला.
अनुदिन्या
आपली वातकुक्कुट ही अनुदिनी वर्डप्रेस वर आहे. विवस्वान कुठे आहे ? ब्लॉगर वर आहे का ? कारण काय असावे, हे लगेच सुचत नाही. बघून सांगतो.
- मिलिंद
अवांतरः इतर स्थळांचा नावानिशी उल्लेख शक्यतो टाळला आहे. कारण, कुणाला काय खटकेल काही सांगता येत नाही. आणि लेख हा शोधयंत्राविषयी असल्याने, पटकन शोध घेऊन त्या संकेतस्थळाचे नाव वाचकांना कळेलच.
विवस्वान
विवस्वानही वर्डप्रेसवरच आहे.
तुमचा लेख मनोगताव्यतिरिक्त इतरही काही संकेतस्थळांवर प्रकाशित झालेला असता आणि तुम्ही "इतर काही संकेतस्थळांवर" असा उल्लेख केला असता तर ते खटकले नसते. मात्र तसे नाही. (तुमची अनुदिनी वगळता) केवळ मनोगतावर तो पूर्वी प्रकाशित झाला असल्याने मनोगताचा स्पष्ट उल्लेख आवश्यक आहे असे माझे मत आहे. "माझी लेखमाला पूर्वी मनोगतावर प्रकाशित झाली होती" ह्या वाक्यामध्ये कुणीही आक्षेप घेण्यासारखे काय आहे समजले नाही. त्यामुळे आक्षेपाची, खटकण्याची भीती अनाठायी वाटली. असो.
दोन्ही आहेत
वरदा,
विवस्वान देखील याहू!च्या शोधयंत्रात दिसते, फक्त ते शेवटच्या पानावर आहे. ह्याची कारणे अनेक असू शकतात. मला वाटते ते असे, की वातकुक्कुट ह्या अनुदिनीला इतर स्थळांवरून अनेक दुवे आलेले असतील. विवस्वानला नसतील.
हे आत्ताच मी पडताळून पाहिले. याहू!त एखाद्या स्थळाला बाहेरून किती दुवे आले आहेत हे बघायचे असल्यास link:http://url-address असे द्यावे.
त्यानुसार वातकुक्कुट ला बाअहेरून ३४८ दुवे आणि विवस्वानला बाहेरून १५० दुवे आहेत. म्हणून वातकुक्कुट पहिल्या पानावर दिसतो, आणि विवस्वान शेवटच्या.
(तू उपस्थित केलेल्या दुसर्या मुद्द्याविषयी सार्वजनिक चर्चा करत नाही. व्यनि पाठवीन.)
- मिलिंद
मस्त आईडिया..
आणि लेख हा शोधयंत्राविषयी असल्याने, पटकन शोध घेऊन त्या संकेतस्थळाचे नाव वाचकांना कळेलच.
ही आईडिया बाकी मस्त आहे! ;)
तात्या.
गूगल बॉम्ब
गूगलबॉम्ब हा गूगल साठीच लागू आहे का? असल्यास असे का? (नसल्यास याहू या मागे आहे का ;) )
अवांतरः गूगल वर गूगल शोधल्यास २१ वा दुवा विकिपीडियाचा येतो. या आधीचे सारे गूगलचे स्वतःचे. गूगल स्वतःचे वर्णन "वापर करणार्यांना शोधायला मदत" वगैरे शब्दात करते.
याहू शोधल्यास याहून अधिक दुवे याहूचे येतात. याहूचे वर्णन 'सर्वाधिक भेट दिले जाणारे स्थळ' असे येते!
बॉम्बचा उपद्रव
गूगल बॉम्बचा उपद्रव मायक्रोसॉफ्ट आणि जॉर्ज डब्ल्यू बुश यांना झाल्याचे आठवते.
गूगल बाँब
असल्यास असे का? (नसल्यास याहू या मागे आहे का ;) )
नाही. गूगल हे सर्वाधिक वापरले जाणारे शोधयंत्र असल्यामुळे लोकांना गूगलचे शोधनिकाल विद्रूप करणे जास्त आवडते (जसे संगणकावरील विषाणू लिहिणारे लोक विंडोज साठी विषाणू लिहितात.). दुसरे कारण की गूगलचे शोधनिकाल ९९.९९९ टक्के कृतिक्रमाने बनवले असतात. (मानवी संपादकांंची मदत घेतली जात नाही.) इतर शोधयंत्रात कृतिक्रमाने दिलेल्या निकालांतून मानवी संपादकांनी नोंद केलेली पृष्ठे गाळण्यात येतात. त्यामुळे इतर शोधयंत्रांवर असे करणे कठीण आहे.
- मिलिंद
हे "गूगल बॉम्बिंग' भलतेच आहे
गूगलवरच शोध घेतला असता हे संकेतस्थळ मिळाले. बापरे!
एकूणच सर्किटवून टाकणारी माहिती.
हे तर पाहा..
हे तर पाहा! हे भलतेच पान 'वेपन्स ऑफ मास डिस्ट्रक्शन' चा शोध घेतल्यास येत असे.