शोधयंत्राचा शोध - भाग ११ : एका महासत्तेचा उदय

शोधयंत्राचा शोध घेता घेता आपण पोहोचलो आहोत १९९७ मध्ये. स्थळ, अमेरिकेतील पश्चिम किनाऱ्यावरच्या उत्तर कॅलिफोर्नियातील उपसागरीय भागातले (बे एरिया, सिलिकॉन व्हॅली) एक विद्यापीठ, स्टॅनफोर्ड. येथे संगणक विज्ञानात पीएचडी करण्यासाठी आलेले दोन विद्यार्थी, लॅरी पेज आणि सर्जे ब्रिन. त्यांच्यापेक्षा दोनच वर्षांनी त्याच विद्यापीठात वरिष्ठ असणाऱ्या दोन विद्यार्थ्यांचे, डेव्हिड फायलो आणि जेरी यांग, ह्यांच्या महाजालाच्या नवीन तंत्रज्ञानाधारित संस्थेचे यश ह्या दोघांनी जवळून पाहिलेले होते. आणि त्यांच्या वाढत्या संस्थेला, याहू! ला, महाजालाचे वर्गीकरण मानवी मदतीने करताना झालेले कष्टदेखील त्यांना जवळून पहायला मिळालेले होते. ह्या काळात याहूचे शोधयंत्र सर्वात प्रगत असले, तरी हे शोधयंत्र संकेतस्थळाच्या पृष्ठांत असलेल्या शब्दांवरूनच त्या संकेतस्थळांचे वर्गीकरण करायचे.

म्हणजे, समजा तुम्ही तेव्हा "बिल क्लिंटन" असा शोध त्या शोधयंत्रातून घेतला असता, तर याहू!कडे नोंद असणाऱ्या सर्व संकेतस्थळांतील पृष्ठांतील, ज्या पृष्ठांत सर्वाधिकवेळा "बिल क्लिंटन" असे लिहिलेले आहे, ती पृष्ठे तुम्हाला दिसली असती. पण, ही पृष्ठेच तुम्हाला हवी आहेत, हे कसे ठरवायचे ? ज्या पृष्ठावर "बिल क्लिंटन" असे सर्वाधिक वेळा लिहिले आहे, तेच शोधकर्त्याला हवे असलेले पृष्ठ आहे, हे कशावरून ? समजा, मी, म्हणजे एका सामान्य (पण बुद्धिमान, किंवा "चालू") संकेतस्थळचालकाने विचार केला, की बिलबुवांनी मोनिककाताईंशी लफडे केल्याची बातमी सध्या चर्चेत आहे, त्यामुळे बिल क्लिंटन आणि मोनिका लुविनस्की, ह्यांचा शोध याहू! वर विश्वजालाचे प्रवासी मोठ्या प्रमाणात घेणार, हे नक्की. म्हणून माझ्या संकेतस्थळावर ते प्रवासी यावेत (आणि माझ्या संकेतस्थळावरच्या जाहिराती त्यांनी पाहाव्या) म्हणून, मी माझ्या संकेतस्थळावर एक पृष्ठ असे तयार केले, की त्यात शंभर वेळा बिल क्लिंटन आणि शंभर वेळा मोनिका लुविनस्की लिहिले. त्या संकेतस्थळाची याहू! वर नोंद केली. जगातील याहू! वर नोंद झालेल्या इतर कुठल्याही संकेतस्थळापेक्षा, माझ्या ह्या संकेतस्थळावर बिल क्लिंटन हे नाव अधिक दिसते, म्हणून याहू!चे शोधयंत्र माझे संकेतस्थळ त्यांच्या शोधनिकालांत अधिक वर दाखवेल, आणि विश्वजालावरचे अनभिज्ञ प्रवासी माझ्या संकेतस्थळाला भेट देतील.

पण, ते नक्कीच निराश होतील. कारण, जेव्हा ते "बिल क्लिंटन" चा शोध घेतात, तेव्हा त्यांना हवी असते बिल क्लिंटनची माहिती. पण ती तर माझ्या स्थळावर अजीबात नाही ! त्यात आहे फक्त शंभर वेळा "बिल क्लिंटन" असे लिहिलेले! स्वत:ला हवी असलेली माहिती शोधयंत्रातून मिळाली नाही, की ते शिव्या देतात शोधयंत्राला, खरे ना ?

हे असे कसे मूर्ख शोधयंत्र, ज्याला मला काय हवे तेदेखील कळत नाही ?

आणि त्यामुळे, शोध घेणाऱ्याला नक्की काय हवे आहे, हे समजून घेणे, ही शोधयंत्राची गरज बनते. आणि दुसरी महत्वाची गरज अशी की जे शोध घेणाऱ्याला हवे आहे, त्याचीच माहिती देणारी संकेतस्थळांवरची पृष्ठे त्याला दाखवायची.

अर्थातच, कुठल्याही शोधयंत्राला दोन समस्यांचे समाधान शोधणे आवश्यक ठरते:

१. शोधयंत्राच्या ग्राहकाला काय हवे आहे ?
२. स्वत:कडे असलेल्या संकेतपृष्ठांपैकी कुठली पृष्ठे त्याची गरज भागवतात ?

लॅरी पेज आणि सर्जे ब्रिन, ह्यांनी वरच्या दोन समस्यांपैकी दुसऱ्या समस्येला हाताळायचे ठरवले.

"बिल क्लिंटन" असे नाव असणारी लाखो पृष्ठे संकेतस्थळांवर विखुरलेली असतील. त्यातील "बिल क्लिंटन" विषयी माहिती असलेली पृष्ठे कोणती, हे कसे ओळखावे ? इथे विषयोचितता (रिलेव्हन्स, relevance) ही संकल्पना उदयास येते. करोडो संकेतपृष्ठांतून विचारलेल्या माहितीस कुठले संकेतपृष्ठ सर्वाधिक उचित आहे ? हे संगणकाद्वारे ठरवणे, म्हणजे विषयोचिततेच्या संगणनाचे मुख्य उद्दिष्ट.

त्यावेळी, जगातील संकेतपृष्ठांपैकी ९९ टक्के पृष्ठे ही इंग्रजी भाषेत होती (आता ७० टक्के असतील). ह्या पृष्ठांत नक्की काय लिहिले आहे, हे कळण्यासाठी संगणकांना इंग्रजी शिकवणे आवश्यक आहे. पण गेली चाळीस वर्षे संगणकांना इंग्रजी शिकवता शिकवता अनेक सुपीक डोकी निकामी झालीत! संगणकांना इंग्रजी येण्याची वाट पहात राहिले असते, तर लॅरी आणि सर्जी म्हातारे आणि कंगाल राहिले असते! कुठलातरी नवीन (आणि सोपा) मार्ग शोधायला हवा, हे त्यांना कळले. आणि त्यांनी ह्या कठीण समस्येला एक समाधान शोधून काढले. त्या संकल्पनेचे नाव आता सर्वश्रुत आहे (किमान बहुश्रुत तरी आहे) : पेजरॅंक !

प्रत्येक संकेतपृष्ठावर काही शब्द असतात. पण सदर पृष्ठ सदर शब्दांसाठी माहितीपूर्ण आहेत का, हे ठरवण्यासाठी त्या पृष्ठाला त्या शब्दासंदर्भात दिलेले गुण, म्हणजे "पेजरॅंक". अर्थात ही त्या संज्ञेची दहा वर्षानंतरची व्याख्या झाली. १९९७ मध्ये लॅरी पेज आणि सर्जे ब्रिन ह्यांनी पेजरॅंकची जी व्याख्या केली, त्यात आजच्या व्याख्येतले "शब्दासंदर्भात" हे गाळलेले होते. एका संकेतपृष्ठाची एक पेजरॅंक, त्या पृष्ठातील सर्व शब्दांसाठी ही एकच!

वाचकहो, ही लेखमाला प्रकाशित करायला सुरुवात केल्यानंतर आपल्यातल्या अनेक बुद्धिमान वाचकांनी माझ्याशी संपर्क साधून, त्यांना येणाऱ्या विविध कल्पना, इतरांना आधीच आलेल्या आहेत, म्हणून माझ्याकडे खेद व्यक्त केला आहे. त्या सर्वांना मी ह्या उदाहरणातून एक दिलासा देऊ इच्छितो. (मलाही माझ्या नवीन वाटणाऱ्या कल्पना, इतरांनाही आधिच आलेल्या आहेत, हे शोधयंत्राच्या माध्यमातूनच कळते, पण त्यामुळे मी उदास होणे सोडून दिलेले आहे. उलट, आपल्याला आलेली कल्पना आधीदेखील कुणाला तरी आलली आहे, म्हणजेच त्या कल्पनेत "दम" आहे, हे कळून मला समाधान वाटते.)

पेजरॅंक ही कल्पना लॅरी आणि सर्जे ला सुचली, त्या आधीच इंकटुमी, कॉम्पॅक ह्या संस्थांनी ह्या कल्पनांवर संशोधन सुरू केले होते. इंकटुमीमध्ये तर अशा प्रकारच्या विषयोचिततेच्या प्रकल्पावर कामदेखील सुरू झाले होते. त्याला त्यांनी नाव दिले होते, "वेबमॅप". अख्ख्या संकेतपृष्ठांचे जाळे संगणकावर बांधण्याचा हा प्रकल्प. पण हा प्रकल्प एका प्रस्थापित संस्थेत सुरू होता, आणि लॅरी आणि सर्जे असाच प्रकल्प करत होते, ते त्यांच्या होस्टेलच्या खोलीत. तुम्ही सिलिकॉनव्हॅलीच्या बाहेर असलात, तर तुम्हाला नक्की वाटणार की दोन विद्यार्थी, त्यांच्या खाजगी संगणकावर कुणीही एक कवडीची मदत न करता जो प्रकल्प करताहेत, त्याचा नक्की भुगा होणार ! पण इथे असे घडत नाही.

अर्थातच, बहुतांश प्रस्थापित कंपन्यांची बाबूशाही (ब्युरोक्रसी) इंकटुमीतल्या संशोधकांनाही भोवली, आणि स्टॅनफोर्ड विद्यापीठातील वसतीगृहात दरमहा १२०० डॉलर्सवर काम करणाऱ्या ह्या दोन विद्यार्थ्यांनी आपला पेजरॅंकचा कृतिक्रम इंकटुमीच्या संशोधकांच्या (पगार दरमहा १०००० डॉलर्स) आधी अमलात आणला, आणि एका महासत्तेचा जन्म झाला.

(पुढच्या लेखात आपण पेजरॅंक ह्या संकल्पनेविषयी जाणून घेऊयात. पण त्या आधी लॅरी आणि सर्जे ह्यांनी त्याविषयी लिहिलेला शोधनिबंध शोधयंत्रावरून शोधा. वाचण्याचा प्रयत्न तरी करा. तो वाचताना, तुमच्या रोजच्या जीवनात पेजरॅंक सारखे कृतिक्रम दिसतात का, ह्याचा विचार करा. मग पुढचा लेख वाचणे खूप सोपे जाईल.)

वा!

६ व्या मिनिटाचा प्रतिसाद! ;)
वा!! किती छान लेख. सुरेखच. मुद्देसून नि बिंदुगामी लेखन्. विषयाला धरून योग्य ते शब्द वापरून् सुरेख लेख लिहिलात.

आपला
गुंडोपंत

ह्या लेखाला सहा मिनिटे चालेल

गुंडोपंत,

ह्या लेखात इक्वेशने वगैरे नाहीत.. कॉस्मॉलॉजिकल फिजिक्स विषयी जाणकारी देखील आवश्यक नाही..
त्यामुळे ह्या लेखाला सहाच काय दुसर्‍या मिनिटाला देखील प्रतिसाद आला, तरी चालेल...

प्रतिसादाबद्दल धन्यवाद !

- सर्किट बांगडू

--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

साधा प्रतिसाद

लेख आवडला...
पण शीर्षकाशी जुळत नाहीये का? किंवा अपुर्ण वाटतो आहे. अजून मोठा चालेल.
शिवाय कल्पना व त्यांचे सुचणे यावर वेगळा लेख होईल असे वाटते.

बाकी हा महासत्तेचा जन्म कसा होतो आहे हे वाचायची उत्सुकता आहेच.
आज ७०% पाने इंग्रजीत (संदर्भ?) तर त्यात मराठी किती आहेत हे कसे मिळेल?

आपला
गुंडोपंत

ह्याविषयीच

आपल्या प्रश्नांची उत्तरे पुढच्या नाहीत, पण पुढच्याच्या पुढच्या लेखात नक्कीच..

(लेख अजून मोठा हवा होता, हे तुम्हाला वाटते. पण आमच्या इतर गजकर्णी लेखांना जो भरभरून प्रतिसाद उपक्रमाच्या "बुद्धिमान" वाचकांनी दिलेला आहे, तसा शोधयंत्राच्या गेल्या दोन लेखांना दिलेला नाही. त्यापेक्षा मिसळपावावर आम्हाला त्याच लेखांना अधिक प्रतिसाद मिळाला आहे, हे खेदाने नमूद करावेसे वाटते. हे का झाले असावे बरे ? ह्या लेखाचा प्रतिसाद मिसळपावापेक्षा जास्त मिळाला नाही, तर शोधयंत्रासाठी उपक्रम आम्हाला बंद करावे लागेल. आपली काही तरी इज्जत आम्हाला राखणे आवश्यक आहे. नाही का ? तसे झाल्यास, सत्यनारायण आणि शिरा ह्याविषयी संशोधनपर लेखमाला सुरू करा.)

तोवर गूगल आणि "मॅप-रिड्यूस" ह्या शब्दांचा याहू! वर शोध घ्या..

"ह्या शब्दांना गूगल करा:" असे म्हटले असते, पण नोकरीचा प्रश्न आहे ;-)

- सर्किट

--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

वाह्!

एखाद्या रहस्य कथेचा पुढचा भाग कधी वाचावा असे वाटावे तशी ही मालीका सुरू आहे. हा भाग तसाच सुरू झाला व संपला. थोडा लहान आहे पण छान आहे. हीट आहे.

ह्या मालीकेचे एक इबूक नक्की करावे. मला वाटते आहे की कुठले विज्ञान मासीक असेल तर ते ही लेखमाला आनंदाने घेतील. कोणी ढापायच्या आधी तुम्हीच एक प्रयत्न करून पहा ही विनंती. घाटपांडे साहेबांकडे ह्या संर्दभात पत्ते मिळावे असे वाटते, (मेंटल पेजरँक )

ढापाढापी

कुणाला ढापाढापी करता येवू नये यासाठी काय करता येईल?
पीडीएफ हा पर्याय नाही.
अजून या शिवाय काही सुचत नाही का?

आपला
गुंडोपंत

चित्रे

चित्रमालिका बनवा.
(इथे श्रेय ढापणे हटवणे अपेक्षित आहे, पुन्हा चित्रे ढापली जाणारच.)

बारा वर्षे..

कुणाला ढापाढापी करता येवू नये यासाठी काय करता येईल?

अहो गुंडोपंत बारा वर्षे रामायण ऐकून रामाची सीता कोण म्हणून विचारता आहात :) सर्कीट महाशय सारखे काय सांगताहेत?

यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट

:-)

सर्वेतु सुखिनः सन्तु

मराठीतून आधुनिक तंत्रज्ञानविषयी लेखन इतर लेखकांना उत्तेजन ठरणारे असेल, तर ह्या लेखमालिकेची ढापाढापी व्हावी, ही अपेक्षा.

माझे नावही न घेता, जरी ही लेखमालिका चोरीला गेली, तरी मल त्याचे काहीही वाटणार नाही !

नव्हे, कृपया आपल्या मुलांसाठी पालकांनी, आणि विद्यार्थ्यांसाठी शिक्षकांनी ही लेखमाला चोरावी, ही विनंती !

- सर्किट

--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

आयडीया व्ह्यायरस् पुस्तकाची आठवण झाली

मराठीतून आधुनिक तंत्रज्ञानविषयी लेखन इतर लेखकांना उत्तेजन ठरणारे असेल, तर ह्या लेखमालिकेची ढापाढापी व्हावी, ही अपेक्षा.

सेठ गॉडिनच्या, आयडीया व्ह्यायरस् पुस्तकाची आठवण झाली.
सर्कीटराव तुमचे मनापासून अभिनंदन !

मी तुमचा लेख ढापणार आणि लोकांना कळवणार.

माझे नावही न घेता, जरी ही लेखमालिका चोरीला गेली, तरी मला त्याचे काहीही वाटणार नाही !
पण मला वाटेल. तेंव्हा तुमचे नाव नक्किच ठेवू, काढणार नाही.

ते मान्य आहे हो

ते मान्य आहे हो...
पण तुम्हीच सर्किटचे लेखन् कुणी ढापेल असे म्हणालात
म्हणून विचार करतो आहे.
काहीतरी मार्ग नक्कीच निघेल अशी आशा आहे मला... त्या टर्न इट इन डॉट कॉम सारखी मराठी सुविधाही यायला हवी आहे. मग त्यातून १० % पेक्षा कमी ढापाढापी आलेला लेख संकेत स्थळावर प्रसिद्ध होईल अशी पण काही व्यवस्था होवू शकेल.
पण एकुण मराठी पाने/ब्लॉग्ज जोरात वाढतायेत असे वाटते आहे.

पण जालावर एकुण मराठी पाने किती आहेत हे मात्र कळत नाहीये...
आपला
गुंडोपंत

गूगलमध्ये

पण जालावर एकुण मराठी पाने किती आहेत हे मात्र कळत नाहीये.

गूगल मध्ये, किंवा याहूत देखील, (याहूत अशासाठी की गूगलपेक्षा याहूत विश्वजालावरची अधिक पाने आहेत, हे सत्य आहे.)

लँग्वेज = एम आर, अशी क्वेरी टाकून बघितलीत का ?

- सर्किट

--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

मेंटल पेजरँक

अगदी अचूक..

अशाच संदर्भात पेजरँकचे सहज सोप्या भाषेत वर्णन लिहायला घेतले आहे..

जियो सहजराव (की ताई?)

- सर्किट

--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

शोधावे जनाचे

तो गूगलचा याहूवर, व याहूवर गूगलचा शोध नियमितपणे घेतो.

गूगलवर याहूचे वर्णन 'महाजालावरील सर्वाधिक भेटी दिले जाणारे पृष्ठ' व याहूवर गूगलचे 'गूगल शोधयंत्राचे मुख्य पान' हे वर्णन पाहता गूगलच्या यशाचे गमक समजते :)

नोंद घेण्यासारखे काही: गूगलवरील संबंधित जाहिराती अवांतर आहेत, तर याहूवरच्या जाहिराती गूगलमधील नोकरीच्या संधीविषयक! :ड्

बोधः शोधावे जनाचे पण जाहिरातावे मनाचे.

अवांतरः याहू सर्च वन की काय ती संकल्पना त्याच्या गळी पुरेशी उतरली नाही.

लेखमाला आवडली. संग्रही आहे. सवडीने वाचली जाते त्यामुळे उत्स्फुर्त प्रतिसाद दिले जातातच असे नाही. (तो कालावकाशाचा लेखही वेळे अभावी अर्धवट सोडला आहे :( )

गूगल वर याहूचा शोध आणि उलटे

हे नेहमीच घडत असते. नव्हे, गूगलवर याहूचा शोध आणि याहूवर गूगलचा, हे नेहमीचेच आहे..
हे का होत असावे ?

- सर्किट

(हिंट: जालावरच्या पृष्ठाचा पत्ता टंकताना, चुकीच्या टंकनामुळे लोक बीभत्स पानांवर जातात, म्हणून शोधयंत्रातून एखाद्या स्थळाचा पत्ता शोधणे अधिक सुरक्षित असते.)
--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

उत्सुकता

आपल्या प्रतिस्पर्ध्याशी संबंधित सेवा आपण कशी देतो ही बाब 'कंपनी' महत्वाची की 'सेवा' यातील फरक दाखवते असे वाटते.

एका हातात धरलेल्या एअरटेल वरून दुसर्‍या हातातील बीएसएनएल चा दूरध्वनी लावताना 'आउट ऑफ रेंज' सांगणे व उलट प्रयत्न करताना तो लागणे हे पाहाणे त्याला आवडते.

बाकी ओपेराचे याहूशी संधान असणे, व 'गूगलवरच शोधायचे आहे' अशा हेकेखोर पणामुळे याहूतून गूगल शोधत गूगलवर शोधाशोध करणे किंवा गूगल टूलबार असल्याने याहूमेल साथी तिथूनच जाणे वगैरे तात्कालिक कारणे देखील आहेत.

अवांतर: जसपाल भट्टींचे बुटांच्या दुकानात जावून 'इथे जवळपास चांगले बूट कुठे मिळतात?' असे विचारणे ही यामागची प्रेरणा असू शकते.

हे जरा

तो गूगलचा याहूवर, व याहूवर गूगलचा शोध नियमितपणे घेतो.

हे जरा "त्याने मला मारले .. मला त्याने मारले" सारखे नाही वाटत का ??

खरे

असे झाले आहे खरे.'तो गूगलचा याहूवर, व याहूचा गूगलवर शोध नियमितपणे घेतो.' असे वाचावे.

पेजरँक

लेखही आवडला आणि पेजरँकची पार्श्वभूमी चांगली सांगीतली आहे. काही प्रश्न डोक्यात नेहेमीच येतात, पण पुढच्या लेखापर्यंत थांबतो कारण ते गुगलसंबंधी आहेत...

पैशाला पासरी कल्पना

वाचकहो, ही लेखमाला प्रकाशित करायला सुरुवात केल्यानंतर आपल्यातल्या अनेक बुद्धिमान वाचकांनी माझ्याशी संपर्क साधून, त्यांना येणाऱ्या विविध कल्पना, इतरांना आधीच आलेल्या आहेत, म्हणून माझ्याकडे खेद व्यक्त केला आहे.
ज्याना एखादे व्हेंचर कॅपिटॅलिस्ट माहिती असतील त्याना विचारा. कल्पनेची किंमत शोधकाला वाटते तितकी नसते. पैशाला पासरी कल्पना असतात. त्यापेक्षा कोण त्या कशा अमलात आणतो ते मह्त्वाचे ठरते. त्यामुळे नुसत्या कल्पनेचे मांडे खाण्यापेक्षा एखादी चावून् चोथा झालेली कल्पना पण अमलांत आणली तर जास्त चांगले.

वा काय बोललात!

कल्पनेची किंमत शोधकाला वाटते तितकी नसते. पैशाला पासरी कल्पना असतात. त्यापेक्षा कोण त्या कशा अमलात आणतो ते मह्त्वाचे ठरते. त्यामुळे नुसत्या कल्पनेचे मांडे खाण्यापेक्षा एखादी चावून् चोथा झालेली कल्पना पण अमलांत आणली तर जास्त चांगले.
सहीच नि सत्य!

किंवा तीच (ती) कल्पना नवीन म्हणून चमत्कृतीने पुढे आणणे वगैरे इतरही कल्पनाशक्तीला वाव देणारे मार्ग आहेतच!

आपला
गुंडोपंत चोथा

+१

त्यामुळे नुसत्या कल्पनेचे मांडे खाण्यापेक्षा एखादी चावून् चोथा झालेली कल्पना पण अमलांत आणली तर जास्त चांगले.

+१ !

नुकतेच स्कॉट बेर्कन चे "मिथ्स ऑफ इनोव्हेशन" पुस्तक वाचले. त्यात आपल्या ह्या वाक्यावर एक पूर्ण च्याप्टर आहे.

- सर्किट

--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

इन्नोवेशन

पहिले म्हणजे लेखमाला चांगली आणि उद्बोधक आहे. वाचायला आवडते आहे.

दुसरे वर बोलत आहे त्या काही संदर्भातः
इन्नोवेशनचा अर्थ जसा लावलेला असतो ते पाहून कधीकधी हसायला येते. मुख्यत्वे एखाद्या ग्रांटचा सिनॉप्सिस वाचते तेव्हा. पण हे बरोबर आहे की पैसे नव्या कल्पनेत ओतण्यापेक्षा ते कुठेतरी नक्की यशस्वी झालेल्या कल्पनेवर लावले तर कदाचित रिस्क कमी असे होत असेल.

दुसरे एक की बर्‍याच गोष्टी या स्थानमहात्म्यामुळे होतात - जसे स्टॅनफर्ड - बर्कली -एम आय टी. गूगलबद्दल असे म्हणायचे नाही (आणि सार्वत्रिक विधानही करायचे नाही), पण सुरूवातीचे वेंचर कॅपिटल/ फंडिंग/ ग्रांटस हे तुम्ही एकाद्या प्रसिद्ध युनिवर्सिटीतून शिक्षण घेत असलात तर ऍडवायजरच्या पाठिंब्यामुळे/ओळखीमुळे मिळणे शक्य होते. तसेच वेंचर हे बर्‍याचदा माजी विद्यार्थ्यांकडून येत असल्याने ओळखीच्या लोकांमध्ये हा पैसा फिरत राहतो असे वाटते. अर्थात अगदी तिसर्‍या पार्टीतील लोकांनाही फंडिंग मिळत असेलच - नाही असे नाही.

गूगलचा पहिल्याने वापर केला तेव्हा इतके इंप्रेस झाले होते ते आठवते. त्यामुळे काही कल्पना विशेष असतातच. मग त्यांचा उगम कोणाच्याही डोक्यात झालेला असो.

गुगलवर तरी हे बदललेले नाही

प्रत्येक संकेतपृष्ठावर काही शब्द असतात. पण सदर पृष्ठ सदर शब्दांसाठी माहितीपूर्ण आहेत का, हे ठरवण्यासाठी त्या पृष्ठाला त्या शब्दासंदर्भात दिलेले गुण, म्हणजे "पेजरॅंक". अर्थात ही त्या संज्ञेची दहा वर्षानंतरची व्याख्या झाली. १९९७ मध्ये लॅरी पेज आणि सर्जे ब्रिन ह्यांनी पेजरॅंकची जी व्याख्या केली, त्यात आजच्या व्याख्येतले "शब्दासंदर्भात" हे गाळलेले होते. एका संकेतपृष्ठाची एक पेजरॅंक, त्या पृष्ठातील सर्व शब्दांसाठी ही एकच!

गुगलवर तरी हे बदललेले नाही. आजही एका पानाला जी पेजरॅंक आहे ती शब्दानुसार बदलत नाही. जसे
http://www.findpagerank.com/index.php

www.marathimaya.com has the rank: 0
www.batmya.com has the rank: 0
mr.upakram.org has the rank: 3
www.misalpav.com has the rank: 3
www.sureshbhat.com has the rank: 3
www.manogat.com has the rank: 4
www.esakal.com has the rank: 4
kharedi.maayboli.com has the rank: 4
www.maayboli.com has the rank: 5
www.yahoo.com has the rank: 9
www.google.com has the rank: 10

हे कूठल्याही शब्दाशिवाय आहे. बदल हा झाला आहे की एकूण शोध पद्धतीत पेजरॅंक चे महत्व किंचित कमी झाले आहे आणि शब्दानुसार ते पान कमी अधिक खालीवर दाखवणे होते.

१०% रोमन अक्षरांसाठी
आजही एका पानाला जी पेजरॅंक आहे ती शब्दानुसार बदलत नाही
आजही एका पानाला जी पेजरॅंक आहे ती शब्दानुसार बदलत नाही
आजही एका पानाला जी पेजरॅंक आहे ती शब्दानुसार बदलत नाही
आजही एका पानाला जी पेजरॅंक आहे ती शब्दानुसार बदलत नाही
आजही एका पानाला जी पेजरॅंक आहे ती शब्दानुसार बदलत नाही

उत्कृष्ट

जितेन,

आपले अगदी बरोबर आहे. पेजरँकची "क्लासिकल" व्याख्या वरील उल्लेखलेल्या शोधनिबंधाच्या संदर्भात अद्यापही बदललेली नाही.

मला म्हणायचे होते ते असे, की सुरुवातीला (दहावर्षांपूर्वी) पेजरँक हा एकमेव निकष ह्या क्रमवारीला असायचा. आता तो बदलला आहे. आता त्यात "शब्दानुसार" क्रमवारी देखील अंतर्भूत झालेली आहे.

मग आता ह्याल पेजरँकची व्याख्या बदलली म्हणायचे, की पेजरँकची व्याख्या तशीच ठेवून क्रमवारीसाठी वापरलेला निकष बदलला म्हणायचे, हे तुम्ही ठरवा.

मला वाटते, की पेजरँकची जी व्याख्या पेज-ब्रिन ह्यांनी प्रकाशित केली होती, तीच बदलली आहे.

- सर्किट

--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

आयडीया व्ह्यायरस् पुस्तकाची आठवण झाली

मराठीतून आधुनिक तंत्रज्ञानविषयी लेखन इतर लेखकांना उत्तेजन ठरणारे असेल, तर ह्या लेखमालिकेची ढापाढापी व्हावी, ही अपेक्षा.

सेठ गॉडिनच्या, आयडीया व्ह्यायरस् पुस्तकाची आठवण झाली.
सर्कीटराव तुमचे मनापासून अभिनंदन !

मी तुमचा लेख ढापणार आणि लोकांना कळवणार.

माझे नावही न घेता, जरी ही लेखमालिका चोरीला गेली, तरी मला त्याचे काहीही वाटणार नाही !
पण मला वाटेल. तेंव्हा तुमचे नाव नक्किच ठेवू, काढणार नाही.

तीनही लेख

आवडले! (तरी दुसर्‍या लेखातील अर्थकारणाचा भाग ऑप्शनला टाकला आहे याची कृपया नोंद घ्यावी. ;-))

शोधयंत्रांनी 'बिल क्लिंटन' उदाहरणात सांगितल्याप्रमाणे फजिती होऊ नये म्हणून विकीचे दुवे सर्वप्रथम देण्यास सुरुवात केली का? म्हणजे बिलवाच्या जन्मापासून, कारकिर्दीपर्यंत आणि लग्नापासून लफड्यांपर्यंत सर्व एकसाथ. याहू! वर उजव्या कोपर्‍यात टॉप टेन सर्चेस आढळतात. त्यात सर्वात पहिली लिंक आज बुश कन्यकेची आहे. ;-)

अवांतर:

पण आमच्या इतर गजकर्णी लेखांना जो भरभरून प्रतिसाद उपक्रमाच्या "बुद्धिमान" वाचकांनी दिलेला आहे, तसा शोधयंत्राच्या गेल्या दोन लेखांना दिलेला नाही. त्यापेक्षा मिसळपावावर आम्हाला त्याच लेखांना अधिक प्रतिसाद मिळाला आहे, हे खेदाने नमूद करावेसे वाटते. हे का झाले असावे बरे ? ह्या लेखाचा प्रतिसाद मिसळपावापेक्षा जास्त मिळाला नाही, तर शोधयंत्रासाठी उपक्रम आम्हाला बंद करावे लागेल. आपली काही तरी इज्जत आम्हाला राखणे आवश्यक आहे. नाही का ? तसे झाल्यास, सत्यनारायण आणि शिरा ह्याविषयी संशोधनपर लेखमाला सुरू करा.

तसे काही नसावे. शोधयंत्राचे पूर्वीचे भाग आणि आताच्या भागात बराच काळ गेलेला आहे. त्यातून सत्यनारायणासारख्या सर्वप्रिय विषयांवर टिचक्या अधिक यायच्याच. शोधयंत्रावरही कोणते शोध अधिक घेतले जातात बॉ? त्यामानाने शोधयंत्र, संकेतपृष्ठ इ. शब्द वाचून अबब! किती किचकट विषय असे म्हणणार्‍यांची संख्या जास्त असावी. असो. मला वाटतं की लेख चांगले उतरले आहेत. समजण्यास सोपे आहेत. तेव्हा उपक्रम बंद करू नका, उलट ते 'नैतिक-अनैतिक' इ. अप्रिय विषय टाळून ;-) हेच लिहा.

+१

....तसे काही नसावे. शोधयंत्राचे पूर्वीचे भाग आणि आताच्या भागात बराच काळ गेलेला आहे....ला वाटतं की लेख चांगले उतरले आहेत. समजण्यास सोपे आहेत. तेव्हा उपक्रम बंद करू नका, उलट ते 'नैतिक-अनैतिक' इ. अप्रिय विषय टाळून ;-) हेच लिहा.

मला पण तेच म्हणायचे आहे :)

मी गंमत केली होती

इतके गंभीरपणे घेऊ नका हो !

- सर्किट

--
यू हॅव्ह नो प्रायव्हसी ! गेट ओव्हर इट !

पेजरँक..

पेजरँक (दुव्यांवर आधारीत क्रमवारी) हे संकल्पनाच तशी भन्नाट आहे. परंतु यात येणार्‍या दुव्यांबरोबरीनेच जाणार्‍या दुव्यांनाही "वजन" असल्याने "चालूगिरी" होण्याची शक्यतादेखील गृहित धरावी लागते.

पुढच्या लेखात पेजरँकवर लिहिताना damping factor वरही जरा सोप्या (६ ते १४ वयाच्या मुलांना समजेल असे) लिहा.

पुढील भागाच्या प्रतीक्षेत

(६-१४) सुनील