कल्पनागार ३: मुखपृष्ठे

नमस्कार. कल्पनागार २ चढवल्यानंतर ह्या तिसर्‍या भागाला बराच विलंब झाला आहे. कल्पनागारा मागची मूळ प्रेरणा ही विदाखननाची (डेटा मायनिंग) आहे. समजा तुम्हाला कुठलातरी प्रचंड विदा गवसला, तर त्याचा उपयोग तुम्ही कसा कराल, ही ह्यामागची मुख्य कल्पना.

जुन्या उपक्रमींना आठवत असेल, की मागे मी उपक्रम आणि "म" ह्या संकेतस्थळांवर पाळत ठेवून त्या काळात उपक्रमाला भेट देणार्‍यांची संख्या "म" पेक्षा जास्त आहे, ह्या निष्कर्षाप्रत पोहोचलो होतो. ह्या विदाच्या संकलनासाठी आवश्यक ती प्रणाली, तेव्हापासून आजवर दोन्ही संकेतस्थळांची मुखपृष्ठे (आणि इतर काही पृष्ठे देखील) थोड्या थोड्या कालाने (सुमारे ५ मिनिटे प्रत्येकी) शोषून घेत आहे. गणेशचतुर्थीपासून मिसळपावाचाही ह्या प्रणालीत समावेश झालेला आहे. दिवसाला ४६८ वेळा ह्या सर्व पृष्ठांचे "स्नॅपशॉट्स" माझ्या संगणकावर साठवलेले आहेत. (असा सुमारे सहा महिन्यांचा हा विदा माझ्याकडे आहे. म्हणजे २००*४६८ एचटीएमएल पृष्ठे. ती संकोचित - कॉम्प्रेस्ड - असल्याने फारशी जागाही व्यापत नाहीत.)

ह्या विदाचे स्वरूप असे आहे: (वेळ - यूटीसी, संकेतस्थळ, एचटीएमएल पृष्ठ)...

आता, ह्याचा उपयोग कशासाठी कराल ? कसा कराल ?

दुसरा प्रश्न. हा विदा वापरून काढलेले निष्कर्ष अचूक असतील का ? नसल्यास का ?

तिसरा प्रश्न. हा विदा वापरणे कायदेशीर आहे (कारण ही संकेतस्थळे सर्वांसाठी खुली आहेतच.) पण नैतीक आहे का ?

चौथा प्रश्न. असा विदा गोळा करता येऊ नये, ह्यासाठी संकेतस्थळ चालक काय उपाययोजना करू शकतील ? मुळात, असे निर्बंध घालणे शक्य आहे का ?

चालवा डोके.

माझे 'मत'

आता, ह्याचा उपयोग कशासाठी कराल ? कसा कराल ?
हा विदा आहे, याचं माहितीत रुपांतर गरजेनुसारच् ठरेल.

दुसरा प्रश्न. हा विदा वापरून काढलेले निष्कर्ष अचूक असतील का ? नसल्यास का ?
हा थोडा सांख्यिकिचा भाग झाला. विदा गोळा करतानाचे नमुने जितके अचुक + अधिक + सुनियोजित रित्या साठवता येण्याजोगे आहेत तितके निष्कर्ष अचुक

तिसरा प्रश्न. हा विदा वापरणे कायदेशीर आहे (कारण ही संकेतस्थळे सर्वांसाठी खुली आहेतच.) पण नैतीक आहे का ?
हो का नाही. याचा वापर होतो का गैरवापर हे वापरणार्‍यावर अवलंबून आहे. विदा गोळा करणार्‍यावर नाही.

चौथा प्रश्न. असा विदा गोळा करता येऊ नये, ह्यासाठी संकेतस्थळ चालक काय उपाययोजना करू शकतील ? मुळात, असे निर्बंध घालणे शक्य आहे का ?
उपप्रश्नः याची गरजच काय? :)

ऋषिकेश

गरजा ?

हा विदा आहे, याचं माहितीत रुपांतर गरजेनुसारच् ठरेल.

जरा प्रश्न विचारण्यात चूक झाली वाटते. प्रश्न असा(ही) वाचावा: "कुठल्या माहितीच्या गरजांसाठी वरील विदा वापरण्यात येऊ शकतो?"

- सर्किट

माझे मत

पहिल्या दोन प्रश्नांबाबत ऋषिकेशशी सहमत आहे.

तिसरा प्रश्न. हा विदा वापरणे कायदेशीर आहे (कारण ही संकेतस्थळे सर्वांसाठी खुली आहेतच.) पण नैतीक आहे का ?
तो विदा कुठल्या तर्‍हेने वापरला जातो यावर अवलंबून आहे. कायद्याबाबतही शंका आहे कारण कुठल्या देशाचा कायदा यावर ते अवलंबून आहे. परवाच वाचले की भारत सरकार खोटी लॉग इन माहिती देउन खाते उघडणे याला गुन्हा ठरवण्यासंबंधी कायदा बनवायचा विचार करत आहे.

चौथा प्रश्न. असा विदा गोळा करता येऊ नये, ह्यासाठी संकेतस्थळ चालक काय उपाययोजना करू शकतील ? मुळात, असे निर्बंध घालणे शक्य आहे का ?
याचे उत्तर देण्याइतके तांत्रिक ज्ञान माझ्याकडे नाही.

----
L'enfer, c'est les autres -- Jean-Paul Sartre

कायदा - शंका

कायद्याबाबतही शंका आहे कारण कुठल्या देशाचा कायदा यावर ते अवलंबून आहे. परवाच वाचले की भारत सरकार खोटी लॉग इन माहिती देउन खाते उघडणे याला गुन्हा ठरवण्यासंबंधी कायदा बनवायचा विचार करत आहे.

असा कायदा कुठल्याही देशात असण्याची शक्यता नाही. कारण असे झाले, तर शोधयंत्रे बंद पडतील.

दुसरे, हा विदा गोळा करण्यासाठी सदर संकेतस्थळांचे सदस्य असण्याची गरज नाही. त्यामुळे खोट्या लॉगिनचीही गरज नाही.

- सर्किट

सहमत

असा कायदा कुठल्याही देशात असण्याची शक्यता नाही. कारण असे झाले, तर शोधयंत्रे बंद पडतील.

सहमत आहे. मागच्याच आठवड्यात बातमी वाचली होती. दुवा मिळाल्यास देतो.

दुसरे, हा विदा गोळा करण्यासाठी सदर संकेतस्थळांचे सदस्य असण्याची गरज नाही. त्यामुळे खोट्या लॉगिनचीही गरज नाही.

यासाठी खोट्या लॉग इनची गरज आहे असे मला म्हणायचे नाही. ते फक्त उदाहरणखातर दिले होते.

----
L'enfer, c'est les autres -- Jean-Paul Sartre

भारतातील कायदे

परवाच वाचले की भारत सरकार खोटी लॉग इन माहिती देउन खाते उघडणे याला गुन्हा ठरवण्यासंबंधी कायदा बनवायचा विचार करत आहे.

मी ऐकले आहे कि भारतातले कायदे 'कागदावर' खुपच चांगले आहे. अंमलबजावणी हा भाग अलहिदा. खोट्या डी मॅट च्या बाबत वरील माहिती असावी. डी मॅट च्या संख्येत अचानक लक्षणीय वाढ झाल्याने हे उघडकीस आले. अजानुकर्णा ऐकतोयस ना एवढी 'आर्थिक साक्षरता" कशी काय निर्माण झाली बुवा?

(अर्धसाक्षर)
प्रकाश घाटपांडे

कुणी आहे का इथे ?

नाही, म्हणजे डोकं चालतंय का नाही ? ;-)

आता मीच काहीतरी लिहितो. स्फोटक.

मला एक लक्षात आलेले आहे, की एकदा नेटावर आलेले ह्या स्थळांचे वाचक थोड्या कालांतराने तीनही संकेतस्थळे वाचतात. म्हणजे २.२१ ला उपक्रमावर येण्याची नोंद, २.२७ ला मिसळपावावर, आणि २.३४ ला मनोगतावर. त्या वाचकांच्या नावांचे (अर्थात उपनावांचे) को-रिलेशन साधून आजवर मी अनेक मनोगतींची उपक्रम आणि मिसळपाव ह्या संकेतस्थळांवारची (मुद्दाम घेतलेली) टोपणनावे शोधून काढलेली आहेत.

अशी माहिती ह्या विद्यातून काढता येते, नाही का ?

(आणि अर्थातच, प्रवेश केल्यापासून किती वेळात कुठल्या लेखाला तुमचा प्रतिसाद गेलाय हेही. सहा मिनिटे, एनीवन ?)

- सर्किट

साष्टांग दण्डवत

"हजारो डॉलर्सचा वेळ" हे शब्द तुम्ही एकदा आधी वापरले होते, ते आठवले. पण हौसेला किंमत नसते हेच खरे.

काय कराल?

>आता, ह्याचा उपयोग कशासाठी कराल ? कसा कराल ?
1. कोण कुठल्या सं.स्थळावर पडीक आहे/असते.
2. कोण कुठल्या सं.स्थळावर प्रथम जाते?.
3. कोण कुठल्या कुठल्या वेळी 'तारेवर' (ऑनलाईन) असते?
4. कोण वेगवेगळ्या 'आय.डी.ने/आय.पी.' ने वावरते. कुठल्या दोन लॉग-इन मध्ये सलगता आहे/सारखा आय पी आहे. (यावरून बनावट नावे कळतील.)
5. कुठले मुखपृष्ठ सारखे बदलते/बदलत नाही.
६. पाहुण्यांचा, सदस्यांशी असलेले गुणोत्तर सं. स्थळा नुसार/काळानुसार कसे बदलते?
७. कुठल्या सं.स्थळावर नव्या लेखांचा वेग अधिक आहे?
८. आजवर सर्वात कमी वेळात १५ (४ हून अधिक ओळींचे प्रतिसाद मिळालेली) चर्चा/लेख कुठली? (इथे प्रतिसादांच्या वेळा व त्यातील मजकूर समजत आहे असे गृहीत धरले आहे.)

>दुसरा प्रश्न. हा विदा वापरून काढलेले निष्कर्ष अचूक असतील का ? नसल्यास का ?
उपक्रमावर एकाच वेळी एकच सदस्य दोनदा आल्याचा दिसतो :) त्यामुळे घोळ होणे शक्य आहे. प्रत्येच जण नावनोंदणी करूनच वाचेल असे गृहीतक चुकू शकते. कायम नाव नोंदवून बसलेले सदस्य त्या सं.स्थळावर दिवस भर ठिय्या मांडून होते असे म्हणणे दिशाभूल करणारे ठरू शकते.

>तिसरा प्रश्न. हा विदा वापरणे कायदेशीर आहे (कारण ही संकेतस्थळे सर्वांसाठी खुली आहेतच.) पण नैतीक आहे का ?
वापर कशासाठी करता यावर अवलंबून आहे. आर्थिक प्रयोजन किंवा कुणाला दुखवायचे नसेल तर हरकत नसावी.

>चौथा प्रश्न. असा विदा गोळा करता येऊ नये, ह्यासाठी संकेतस्थळ चालक काय उपाययोजना करू शकतील ? मुळात, असे निर्बंध घालणे शक्य आहे का ?
कल्पना नाही. निर्बंध घालणे कठीण असत असावे.

काही उत्तरे

> आता, ह्याचा उपयोग कशासाठी कराल ? कसा कराल ?
प्रक्रिया पातळीवरची काही मोजमापे गणिताने काढता येतील. दिवसातल्या कुठल्या वेळी लोक संकेतस्थळावर असतात.

> दुसरा प्रश्न. हा विदा वापरून काढलेले निष्कर्ष अचूक असतील का ? नसल्यास का ?
ड्रुपलचे काही किडे आहेत. कित्येकदा मी असून दिसत नाही, कधी दोनदा दिसतो.

> तिसरा प्रश्न. हा विदा वापरणे कायदेशीर आहे (कारण ही
> संकेतस्थळे सर्वांसाठी खुली आहेतच.) पण नैतीक आहे का ?
ज्या प्रकारे तुम्ही दिला आहे त्याप्रकारे अनैतिक काही दिसत नाही. भरबाजारात उभे राहून कोणी ही माहिती ठेवली की कोण येऊन कधी गेले तर ठीकच आहे. (तुमच्या विद्यात येणार्‍यांचे आय् पी नाहीत. ते योग्य आहे.) इथे गडबड ही आहे की या स्थळांवर येणार्‍या लोकांची संख्या त्या मानाने फार लहान आहे. खूप वाचक-लेखक संख्या असती तर कदाचित अनेक नावांनी वावरून अनेकत्वाचा आभास निर्माण करता आला असता. इथे थोडेच भिडू असल्यामुळे अशी अपेक्षासुद्धा ठेवू नये.

> चौथा प्रश्न. असा विदा गोळा करता येऊ नये, ह्यासाठी संकेतस्थळ
> चालक काय उपाययोजना करू शकतील ? मुळात, असे निर्बंध घालणे शक्य आहे का ?
कोण आले आहे ते मुखपृष्ठावर प्रसिद्ध न करता. तुम्ही संकेतस्थळावर आहात ते अमक्या मेंबराला कळावे, तमक्याला कळू नये, आणि बिगर-मेंबरांना मुळीच कळू नये असे नियम करायची मुभा मेंबरांना असावी. (उदा. याहू मेसेंजरवर असताना, मी कोणाला "दिसतो"/"दिसत नाही" ते मी ठरवू शकतो.) अशा प्रकारे हा विदा मुक्तपणे उपलब्ध होणार नाही, पण चॅट करायचे ते चॅटही करू शकतील.

आयपी

उपक्रमाच्या सर्वर लॉग्ज ला स्पर्श न करता, सदस्यांचे आयपी कसे मिळतील ?

(मी *एकदा* तसे केलेले आहे.)

काही कल्पना ?

काही सदस्यांनी मी ही प्रणाली लिहिण्यास काय वापरले, त्याची खाजगीत विचारणा केलेली आहे.

मी कर्ल वापरले.

- सर्किट