मराठी हन्स्पेल पॅक
या चर्चेतील प्रतिसादाचे स्वतंत्र लेखात रूपांतर केले आहे.
जगातील बहुतेक सर्व भाषांमध्ये (त्यात उर्दू देखील आली) हन्स्पेल पॅक सुविधा उपलब्ध आहे. त्याकरता शुद्ध शब्द "हन्स्पेल" या प्रोग्राममध्ये उपलब्ध करून द्यावे लागतात. मराठीसाठी असे काही करण्याचा प्रस्ताव ओंकार जोशी यांनी २००७ साली मांडला, अनेकांनी त्याला अनुमोदन दिले व मी या प्रकल्पाची जबाबदारी घेतली.
http://mr.upakram.org/node/114
यापूर्वी सी-डेकने मराठी हन्स्पेल पॅक उपलब्ध करून दिला होता, पण त्यात पुरेसे शब्द नव्हते व जे होते त्यात अनेक चुकिचे शब्द होते त्यामुळे शुद्ध शब्दाला अशुद्ध शब्दाचा पर्याय दिसण्यासारख्या हास्यास्पद गोष्टी होऊ शकत होत्या. आता एक लाखाहून अधिक शब्द साठा आम्ही उत्साही मंडळींनी जमा केला आहे. ओंकार जोशी व इतर उपक्रमींचे सहकार्य नसते तर हे अशक्यच झाले असते.
http://code.google.com/p/hunspell-marathi-dictionary/
हा शब्द साठा वापरून आपण शुद्धलेखन तपासू शकता येथे...
http://saraswaticlasses.net/shabdasampada/
हा प्रकल्प आता सुमारे ८०% पूर्ण झाला आहे असे समजण्यास हरकत नाही. पण उरलेला २०% भाग अधिक कठिण आहे कारण जे शब्द स्वयंसेवकांनी जमवलेले आहेत ते कोणा तज्ज्ञाने पाहणे अपेक्षित आहे. आपण जर यात काही मदत करू शकत असाल तर खाली दिलेली पीडीएफ फाईल आपल्या संगणकावर उतरवून घ्या व यात कोण कोणते शब्द चुकिचे आहेत ते वर दिलेल्या गुगल कोडच्या पानावर नोंदवा.
http://tinyurl.com/r543cp
तसेच जुन्या स्वयंसेवकांनी वेळ मिळेल तसा या इथे
http://tinyurl.com/ocfzfo
डेटाबेसमध्ये प्रवेश करून (पासवर्ड विसरला असल्यास मला अथवा ओंकारला विचारा) नवीन शब्द मिळवून द्यावेत अशी अपेक्षा आहे.
Comments
संपादक कृपया नवीन धागा सुरु करतील काय?
मराठी भाषेच्या दृष्टिकोनातून हा अतिशय महत्त्वाचा प्रकल्प आहे
शंतनुराव आपण ही माहिती नवीन धाग्यात द्यायला हवी होती.
संपादक कृपया या प्रतिसादाचे नवीन चर्चा प्रस्तावात रुपांतर करतील काय?
आपला
गुंडोपंत
रायटरमध्ये शुद्धलेखन चिकित्सा
ओपन ऑफिसच्या रायटरमध्ये शुद्धलेखन चिकित्सा कशी करायची याचे मार्गदर्शन
ओपन ऑफिस चे अगदी अलिकडील संस्करण स्थापित असावे. ओपन ऑफिस हा मायक्रोसॉफ्ट ऑफिससारखाच संच आहे. त्यात "वर्ड"च्या ऐवजी रायटर मिळतो इतकेच. वर्डची सवय झालेल्यांना थोडे वेगळे वाटेल पण लवकरच रायटरशीदेखील दोस्ती होईल. मायक्रोसॉफ्ट वर्डमध्ये मराठी शुद्धचिकित्सा कशी करतात ते मला माहित नाही. इतर तज्ज्ञ सांगू शकतील.
मराठी डिक्शनरी खाली दिलेल्या दुव्यावरून उतरवून घ्यावी.
http://extensions.services.openoffice.org/project/dict-mr
इन्स्टॉल करण्याकरता डबल क्लिक पुरे. "लायसन्स ऍग्रीमेंट" पूर्ण न वाचताच शेवटपर्यंत स्क्रॉल करून "ऍक्सेप्ट" करावे.
रायटर बंद करून पुन्हा चालू करावा. यात काही मराठी मजकूर टाईप करावा किंवा एखाद्या ब्लॉगवरून कॉपी पेस्ट करावा. रायटर हा इतर सर्व सॉफ्टवेअरप्रमाणेच निर्बुद्ध असल्यामुळे मराठी मजकुराचे शुद्धलेखन तपासावयाचे आहे हे त्याला सांगावे लागते. त्यासाठी,
१) टूल्स - ऑपशन्स - लेंग्वेज सेटींग - लेग्वेज
२) "एनएबल फॉर कॉम्लेक्स टेक्स्ट लेआउट" चेक बॉक्स मार्क करावा.
३) डीफॉल्ट लेंग्वेज फॉर डॉक्युमेंट्स यातील "सीटीएल" ड्रॉप डाऊनमध्ये मराठी निवडा.
४) आपल्याला फक्त एकाच फाईलमधील शब्द तपासावयाचे असतील तर "फक्त या पानापुरतेच" या अर्थाचा ऑप्शन निवडा.
आता आपल्याला इंग्रजीप्रमाणेच मराठीतही स्पेलचेक करता येईल.
फायरफॉक्समध्ये शुद्धलेखन चिकित्सा
फायरफॉक्स हा इंटरनेट एक्सप्लोअर सारखाच वेब ब्राऊजर आहे. मायक्रोसॉफ्टच्या आय ई मध्ये मराठी स्पेलचेक उपलब्ध आहे की नाही, असल्यास कसे वापरायचे याची मला कल्पना नाही.
मराठी डिक्शनरी येथून डाऊनलोड करावी.
ही फाईल अनजिप करून त्यातील mr.dic आणि mr.aff या दोन फाईल्स खाली दिलेल्या फोल्डरमध्ये सेव्ह कराव्यात.
C:\Program Files\Mozilla Firefox\dictionaries
आता फायरफॉक्स पुन्हा सुरू केल्यावर मराठीतील चुका लाल रंगात दिसू लागतील. राईट क्लिककरून "चेक स्पेलिंग" आणि "लेंग्वेज - मराठी" आहे ना हे पुन्हा एकदा तपासून पाहा.
राईट् क्लिकवरील पर्याय फारसे उपयोगी न ठरणे हा दोष अजुनही आहे कारण ही सी-डॅकने दिलेली डिक्शनरी आहे. सुधारीत आवृत्ती लवकरच उपलब्ध होईल. तोपर्यंत ही डिक्शनरी वापरून सवय करून घेऊ शकता.
स्क्रीनशॉट
शंतनूसेठ आभारी !
प्रथम प्रकल्पाबद्दल तुमचे मनःपूर्वक आभार !!!
'मोझीला' मधे चूकीचे शब्द आणि त्याला पर्याय येत आहेत.
फक्त मराठी डिक्शनरीची फाइल अनझीप केल्यानंतर फक्त mr.aff च फाईल सापडते.
(coping,copyright,mr,mr.aff,readme इतक्याच फायली होत्या..बरोबर का ? )
>>राईट् क्लिकवरील पर्याय फारसे उपयोगी न ठरणे हा दोष अजुनही आहे
हम्म !
>>सुधारीत आवृत्ती लवकरच उपलब्ध होईल.
वाट पाहतोय ! :)
>>तोपर्यंत ही डिक्शनरी वापरून सवय करून घेऊ शकता.
सराव सुरु केला! :)
पहिली आवृत्ती तयार
आपल्याला आता अधिक वाट पाहावी लागणार नाही.
फायरफॉक्स वापरत असाल तर खालील फाईल आपल्या संगणकावर उतरवून घ्यावी.
https://addons.mozilla.org/en-US/firefox/addon/12797/
फाईल - ओपन फाईल हा ओप्शन वापरून हे एक्श्टिंशन जोडले जाईल.
आता चुकीचे मराठी शब्द लाल रंगात दिसू लागतील. त्या शब्दांवर राईट क्लिक करून योग्य शब्द निवडता येईल.
डिक्शनरीने चुकीचा शब्द सुचविला तर त्याचा अर्थ मूळ स्रोत सुधारायला हवा.
http://code.google.com/p/hunspell-marathi-dictionary/
वर दिलेल्या दुव्यावर कोणता शब्द डिक्शनरीत नको ते नोंदवा म्हणजे पुढील आवृत्तीत सुधारणा करता येईल.
वरील मजकुराची शुद्ध चिकीत्सा फायरफॉक्स मधील हेच एक्श्टिंशन वापरून केलेली आहे.
अभिनंदन !!!
मस्त आहे, शुद्ध शब्द तपासणे आता फार सोपे झाले आहे. धन्यवाद !!!
आपले सर्वांचे पुन्हा एकदा अभिनंदन !!!
अवांतर : तपासणे हा शब्द शब्दसंपदेत टाकावा लागेल :)
अरे व्वा!
प्रिय शंतनू,
आपले कार्य अप्रतिम.
धन्यु!
आपण कृपा करुन वरील माहितीचे काही व्हिडीयोज् अपलोड करू शकता का? (त्यात जरा जास्ती समजू शकेल असे वाटले.)
खुप उपयोग होईल. मदत होईल.
कळावे,
आपला नम्र
महत्त्वाचे
अतिशय महत्त्वाचे कार्य.
या कार्याची माहिती, हे काम पूर्ण झाल्यावर सर्व मोठ्या वृत्तपत्रात यावी.
-निनाद
शब्द संपदेत नोंदणी कशी करावी?
शंतनुराव,
मलाही या शब्द संपदेत काही शब्द वाढवायचे असल्यास नोंदणी कशी करावी?
त्या पानावर पोहोचलो पण आत जाता आले नाही.
काही मदत करू शकाल काय?
(हे आपण सगळ्यांनी आधी केलेले असेलच तरीही विचारतो!)
शिकागो युनिव्हर्सिटीच्या पानावर मोल्सवर्थ मराठी शब्दकोश आहे. त्यातून शब्द कसे गोळा करता येतील?
हे जर यांत्रीकपणे गोळा करता आले तर बरेचसे काम सोपे होईल.
तसेच शब्द संपदेत स्पेल चेक करतांनाच 'मासॉ वर्ड' मध्ये आहे तशी,
हवा असलेला शब्द शब्द संपदेत नोंदवण्याची ( "ऍड" ) सुवीधा निर्माण करता येईल का?
आपला
गुंडोपंत
नवीन आव्हाने
>> मलाही या शब्द संपदेत काही शब्द वाढवायचे असल्यास नोंदणी कशी करावी?
http://saraswaticlasses.net/shabdasampada/moderate/verification1.php
या पानावर जाऊन युजरनेम व पासवर्ड द्यावा लागतो. आपला ई-मेल द्या म्हणजे मी लगेच मेल करतो.
>> शिकागो युनिव्हर्सिटीच्या पानावर मोल्सवर्थ मराठी शब्दकोश....
असा प्रयोग मी फार पुर्वीच करून पाहिला होता आणि तो साफ फसला. कारण...
१) कोशातले शब्द सामान्य माणसांच्या वापरात म्हणावे तितके नसतात. उदाहरण म्हणून कोशातले "क" चे शब्द पाहा...
कापडनिवीश कापडलेप कापडी कापडी कापण or णी कापणावळ कापणी कापणें कांपणें कापता कापरवणी कांपरा कांपरा कापर्टिक कापला कापशा कापशी कापसांखळी कापालिक कापळा कापा कापींव कापीसुपारी कापुरवणी कापुसणें कापुसाची मोट कापूर कापूरआरती कापूरकचरा कापूरकरदळी कापूरचिनी कापूरपोंवळें कापूरभेंडी कापूरमोतीं कापूरविडा कापूरवेल कापूस कापोळा काप्रवणी काफर काफरी काफला काफी कांब कांबट कांबरूण कांबरें
यातले किती शब्द डिक्शनरीत घेता येण्यासारखे आहेत?
दुसरे म्हणजे प्रत्यक्शात शब्दाचे रूप वापरले जाते, मूळ शब्द नव्हे. कापला, कापील, कापायला, कापतोय अशी रूपे शब्दकोशात नसतात पण बोलण्या, लिहिण्यात असतात.
>> हवा असलेला शब्द शब्द संपदेत नोंदवण्याची ( "ऍड" ) सुवीधा निर्माण करता येईल का?
याचे उत्तर ओंकार जोशी देऊ शकेल. यूजर इंटरफेस त्याने जसा बनवून दिला तसा मी वापरत आहे. ओंकारने दिलेले बहुमूल्य सहकार्य पाहता त्याच्याकडून अजून काही अपेक्षा करणे मला रास्त वाटत नाही.
_____
आपल्यापैकी कोणी जर थोडा वेळ काढू शकत असेल तर मला पहिला रु व दुसरा रू असलेले शब्द तपासून घ्यायचे आहेत.
http://tinyurl.com/orayo6
या पानावरील दोन्ही फाईल्स ओपन ऑफिसमध्ये उघडून त्यातील शब्द बरोबर की चूक ते सांगा.
http://tinyurl.com/phj4qy
तसेच अर्धा "ह्" असलेले शब्द देखील तपासायचे आहेत.
मदत करायला आवडेल.
मलाही या प्रकल्पात मदत करायला आवडेल. रु आणि रू असलेले शब्दही मी तपासू शकेन. माझा ई-पत्ता विरोपातून पाठवते. शक्य झाल्यास - मदत उपयोगाची होणार असल्यास जरूर कळवा.
मराठी हन्स्पेल पॅक
dict-mr
ही फाईल डाऊनलोड केली पण डबलक्लिक करून ती उघडता येत नाही.
काय करणे आवश्यक आहे?
चन्द्रशेखर
ओपन ऑफिसचे व्हर्जन
ओपन ऑफिसचे ३.० + व्हर्जन स्थापित आहे का? हे पाहाण्यासाठी रायटर सुरू करा...
स्टार्ट् - प्रोग्राम्स - ओपन ऑफिस - रायटर
आता हेल्प - अबाउट ओपन ऑफिस हा पर्याय निवडा. यात ३.० तरी दिसले पाहिजे. तसे असेल तर टूल्स - एक्श्टिंशन मॅनेजर हा पर्याय निवडा. त्यात "ऍड" बटणावर क्लिक करा. आपण डाऊनलोड केलेल्या dict-mr.oxt फाईलचा पाथ द्या. आता ही फाईल ओपन होईल.
ओपन ऑफिसचे व्हर्जन
आता व्यवस्थित चालते आहे. मराठीतून टंकलेखन करताना एक कमीपणा जाणवत होता. तो आता गेला. खूपच आभार.
चन्द्रशेखर
संपादक आपण 'शुद्धलेखन तपासा' कराल का?
शब्द संपदेत 'शुद्धलेखन तपासा'
http://saraswaticlasses.net/shabdasampada/
असे बटन गुगल शोध च्या खाली देता येईल का?
आणि त्या खालीच हवे ते शब्द दिसत नाहीत? भर घाला अशी एक चौकट दिली तर शब्दांची भरही घातली जात राहील असे वाटते.
आपला
गुंडोपंत
काही गोष्टी
मी गेले काही दिवस नित्यनियमाने शब्द संपदेत शब्द घालण्याचे काम करतो आहे.
हे करत असतांना काही गोष्टी लक्ष्यात आल्या त्या अश्या आहेत.
*. शब्द बल्क अपलोड करण्या आधी शब्द स्वच्छ करणे आवश्यक आहे. म्हणजे डॅश, अवतरण चिन्हे, विराम चिन्हे, स्वल्पविराम, पुर्णविराम आदी काढून टाकणे महत्त्वाचे आहे. यामुळे समाविष्ट होणारे शब्द वाढतात.
अशी 'स्वच्छता' करणारी एखादी युटीलिटी आहे काय?
*. बल्क अपलोड केल्या नंतर
Spell check | Bulk upload | Verification (Big font size) | Scrap words | Remove words
हे दुवे वरही दिसावेत. यामुळे पुढे जाणे सोपे होईल.
*. आज किती शब्द जमा झाले ते तेथेच दिसेल का?
आजचे जमा शब्द हा आकडा उपक्रमावरही दिसेल काय?
===वरचाच मुद्दा परत===
उपक्रमावरील लेखकांना उपयोगी ठरणारे
शब्दसंपदेत 'शुद्धलेखन तपासा'
http://saraswaticlasses.net/shabdasampada/
असे बटन उजव्या बाजूला उपक्रमावरील 'गुगल शोध' च्या खाली देता येईल का?
आणि त्या खालीच
"हवे ते शब्द दिसत नाहीत? संपदेत भर घाला! "
अशी एक चौकट अथवा दुवा दिला तर शब्दांची भरही घातली जात राहील असे वाटते.
आपला
गुंडोपंत