अव्यय, प्रत्यय, उपसर्ग इत्यादी

शब्दाच्या मागे जे अक्षर किंवा अक्षरे लागतात त्यांना उपसर्ग म्हणतात. उदा. ज्ञान - अभिज्ञान. इथे 'अभि' हा उपसर्ग आहे.

अति - अतिक्रम, अतिप्रसंग
अधि - अधिपती, अधिवास
अनु - अनुक्रम, अनुरूप
अभि - अभिमान, अभिमुख
उप - उपजीविका, उपदिशा
नि - नियोग, निबंध
परि - परित्याग, परिपाठ
प्रति - प्रतिक्रिया, प्रतिध्वनी
वि - विदेश, विसंगती
सु - सुदिन, सुशोभित

प्रत्ययघटित शब्द उदा. इक, ईक, इय, इल बनताना त्यात त्या शब्दाचे शेवटचे अक्षर बदलते. (समाज - सामाजिक) त्यासाठी खाली दिल्या प्रमाणे यादी बनविली, जी क्वेरीमध्ये वापरता येईल.

'%ीक'
'%िक'
'%ीत'
'%ित'
'%िय'
'%िल'
'%ीन'
'%ीय'
'%कीय'
'%ीय%'
'%कीय%'
'%त्व%'

marathi_words_table

खाली दिलेल्या टेबलमध्ये सर्व प्रकारचे अव्यय, उपसर्ग वगैरे जमा केले. आता एकाच क्वेरीने विविध प्रकारचे शब्द चुकीचे/ बरोबर शब्द शोधणे शक्य होईल असे दिसते. उदा. एक क्वेरी सर्व शब्दांच्या डेटाबेसवर वापरली की शब्दयोगी अव्यय लावलेले बहुतांश शब्द सहज मिळू शकतील. अर्थात याचा फायदा नक्की कसा, कोणाला होईल ते सांगता येत नाही. पण भाषेचे अभ्यासक याचा उपयोग करून घेऊ शकतील असे वाटते.

करिता हा शब्दयोगी अव्यय आहे, करी हा प्रत्यय आहे तर कु हा उपसर्ग आहे. म्हणून त्यांना प्रत्येकी १,२ व ३ असे नंबर मिळाले. असे सर्व अव्यय, प्रत्यय आणि उपसर्ग एका जागी आणून त्याचा उपयोग करून अशुद्ध शब्द मिळतात का ते पाहायचे आहे.

add_type
(1, 1, 'शब्दयोगी अव्यय'),
(2, 1, 'प्रत्यय'),
(3, 2, 'उपसर्ग')

add_word
(1, 'करिता', 'करीता', 'याकरिता'),
(2, 'करी', 'करि', 'गावकरी'),
(3, 'कु', 'कू', 'कुसंगती'),
(2, 'करू', 'करु', 'यात्रेकरू'),
(1, 'करून', 'करुन', 'येणेकरून'),
(1, 'करवी', 'करवि', 'याकरवी'),
(2, 'कीय', 'किय', 'परकीय'),

उपसर्ग मात्र जसाच्या तसा लागतो. त्यामुळे ते शब्द शोधणे सोपे आहे. प्रत्ययामध्ये असे कोणते प्रत्यय आहेत की जे जसेच्या तसे वापरले जातात? आणि असे कोणते प्रत्यय आहेत (वर दिलेल्या व्यतिरिक्त) जे शेवटचे अक्षर बदलण्यास कारण होतात?

अधिक तांत्रिक माहिती या दुव्यावर उपलब्ध आहे.

http://code.google.com/p/hunspell-marathi-dictionary/wiki/avya_pratya_up...

लेखनविषय: दुवे:

Comments

चांगला प्रयत्न पण हेतू नीट समजला नाही

चांगला प्रयत्न पण हेतू नीट समजला नाही.

"याकरीता" हा लेखनप्रयोग अप्रमाण आहे खरा - प्रमाणरूप "याकरिता" असे आहे - पण त्यासाठीचा नियम असा :
पदातील उपांत्य स्वर मराठीमध्ये ह्रस्व असतो. (अंत्य 'अ' निभृत/लुप्त-उच्चार असल्यास तो मोजू नये.)
"करिता" हा शब्द कित्येकदा शब्दयोगी अव्यव नसून सुटा कृदंत असतो. उदाहरणार्थ : "यात्रा करिता करिता मी काशीक्षेत्री पोचलो." मी येथे दिलेला (आणि मराठी विषय शिकवताना शाळेत सांगितलेला) नियम येथेसुद्धा तितकाच उपयोगी पडतो. पण तुम्ही शब्दयोगी अव्ययासाठी दिलेला मर्यादित नियम उपयोगी पडत नाही.

त्याच प्रमाणे "यात्रेकरु" हा लेखनप्रयोग अप्रमाण आहे खरा - प्रमाणरूप "यात्रेकरू" असे आहे - पण त्यासाठीचा नियम असा :
पदातील अंत्य स्वर मराठीमध्ये दीर्घ असतो. (अंत्य 'अ' निभृत/लुप्त-उच्चार असल्यास तो मोजू नये.)
"करू" हे ध्वनिरूप कित्येकदा सुटे क्रियापदरूप म्हणून वापरात येते : "आपण आधी अभ्यास करू मग खेळायला जाऊ." मी येथे दिलेला (आणि मराठी विषय शिकवताना शाळेत सांगितलेला) नियम येथेसुद्धा तितकाच उपयोगी पडतो. पण तुम्ही प्रत्ययासाठी दिलेला मर्यादित नियम उपयोगी पडत नाही.

असाही फायदा

सर्व देवनागरी शब्दांना (हिंदी धरून - तिथे अव्यय वगैरे नसतील, पण अन्य काही नियम नक्कीच असतील) रिलेशनल डेटाबेसच्या कक्षेत आणण्याचे अनेक फायदे होऊ शकतील. "प्रति" उपसर्ग लागलेले सर्व शब्द शोधणे, किंवा "करवी" या अव्ययाने सिद्ध झालेले सर्व शब्द मिळवणे, असे अनेक कोशस्वरूपी काम एखादा तंत्रज्ञ "मजूर" थोड्या मोबदल्यात करून देईल. माझ्या माहितीप्रमाणे मराठीत असे व्हर्टिकल कोश नाहीत.

उदाहरण द्यायचे झाले तर "कीय" प्रत्यय लागलेले सुमारे २८ शब्द मिळाले. ही संख्या भविष्यात वाढण्याचीच शक्यता आहे.

उद्योजकीय, गोमंतकीय, चुंबकीय, जनुकीय, दिग्दर्शकीय, परकीय, वैद्यकीय, व्यवस्थापकीय, शासकीय, संगणकीय, संपादकीय

काही प्रत्यय सर्व शब्दांना लागत असले तरी ते तसे प्रत्यक्ष वापरात नसतात. तेंव्हा असे शब्द यात येणार नाहीत याची काळजी घेतली गेली आहे. म्हणजे नित्य वापरातल्या सुमारे दीड लाख शब्दांतून विविध प्रकारचे लघुकोश बाय प्रॉडक्ट म्हणून मिळवता येतील.

अवांतरः
अगदीच काही नाही तर शब्दकोडे बनविणार्‍यांना आणि सोडविणार्‍यांना याचा नक्कीच फायदा होईल :)
उदा. "नि" ने सुरु होणारे आणि "ह" ने संपणारे शब्द....

निःसंदेह
निःस्पृह
निग्रह
निरुत्साह
निर्मोह
निर्वाह
निषेधार्ह

ही क्वेरी वापरून...
SELECT * FROM wordbase WHERE word LIKE ('नि%') AND word LIKE ('%ह')

पण प्रत्यय -ईय आहे :-(

तुमची महत्त्वाकांक्षा मोठी आहे, आणि तसे उत्तुंग ध्येय असणे चांगले धोरणही आहे.

पण वरील उदाहरणांत प्रत्यय "कीय" नसून "ईय" आहे.
उद्योजक + ईय = उद्योजकीय, (उद्योज+ कीय असे नव्हे)
गोमंतक + ईय = गोमंतकीय, (गोमंत + कीय असे नव्हे)
चुंबक + ईय = चुंबकीय, (चुंब + कीय असे नव्हे)
...
संपादक + ईय = संपादकीय (संपाद + कीय असे नव्हे)

शब्दकोडे सोडवणारा कोशसुद्धा हवा. पण तो प्रकार बराच वेगळा असावा. उदाहरणार्थ ५-अक्षरी शब्द, दुसरे अक्षर "मं" आणि चवथे अक्षर "की" = *मं*की*; असे देता "गोमंतकीय" सारखे पर्याय मिळाले तर चांगलेच आहे.

अशा प्रकारचे प्रयोग

ईय प्रत्यय संगणकाला देताना खाली दिल्याप्रमाणे द्यावा लागतो.
'%ीय%'
तशी सोय असल्यामुळे "वर्णनीय" सारखे शब्दही मिळू शकतात. लेखात तसा उल्लेख करायचा राहून गेला आहे.
_____

अशा प्रकारचे विविध प्रयोग एका ठिकाणी फार चांगल्या प्रकारे चालू आहेत. उदा. खालील पानावर "गोमंतकीय" असा शोध घेतला की प्रत्येक अक्षराचे त्या शब्दातील स्थान कळू शकते.

http://silpa.org.in/Syllabalize

याचा कोड ओपन सोर्स असल्यामुळे एखादा प्रोग्रामर याचा उपयोग करून आपण म्हणता तशी सोय ऑनलाईन उपलब्ध करू शकतो.

स्वकीय?

परकीयमध्ये मूळ शब्द परका हा असेल तर स्वकीयमध्ये तो स्वक असा असला पाहिजे. बरोबर? परंतु स्वक, राजक असले शब्द मराठीत कधी वापरले गेलेले पाहिले नाहीत.-- वाचक्नवी

संस्कृतातून तत्सम

"स्वक, (परक)" हे संस्कृत शब्द मुळात घेऊन त्यांना -ईय प्रत्यय लावून "स्वकीय, (परकीय)" होतात, हे बरोबर आहे. पण तुम्ही म्हणता तेही खरेच - "स्वक" असे रूप मराठीत प्रचलित नाही.

("क" हा "स्व-अर्थी" प्रत्यय आहे. "स्व" आणि "स्वक" [किंवा "बाल" आणि "बालक"] यांच्या अर्थात तसा सुस्पष्ट फरक नाही.)

"स्वकीय" हा शब्द मराठीत तत्सम मानला पाहिजे.

शब्दकोडे सोडवणारा संगणक

मी एक नमुना पान तयार करून त्याची चाचणी घेतली आहे. मला अजूनही नेमक्या स्थानावर येणाऱ्या अक्षरांचा शोध घेणे जमलेले नाही. पण "मं" आणि "की" ही दोन अक्षरे असलेले सर्व शब्द मिळवता येत आहेत. असे फक्त चारच शब्द मिळाल्यामुळे हवा असलेला गोमंतकीय शब्द शोधणे अवघड ठरू नये.

http://tinyurl.com/3ebl2rs

ही सोय गंमत म्हणून वापरण्यासाठी आहे. त्यात अजूनही बरेच बग्स आहेत. कोणाला यात सुधारणा करायची असेल तर याचा सोर्स कोड येथे पाहता येईल. गुगल् कोडच्या "डाऊनलोड्" सेक्शनमध्ये आवश्यक असणारा विदा उपलब्ध आहे. (mysql)
http://tinyurl.com/3z8gqzh

अपडेटः
आता यात पुष्कळ सुधारणा केलेली आहे आणि याचा वापर करून आपण कोणताही शब्द सहजगत्या शोधू शकतो.

पूर्ण यादी

अरूण फडके यांच्या मराठी लेखन कोशात खाली दिलेले शब्द मिळाले. या यादीत आणखी काही शब्दांची भर घालता येईल का?

शब्दयोगी अव्यय
कडील, कडून, करता, करवी, करिता, करून, खाली, खालील, खालून, ठायी, देखील, नजीक, निमित्त, निराळा, पक्षी, परी, परीस, पाशी, पासून, पैकी, पोटी, प्रती, प्रीत्यर्थ, बदली, बरहुकूम, बिगर, बी, बुंद, मधून, मागाहून, मागून, माजी, रहित, लागी, वरी, वरील, वरून, वाचून, वाणी, वारी, विन, विना, विरहित, विरुद्ध, विशी, विषयक, विषयी, वीण, व्यतिरिक्त

प्रत्यय
करी, करू, कारी, कीय, गिरी, गीर, त्व, धारी, पुरःसर, पुरस्सर, पूर, पूरक, पूर्व, पूर्वक, रीत्या, वादी, िक, ित, िय, िल, ीक, ीत, ीन, ीय

उपसर्ग
अति, अधि, अनु, अभि, उप, कु, दु, नि, परि, पूर्व, प्रति, बहि:, बहु, वि, सु

अव्ययान्त शब्दांच्या षष्ठ्या

दिशादर्शक शब्दयोगी अव्ययान्त्य शब्दांना षष्ठीचे प्रत्यय बहुधा लागू शकतात. दिवा+ खाली+चा= दिव्याखालचा/ची/चे/च्या.
षष्ठी लावल्यानंतर आणखीही प्रत्यय लागू शकतात. उदा० दिव्याखालच्याने पंख्याखालच्याचीला उद्देशून बोलावे.
पंखा+ खाली+ च्या(+ ची)+ ला.

गावाकडच्याने=गांव+कडे+चा+ने

घरानजीकच्या रेल्वे स्टेशनपासूनचे अंतर ... आहे. वगैरे---वाचक्नवी

उपान्त्य स्वर

>>पदातील उपांत्य स्वर मराठीमध्ये ह्रस्व असतो.<<
हा नियम फक्त अकारान्त नसलेल्या शब्दांसाठी आहे. अकारान्त शब्दांतला उपान्त्य स्वर दीर्घ असतो. हा नियम तत्सम शब्दांना लागू नाही. वरुण, करुण, तरुण, गरुड, मधुर वगैरे तत्सम शब्दांतला उपान्त्य स्वर र्‍हस्व आहे.
मराठीत मूळ किंवा प्रत्ययान्त शब्दांतले उपान्त्यपूर्व इकार-उकार र्‍हस्व असतात. निळकंठ, भारुडाने, सोलापुरात वगैरे.. अपवाद, जोडशब्द : आईबाप, मीठभाकर, दहीवडा वगैरे आणि शब्दयोगी प्रत्ययापूर्वीचे शब्द : सोलापूरहून, गरिबीमुळे वगैरे.--वाचक्नवी

(अंत्य 'अ' निभृत/लुप्त-उच्चार असल्यास तो मोजू नये.)

(अंत्य 'अ' निभृत/लुप्त-उच्चार असल्यास तो मोजू नये.) असे स्पष्टीकरण वरच्या नियमात दिलेले आहे. तत्सम शब्दांचे वैशिष्ट्य तर आहेच.

माझ्या वरील प्रतिसादातला मथितार्थ इतकाच होता : "जे नियम शाळेत शिकवतात आहेत ते सोयीस्कर आहेत, प्रत्यय/उपसर्ग वगैरे विचाराशिवाय संगणकीय प्रणालीमध्ये त्यांची अंमलबजावणी होऊ शकेल." सर्व नियम पूर्णतः देण्याची मनीषा नव्हती.

येणेकरून?

येणेकरून, जेणेकरून, तेणेकरून या शब्दांतले करून हे शब्दयोगी अव्यय अनुक्रमे हा, जो, आणि तो या सर्वनामांच्या तृतीयेच्या रूपांना लागलेले दिसते आहे. (`ने' चा `णे ' का झाला ते माहीत नाही!)
काही शब्दयोगी अव्यये षष्ठीच्या प्रत्ययानंतरही लागतात. त्याच्याकडून, तिच्यासाठी, ह्याच्याहून वगैरे. मात्र, तृतीयेच्या प्रत्ययानंतर लागणारी शब्दयोगी अव्यये दुर्मीळ असावीत.
--वाचक्नवी

एक शंका-

मला तुमचे म्हणणे नीटसे कळलेले नाही. 'करीता' हा शब्द शोधला तरीही 'याकरिता' हा शब्द मिळेल असे तुमचे म्हणणे आहे का/

राधिका

होय. आणि तितकेच नाही.

>> 'करीता' हा शब्द शोधला तरीही 'याकरिता' हा शब्द मिळेल असे तुमचे म्हणणे आहे का?
होय. आणि तितकेच नाही.
"करीता" किंवा "करिता" असे काहीही शोधले तर "याकरिता" व त्याचबरोबर "करिता" या शब्दयोगी अव्ययाने बनलेले इतर शब्द मिळू शकतात.
असे विविध प्रकारचे शोध घेता येतील. इंग्रजीत सांगायचे तर "ओन्ली स्काय इज लिमिट".

अवांतर

शब्दांच्या अशा रेडिमेड याद्यांचा फायदा काय किंवा त्याची गरज कधी लागते? सर्वात पहिली गरज व्याकरणाचे नियम समजवून घेताना. हे नियम बनविताना अक्षरशः दोन दोन शब्दांची उदाहरणे देऊन क्लिष्ट नियमांची बोळवण केलेली असते. बाकी दुनियाभरचे शब्द मराठी की तत्सम याचा निर्णय करण्याची जबाबदारी फार कुशलतेने आपल्यावर ढकललेली दिसते. परिणामी सामान्य माणसाचा नियम न पाळण्याकडे कल बनतो. माझा व्यक्तिगत अनुभव द्यायचा तर नियम ८.१ चा देईन.

नियम ८.१ उपान्त्यी दीर्घ ई किंवा ऊ असलेल्या मराठी शब्दांचा उपान्त्य ई-कार किंवा ऊ-कार उभयवचनी सामान्यरूपांच्या वेळी र्‍ह्स्व लिहावा.
# उदाहरणार्थ: गरीब-गरिबाला,गरिबांना,चूल-चुलीला,चुलींना.

# अपवाद-दीर्घोपान्त्य तत्सम शब्द
# उदाहरणार्थ:परीक्षा-परीक्षेला, परीक्षांना, दूत-दूताला, दूतांना.

यातील उदाहरणे नियम समजायला पुरेशी नाहीत. या नियमात बसणार्‍या सर्व मराठी शब्दांची यादी कुठे मिळेल का असा प्रश्न मी दोन तज्ञांना विचारला. त्यांच्या माहितीत अशी यादी नाही. मी अशी यादी बनवू शकतो असा हा दावा नाही. पण कोणी बनवू पहात असेल तर त्याला लागणारी विविध प्रकारची परम्युटेशन्स आणि कॉम्बिनेशन्स संगणक बनवण्यास समर्थ आहे. त्यासाठी "एस.क्यू.एल" ही भाषा अवगत असायला हवी व ती आता सर्वमान्य झाल्याने कोणाही प्रोग्रामरला येतेच.

 
^ वर