नियमित जोडाक्षरांची संख्या

मनोगतावर शुद्ध मराठी यांनी एका धाग्यावर खालील प्रतिसाद दिला आहे.
***
मराठीत एकूण दहा हकारयुक्त व्यंजने आहेत. ख-छ-ठ-थ-फ आणि घ-झ-ढ-ध-भ. यांतल्या दुसर्‍या पाचांना फक्त य-र-ल-व-ण-न-म ही सातच व्यंजने जोडता येतात. त्यामुळे अर्घ्य, व्याघ्र, ओझ्याने, मढ्याला, विघ्‍न, अभ्रा हे शब्द बनतात. पहिल्या पाचांना म्हणजे, ख-छ-ठ-थ-फ यांना यरलवणनम ही व्यंजने लागतातच पण त्यांशिवाय तीच व्यंजने लागून त्यांचे द्वित्त बनते, आणि लख्ख, कछ्छा, लठ्ठ, जथ्था, लफ्फा असले शब्द बनू शकतात. या हकारयुक्त व्यंजनांना इतर कुठलीही व्यंजने लागू शकत नसल्याने ध्‍द आणि ध्ध असली जोडाक्षरे कुठल्याही भारतीय भाषांत नसतात.
***
एकूण व्यंजने ३४. त्यातील प्रत्येक व्यंजन कोणत्याही व्यंजनाला लागून होऊ शकणारी एकूण जोडाक्षर संख्या आहे ११५६ (३४ * ३४)

क्,ख्,ग्,घ्,ङ्,
च्,छ्,ज्,झ्,ञ्,
ट्,ठ्,ड्,ढ्,ण्,
त्,थ्,द्,ध्,न्,
प्,फ्,ब्,भ्,म्,
य्,र्,ल्,व्,श्,ष्,स्,ह्,ळ्

एका व्यंजनाला एकापेक्षा अधिक व्यंजने मिळून काही जोडाक्षरे मिळू शकतात, पण अशी जोडाक्षरे सध्यापुरती विचारात घेत नाही. वर दिलेला नियम लक्षात घेतला तर व्हॅलिड जोडाक्षरांची संख्या खूपच कमी होऊ शकते. माझ्या मते ही संख्या ८९१ इतकी होईल. हा आकडा बरोबर आहे का? ही आकडेमोड कशी केली ते येथे पाहता येईल.

http://code.google.com/p/hunspell-marathi-dictionary/wiki/Jodakshar

Comments

सुयोग्य विश्लेषण

तुमच्या विश्लेषणाची पद्धत सुयोग्य आहे. संख्या तपासून बघितलेली नाही.

संस्कृत-प्राकृतावेगळ्या अन्य भाषांमधून काही शब्द मराठीत रूढ झालेले आहेत. त्यामुळे पूर्वी नसलेली काही जोडाक्षरे आता मराठीमध्ये दिसतात. परंतु फक्त तेवढ्या शब्दांपुरतेच दिसतात.

श्+(स् | त् | थ् | द् ) ही जोडाक्षरे मराठीत दिसत नाहीत. उर्दूतून आलेल्या एखाद्या शब्दात असतील - आता पटकन आठवत नाहीत, "कश्ती=नौका" शब्द मराठीत वापरत असतील तर हे उदाहरण होऊ शकेल.

क्ट, स्ट वगैरे जोडाक्षरे फक्त इंग्रजीमूलक शब्दांत दिसतात.

- - -
प्राथमिक संकेत पाणिनीच्या संस्कृतामधील निरीक्षणांपासून घेतला, तर बरीच जोडाक्षरे बाद होतील. मग वर सांगितल्याप्रमाणे मराठीसाठी ग्राह्य असलेले अपवाद पुन्हा निवडून घेता येतील.

उदाहरणार्थ : पाणिनीचा हा नियम घेऊया -
(स्|त्|थ्|द्|न्) + (श्|च्|छ्|ज्|झ्|ञ्) => (श्|च्|छ्|ज्|झ्|ञ्) + (श्|च्|छ्|ज्|झ्|ञ्)
(श्|च्|छ्|ज्|झ्|ञ्) + (स्|त्|थ्|द्|न्) => (श्|च्|छ्|ज्|झ्|ञ्) + (श्|च्|छ्|ज्|झ्|ञ्)

वरील नियमांप्रमाणे डावीकडली जोडाक्षरे कधी बनायचा प्रश्नही उद्भवला, तर उजवीकडचीच जोडाक्षरे वापरातल्या दिसतात. अशा प्रकारे पटकन ग्राह्य नसलेली ३६+३६ = ७२ जोडाक्षरे मिळतात. त्यात फक्त "श्न" वगैरे अपवाद पुन्हा "ग्राह्य" म्हणून ओढून घेता येतात. (तो अपवाद संस्कृतातच ग्राह्य असल्यामुळे पाणिनीनेच तो अपवाद सांगितलेला आहे. पण मराठीत कुठे श्त सापडत असेल, तर तो अपवाद "ग्राह्य" सूचीमध्ये ओढून घेता येईल.)

पाणिनीच्या निरीक्षणातल्या "झलां जश् झशि*" या नियमाचा एक अंश तुम्ही स्वतः विचार करून स्वकर्तृत्वाने शोधून काढला, मराठीत ख्ख वगैरे संस्कृतात ग्राह्य नसलेली जोडाक्षरे ग्राह्य आहेत हे नमूद केले. हे अतिशय कौतुकास्पद आहे.
*नियमाचे आंशिक डिकोडिंग (पूर्ण डिकोडिंगसाठी अन्य डिफाइन-वाक्येही लागतात) :
(क्|ख्|घ्|च्|छ्|झ्|ट्|ठ्|ढ्|त्|थ्|ध्|प्|फ्|भ्|श्|ष्|स्|ह्)
+
(ग्|घ्|ज्|झ्|ड्|ढ्|द्|ध्|ब्|भ्)
=>
(ग्|ज्|ड्|द्|ब्) +
(ग्|घ्|ज्|झ्|ड्|ढ्|द्|ध्|ब्|भ्)
भाषेतील अंतिम रूपात वरील बदल अपरिहार्यपणे होत असल्यामुळे "=>" चिह्नाच्या आदली १९*१० = १९० जोडाक्षरे बाद होतात.

मात्र पाणिनीच्या नियमांच्या यादीमध्ये हॅन्स्पेल-डेव्हलपरकरिता एक कमी आहे. कित्येक अशी जोडाक्षरे असतात, जी तयार व्हायची शक्यताच विचारात घेण्यालायक नसते. त्या जोडाक्षरांचा विचार पाणिनीने केलेलाच नाही.
"ठ्च, झ्ल" ही जोडाक्षरे मराठीत कुठेच लिहिलेली सापडणार नाहीत. (मात्र गंमत म्हणजे प्रमाणबोलीमध्ये हे उच्चार मात्र दिसतात - कुठ्चा, विझ्ला, वगैरे उदाहरणे आहेत.) पण ती जोडाक्षरे शोधून काढण्यासाठी झटपट सूत्रे पाणिनीकडून मिळायची नाहीत. शंतनू करत आहेत, तसा प्रयत्न करून सूत्रे मिळू शकतील.

चार व्यंजनांची जोडाक्षरे

चार व्यंजने मिळून मराठीत/ संस्कृतात कोणकोणते शब्द बनतात? मला सध्यातरी एकच शब्द मिळाला आहे.
धार्ष्ट्य
इंग्रजीत असे काही शब्द मिळाले.
एक्स्ट्रा, एक्स्प्लनेशन, ऍन्ड्र्यू , एन्फ्ल्युएन्स, इन्स्ट्रक्शन, इन्स्ट्रूमेंट, ऑब्स्ट्रक्शन, एक्स्क्लूझिव्ह, एक्स्प्रेशन
या बाबतीत काही नियम आहेत का? चारापेक्षा जास्त व्यंजनांची गरज एखाद्या जोडाक्षराला लागू शकेल का? की ती कमाल मर्यादा मानून चालता येईल?

संस्कृतातील "कार्त्स्न्य"मध्ये पाच व्यंजने

संस्कृतातील "कार्त्स्न्य" (=एकूण) शब्दात पाच व्यंजनांचा समूह आहे र्+त्+स्+न्+य्
हा शब्द तत्सम म्हणून बहुधा मराठीत वापरता येईल.
माझ्या एका शिक्षकाने मला सांगितले की त्यांना माहीत असलेला सर्वाधिक जोडलेल्या व्यंजंनांचा हा शब्द आहे.

तुम्ही शोधलेला "धार्ष्ट्य" (धृष्ट->धार्ष्ट्य) आणि हा "कार्त्स्न्य" (कृत्स्न->कार्त्स्न्य) यांच्या व्युत्पत्तीमध्ये साम्य आहे.

चार किंवा अधिक व्यंजने असलेल्या जोडाक्षरात बहुधा २ तरी अर्धस्वर (य्,र्,ल्,व्) लागावेत असा माझा प्रस्ताव आहे.

(या "-य" प्रत्ययांत शब्दांना सोडले तर तीन व्यंजने ही जोडाक्षरांची कमाल मर्यादा असावी, असेही मला वाटते आहे. पण अधिक शोध घ्यावा लागेल.)

मराठी-संस्कृतात लागणारी जोडाक्षरे

बापुराव नाईकांनी त्यांच्या मुद्रणशास्त्रावरच्या पुस्तकात छापखान्यात कोणकोणते खिळे असतात त्यांची एक यादी दिली आहे. त्यांत दोनव्यंजनी ते चारव्यंजनी जोडाक्षरांसाठी लागणार्‍या एकूण ३७८(फक्त) टंकांची जंत्री आहे. त्या नोंदीप्रमाणे सर्वात जास्त म्हणजे ४६ जोडाक्षरे ऋची(रफाराची) आणि त्याखालोखाल 'क्' आणि 'त्'ची प्रत्येकी २२ जोडाक्षरे आहेत, असे दिसते.
चार-पाच व्यंजनी जोडाक्षरांत र्त्स्न्य-र्ष्ट्य शिवाय स्त्र्य(स्+त्+र्+य), त्स्म्य आणि 'मंत्र्याने'साठी लागणारा न्त्र्य देखील दिला आहे. -- वाचक्नवी

छापखान्यातील यंत्रे व युनिकोडमधील मुलभूत फरक

अर्क हा शब्द जुन्या खिळ्यांच्या छापखान्यात बनवताना अ + क + रफार अशा तीन खिळ्यांनी बनत असावा. युनिकोडमध्ये तो अ + र + हलन्त + क असा चार संकेतांचा आधार घेऊन बनतो. खाली दिलेल्या पानावर जाऊन आपण खात्री करून घेऊ शकता.

http://smc.org.in/silpa/CharDetails

आता रफारयुक्त क "दाखविण्याची" जबाबदारी फॉन्ट (युनिकोडित असल्यास किरण, सुषा इ.) व ऑपरेटिंग सिस्टीम (विंडोज / लिनक्स) यांच्यावर येऊन पडते. ही जबाबदारी कमी अधिक प्रमाणात पार पाडली गेली आहे पण त्यात गेल्या काही वर्षात इतके बदल वेगाने होत गेले की अक्षरशः अनागोंदीची परिस्थिती निर्माण झाली. अर्थात खिळ्यांची पद्धत कालबाह्य झाली असल्याने तो दोर केंव्हाच कापला गेला आहे.

मराठीत वापरात असलेली सुमारे १,४०० जोडाक्षरे मला मिळाली. ती येथे पाहता येतील.

http://hunspell-marathi-dictionary.googlecode.com/files/jod1_in_use.csv.zip

आता ही जोडाक्षरे ३७८ चिन्हांच्या सहाय्याने लिहिता येऊ शकतात असा निष्कर्ष काढायला हरकत नाही.

(३७८ टंकांची जंत्री नेटवर कुठे पाहता येईल?)

३७८ जोडाक्षरे

>>३७८ टंकांची जंत्री नेटवर कुठे पाहता येईल?<< नेटवर नसेल. पण मी श्री. शंतनू म्हणतील तिथे किंवा उपक्रमावर लिहून पाठवू शकेन. त्यात अडचण एवढीच येईल की माझ्याकडे उपलब्ध असलेल्या फॉन्ट्समध्ये ती जोडाक्षरे नीट टंकित करता येतीलच अशी खात्री नाही. अशा वेळी कदाचित त्या जोडाक्षराचे वर्णन करावे लागेल. उदाहरणार्थ क्र या अक्षराचे वर्णन 'त्रच्या स्वरदंडाच्या विरुद्ध बाजूला कची उजवी वाटी जोडली की जसे दिसेल तसे' असे करावे लागेल. यात थोडाफार वेळ जाईल.

मागे मी एक विपत्र पाठवले होते, ते शंतनूरावांच्या खात्यात जागा शिल्लक नसल्याने परत आले होते. असे होऊ नये यासाठी जिथे खात्रीने स्वीकार होईल असा पत्ता असावा.

नाहीपेक्षा, पुस्तकाच्या पानाचे मी जमल्यास, प्रतिमांकन करून पाठवण्याचा प्रयत्न करीन. एक दोन दिवस लागू शकतील. कुठे पाठवायचे तेवढे माहीत असले की झाले. --- वाचक्नवी

र्क

>>अर्क हा शब्द जुन्या खिळ्यांच्या छापखान्यात बनवताना अ + क + रफार अशा तीन खिळ्यांनी बनत असावा.<<
मी वरती निर्दिष्ट केलेल्या मुद्रणशास्त्रावरच्या पुस्तकात दिलेले जर खरे असेल, तर र्क चा स्वतंत्र खिळा होता. ..वाचक्नवी

अनुस्वाराचे काय

जोडाक्षरात आलेल्या अनुस्वाराचे कसे काय जमविले आहे? उदा. अर्कांना हा शब्द लिहिताना "र्कां" असा एक पूर्ण खिळा तेव्हा वापरात होता का?

नसावा

मी 'मौज'ने छापलेली काही पुस्तके पाहिली. का अक्षराकडे पाहताना क हा एक खिळा आणि शिरोरेषेसहित काना हा दुसरा खिळा आहे हे, 'क'वरील आणि कान्यावरील शिरोरेषांतल्या फटीवरून समजले. र्क मध्ये रफार आणि क यांच्यात फट जाणवत नाही. 'र्का'त क चा वेगळा खिळा आणि रफारासहित कान्याचा दुसरा खिळा असावा असे दिसते. अनुस्वार हा तिसरा खिळा असावा. म्हणजे अर्कांनासाठी क, रफारयुक्त काना आणि अनुस्वार असे तीन खिळे लागत असावेत.. हा केवळ निरीक्षणावरून बांधलेला अंदाज आहे, लेखी पुरावा सापडलेला नाही.. .वाचक्नवी

द्ध आणि ध्द

या दोन अक्षरांवरून कुठेतरी वाचलेली एक गोष्ट आठवली. मोक्षमुल्लरसाहेब जर्मनीमध्ये एका संस्कृत पुस्तकाची छपाई करत होते. त्यांचा संस्कृतलिपी तज्ज्ञ खिळेजुळारी मजकुराचे खिळे जुळवीत होता. त्याच्या समोर ध्द हे अक्षर आले. तो किंचित गडबडला. म्हणाला, हे अक्षर संस्कृतमध्ये असेल असे मला वाटत नाही. कारण हे अक्षर जुळवताना मला डाव्या हाताने उचलायचा खिळा उजव्या हाताने आणि उजव्या हाताने उचलायचा डाव्या हाताने घ्यावा लागतो आहे. साहजिकच माझ्या हाताची फुली होते आहे. असे आजवर झालेले नाही.

मॅक्समुल्लरांनी अक्षर बदलून द्ध असे करून दिले. ..वाचक्नवी

गोष्ट आवडली, पण समजली नाही

खिळे जुळवणार्‍याने आधी "ध्य", "ध्व" वगैरेंकरिता खिळे जुळवले असतील, तर त्याच्या डाव्या हाताशी अर्ध्या "ध्"चा खिळा उपलब्ध असेल. तसेच "न्द" सुद्धा संस्कृतात पुष्कळदा आढळतो, तर "द"चा खिळा उजव्या हाताने वापरायची वेळही आली असेलच. एक तर त्याने त्याकरिता ते खिळे डावीकडे/उजवीकडे ठेवले असतील, किंवा त्यावेळीसुद्धा त्याच्या हातांची फुली झाली असेल.

तर मग या "ध्द"च्या संदर्भातच खिळे जुळवणार्‍याला हा प्रश्न कसा काय पडला?

संस्कृतात "ध्द" हे जोडाक्षर साधु नाही, हे संस्कृत न-कळणार्‍या खिळे जुळवणार्‍याने हुशारपणे ओळखले असेल, ही कथा फारच आवडलेली आहे. पण समजलेली नाही.

शंका समजली

शंका समजली. तूर्तास उत्तर माहीत नाही. कदाचित खिळे ठेवण्याचे फक्त उजवे नि डावे कप्पे नसतील. आणखीही उपकप्पे असावेत, कसे असतील त्याचा अंदाज करण्याचा प्रयत्न करावा लागेल.--वाचक्नवी

वा!

शंतनु तुस्सी ग्रेट हो!
बाकी पुण्याची आणि पुण्ण्याची हे दोन्ही शब्द पुण्याची असेच लिहिले जातात. जर एखाद्याने पुण्ण्याची लिहिला तर तो योग्य की अयोग्य? असे योग्य असल्यास काहि जोडाक्षरे वाढतील का?

ऋषिकेश
------------------
कधी कधी तुम्ही काय बोलताय हे तुम्हालाहि कळत नाहि, इतके तुम्ही हुशार आहात का?

ण्ण्य

ण्ण्य धरला आहे...वाचक्नवी

धोपट मार्ग

ती ३७८ जोडाक्षरे इतर कुठल्याही प्रकाराने कळवण्यापेक्षा मी इथेच लिहून पाठवत आहे. अशी:

क्‌ + कखचछट, ठणतथन, पफमयर, लवषस, + क्त्य,क्ट्र,क्त्र,क्त्त्व(एकूण २३)(पुस्तकात २२ म्हटले आहे. यांत क्श आले नाही, ते धरले तर एकूण २४). क्+ष ची गरज नव्हती, कारण त्यासाठी क्ष आहे.
ख्‌ + नमयव(एकूण ४)(यांत ख्ख-ख्र धरले नाहीत्, ते धरले तर ६)
ग्‌ + गघजझढ, ढणदधन, बभमयर, लव + ग्ध्य,ग्ध्व(१९)
घ् + नमयरव(५)
ङ्‌ + कखगघङ, नभमयर, वशषह(१४)
च्‌ + चछञमय, व + च्छ्‌ल,च्छ्‌व(८)
छ्‌ + यरलव(४)(छ्छ धरला नाही, धरल्यास ५)
ज्‌ + जझञमय, रव(७)(ज्+ञ ची गरज नव्हती कारण त्यासाठी ज्ञ आहे.
झ्‌ + यव(२)
ञ्‌ + चछजझश(५)(मराठीत ही पाचही लागणार नाहीत कारण मराठी पर-सवर्णऐवजी अनुस्वारच वापरला जातो. पण सोय हवी.)
ट्‌ + कखचछट, ठतथपफ, यरवशष, स(१६)
ठ्‌ + णयव(३)(ठ्ठ धरला नाही तो धरून ४)
ड्‌ + गघजझड, ढदधबभ, मयरलव(१५)
ढ्‌ + णयव(३)
ण्‌ + टठडढण, नमयवस(१०)(यांत ण्ण्य धरला तर ११)
त्‌ + कखटठत, थनपफम, यरवस + त्स्थ,त्स्न,त्स्म्य,त्त्य,त्म्य, + त्क्ल,त्प्ल,त्त्व(२२)
थ्‌ + नयरव(४)(यांत थ्थ नाही, धरला तर ५).
द्‌ + गघडढड, धनबभय, रव + द्व्य,द्भ्य,द्ध्य((१५)(पुस्तकांत १४ म्हटले आहे)
ध्‌ + नयरव(४)
न्‌ + कगचजत, थदधनफ, भमयरव, शषसह + न्न्य,न्त्र्य(२१)
प्‌ + कखचछट, ठतथनप, फमयरल, वशषस + प्‌+त्य(२०)
फ्‌ + य(१)(यांत फ्फ नाही, तो धरला तर २).
ब्‌ + गघजझड, ढदधनब, भयरलव + ब्ज्य,ब्ध्व(१७)
भ्‌ + णनमयर, लव(७)
म् + णनपफब, भमयरल, व(११)
य्‌ + यव(२)
र्‍ (चंद्रकोरीसारखा र) + याहा(२)
र(रफार) + (ञ सोडून सर्व) + र्ग्ग,र्ज्ज,र्म्म,र्त्त,र्द्ध, र्द्र,र्ष्ट्य,र्त्स्न्य,र्ध्व्य,र्य्य, र्ब्व,र्ध्व(एकूण ४६)(यांत अ-आ-उ-ऊ-ऋ यांना रफार देऊन बनवलेली अक्षरे धरली तर ५१)
ल्‌ + कगपफब, भमयलव, शसहळ + ल्भ्य(१५)
व्‌ + णनयरल, व(६)
श्‌ + कचछनप, मयरलव, श(११)
ष्‌ + कटठणप, फमयव + ष्ट्र,ष्ट्व(११)
स्‌ + कखजतथ, नपफमय, रवस + स्त्र्य,स्प्र,स्त्व(१६)
ह्‌ + णनमयर, लव + हृ(८)
ळ्‌ + य(१)
क्ष्‌ + णम(२)
ज्ञ्‌ + ०(०)

एकूण पुस्तकात दिलेली ३७८.(चूभूद्याघ्या). जास्तीची धरून ३७८+१५=३९३....वाचक्नवी

१४०० जोडाक्षरे

श्री. शंतनूंची १४००(?)(मी १५५९ मोजली!) जोडाक्षरे पाहिली. फाइल अनझिप करायला थोडा त्रास पडला, म्हणून हा प्रतिसाद थोडा उशीरा देत आहे. यादी फारच छान आहे, तिच्यात जर काही जोडाक्षरे राहून गेलीच असतील तर ती शोधायला खूप मेहनत घ्यावी लागेल. घटक अक्षरांचे बहुतेक सर्व क्रमपर्याय विचारात घेतले असतीलच, त्यामुळे विसरून राहिलेली जोडाक्षरे बहुधा नसावीत. मी जी ३७८/३९५ जोडाक्षरांची यादी दिली आहे त्यांत र्‍हा आणि र्‍या हे दोन अपवाद वगळतां, काना-मात्रा-वेलांट्या-अनुस्वार विचारात घेतलेले नाहीत. त्यामुळे ती यादी छोटी आहे.

काही चुकीचे शब्द सापडले. फलशृती, शृंखला, पार्श्वभूमी हे शब्द अनुक्रमे फलश्रृती, श्रृंखला, पाश्वभूमी असे लिहिलेले सापडले. श् ला एकदा ऋ लावायचा म्हटले की आधी र लावायला नको. ही चूक आजकाल सार्वत्रिक आढळते. बहुधा त्यांच्या कळफलकावर 'र' न जोडलेला श्र नसावा.

अस्खलित हा अस्स्खलित असा दिसला. व्यवस्श्या, दिग्मूढ(दिड्मूढ), पुनर्प्रकाशन(पुनःप्रकाशन), मेह्बुब(मेहबूब), निदिर्ष्ट(निर्दिष्ट), हे काही किरकोळ दोष पहिल्या वाचनात मिळाले. ---वाचक्नवी

थोडे स्पष्टीकरण

>> फाइल अनझिप करायला थोडा त्रास पडला
ही यादी इथेही पाहता येईल.

http://tinyurl.com/3zvowld

>> बहुधा त्यांच्या कळफलकावर 'र' न जोडलेला श्र नसावा.
हे शब्द मी टंकित केलेले नसून मराठी स्पेल चेकच्या यादीतून एका प्रोग्रामद्वारे मिळवलेले आहेत. या प्रोजेक्टला काही स्वयंसेवकांनी हातभार लावलेला आहे. चुकीच्या शब्दांची जबाबदारी ढकलण्याचा इरादा नाही. मूळ डेटाबेसमध्ये सुधारणा केली आहे.

>> आता मूळ विषयाकडे
१) हे खिळे गरजेप्रमाणे व गरजेइतकेच बनविले गेले असावेत. (खर्चाच्या व कारागिरांच्या द्दष्टीने) त्यामुळे त्यात काही शब्द (विशेषतः इंग्रजी) लिहिता येणार नाहीत.

क ला ज, झ ड आणि श जोडायची सोय दिसत नाही. त्यामुळे अनुक्रमे फ्लेक्जिबल, अलेक्झांडर, मॅक्डोनाल्ड आणि ओक्साबोक्शी लिहिता येणार नाही.

तीन व चार व्यंजने जोडून क्त्य,क्ट्र,क्त्र,क्त्त्व ही अक्षरे सिद्ध केलेली दिसतात. पण इंग्रजी शब्द लिहिताना अशी बरीच जोडाक्षरे झटपट बनवावी लागतात.
क्श्च - टेक्श्चर
क्क्य - एक्क्याला, चक्क्यांसाठी
क्स्च - एक्स्चेंज
क्स्ट - कॉन्टेक्स्ट
क्स्ड - फिक्स्ड
क्स्प - एक्स्पो
क्स्ल - एक्स्लंट

त्यामुळे ही यादी बॅकवर्ड कॉमॅटिबल (संस्कृतसाठी) असली तरी फॉरवर्ड कॉमॅटिबल (इंग्रजीसाठी) दिसत नाही.

२) या यादीत काही जोडाक्षरे अशी आहेत जी आता प्रचलित नसावीत. उदा. क्ठ, क्ण पासून बनलेले कोणते शब्द तेंव्हा प्रचलित होते हे समजले तर गेल्या ४०-५० वर्षांत हरवलेल्या शब्दांचा शोध घेणे सोपे होईल.

मूळ डेटाबेसमध्ये सुधारणा केली आहे.

>>मूळ डेटाबेसमध्ये सुधारणा केली आहे.<< कदाचित पुन्हा एकदा करावी लागेल.
'फलश्रुती' लिहिताना माझी चूक झाली होती. हा शब्द असाच लिहायला हवा होता.--वाचक्नवी

ण्ण्ण्णाच्या

चिं.वि.जोशींच्या कथेतील वराची आई लग्नसमारंभात विहिणीला काय म्हणते ते ऋषिकेशांना आठवत असेल. ती म्हणते "आम्ही कुण्ण्णाकुण्ण्ण्णाच्या मिंध्या नाही आहोत." हे ण्ण्ण्ण अक्षर विचारात घेतले की जोडाक्षरांची संख्या भरपूर वाढेल. अगदी ऋषिकेशांच्या मनासारखे होईल.---वाचक्नवी

ण्ण, ण्ण्णा, ठ्ठ्ठा, ट्ठा, श्शा,

हा 'कुण्ण्णाकुण्ण्ण्णाच्या' माझ्या ध्यानीमनी नव्हता.. पण तुम्ही म्हणाल्यावर अश्या उद्गारवाचक/लाडिक शब्दांचा विचार करता 'ण्ण्णा'च नाही तर 'मोट्ठ्ठा' मधला 'ट्ठ्ठा' वगैरेही येतील. शिवाय 'कश्शा-कश्शाने' मधला श्शा ही घेता यावा (हा बहुदा यादीत आहे), "च्च्च्" हा नकारदर्शक उद्गार यावा, शिवाय 'श्श्श्श् कुठे बोलु नकोस' म्हधला 'श्श्श्श्' आहेच!

शिवाय ण्ण हा स्वाभाविकरित्या देखील अण्णा वगैरे शब्दात आहेच. मी वर प्रश्न विचारला होता तो ण्ण्य बाबत, जो लिहिताना ण्य लिहितात (जसे अरण्य).. जर एखाद्याने अरण्ण्य असे लिहिले तर शुद्धिचिकित्सकाने ते शुद्ध समजावे की अशुद्ध?

ऋषिकेश
------------------
कधी कधी तुम्ही काय बोलताय हे तुम्हालाहि कळत नाहि, इतके तुम्ही हुशार आहात का?

ह्म्म्म्

हा हा हा.

ह्म्म्म्म् सुद्धा घ्यायला हवा.

नितिन थत्ते

मला वाटते की उच्चार आणि लेखन यांच्यात गफलत

मराठीमध्ये लेखन बरेचसे उच्चारानुसारी आहे, पण तरी तितके नव्हे. "(पाप)पुण्याची बाजारपेठ" आणि "(मुंबई)पुण्याची बाजारपेठ" या ठिकाणी उच्चार वेगवेगळे आहेत, हे ऐकू येतेच. पण चिह्ने एकसारखी असण्याचे लिहिण्याची रीत आहे.

"च्च्च्" म्हणजे "चुकचुकणे" म्हणतात ते आहे काय? याकरिता मराठीमध्ये लिपीमधले "उच्चारानुसारी" चिह्नच नाही. चुकचुकण्याचा हा ध्वनी उच्चारताना हवा आत ओढली जाते, "च्" हे चिह्न सामान्यपणे वापरले जाते, तेव्हा हवा बाहेर जत असते. चुकचुकण्याच्या ध्वनीसाठी "च्च्" असे चिह्न वपरायचे ठरवले तर चालेल. पण ते ठरावामुळे, उच्चारानुसारामुळे नव्हे. (त्यामुळे त्यात च्, च्च्, की च्च्च् असे काहीच नाही.)
तीन किंवा अधिक "शुद्ध" व्यंजने (म्हणजे शषसह, यरलव, आणि अनुस्वार सोडून) जोडाक्षर म्हणून म्हणता येतच नाहीत. त्यांना उच्चारासाठी आदल्या किंवा नंतरच्या स्वराचा/अर्धस्वराचा आधार लागतो.
"मोट्ठ्ठा" हा उच्चार अशक्य आहे, असे माझे मत आहे. त्या लडिवाळ परिस्थितीत उच्चार
मोट्(क्षणार्धशांतता)ठा
असा होतो.

"कुण्ण्ण्णाचे" वगैरे लडिवाळ प्रयोगांत पहिला आणि शेवटचा "ण्" तितका खरा "ण्"कार असतो. मधील काळात तोंडावाटे हवा बाहेर सरत नसते, फक्त नाकावाटे सरत असते.
"कुण् ं ं णाचे"

लिखित-शुद्धिचिकित्सकाने उच्चारानुसारी जोडाक्षरांबाबत दुर्लक्ष करावे, असे मला वाटते.

अक्षरागणिक संकेतांक

युनिकोडमध्ये प्रत्येक अक्षरासाठी एकेक कोड आहे. पण स्वरांची बाराखडी व जोडाक्षरांसाठी वेगळी व्यवस्था नाही. खिळ्यांमध्ये जोडाक्षरांची चांगली सोय आहे पण स्वर हवे तसे लावून घ्यावे लागतात. प्रत्येक व्यंजन, जोडाक्षर आणि स्वरासाठी एक संकेतांक दिला तर त्याचे बरेच फायदे दिसतात. सांकेतिक भाषेत एकमेकांशी संवाद साधू शकू. मुख्य फायदा संगणकाला होईल. कॉम्पुटरवरील डेटा अंकांच्या स्वरुपात साठवून ठेवला तर फारच कमी जागेत खूप पाने साठवता येतात. तसेच शोध सोपा होईल. ऑपरेटिंग सिस्टिटम, फॉन्ट यांची काळजी करावी लागणार नाही.
उदाहरण म्हणून खाली दिलेले वाक्य संकेतांक वापरून कसे लिहिता येईल ते पाहूया.

मी तुझ्यावर प्रेम करतो

HTML: 2350+2368 2340+2369,2333+2381+2351+2366,2357,2352 2346+2381+2352+2375,2350 2325,2352,2340+2379

Unicode: 092e+0940 0924+0941,091d+094d+092f+093e,0935,0930 092a+094d+0930+0947,092e 0915,0930,0924+094b

Machine code for devnagari: 35352542 35351652+3592622+35352912+35352712 21352772+35352512 3535112+35352712+35351692

यातील मी या शब्दाच्या संकेतांकाची (35352542) फोड अशी:
३५३५ याचा अर्थ पूर्णपणे जोडाक्षरविरहित
२५ याचा अर्थ "म" वर्णमालेतील पंचविसावे अक्षर कचटतप - पफबभम (५*५=२५)
४ याचा अर्थ "ई" चौथा स्वर (अ आ इ ई)
२ याचा अर्थ अनुस्वार नाही.
_____
झ्या या अक्षराच्या संकेतांकांची (3592622) फोड :
३५ याचा अर्थ एकच जोडाक्षर
९ क पासूनचे नववे अक्षर झ (क् ख् ग् घ् ङ् च् छ् ज् झ्)
२६ सव्वीसावे अक्षर य
२ दुसरा स्वर "आ"
२ याचा अर्थ अनुस्वार नाही. झ्यां साठी कोड झाला असता 3592621

यासाठी प्रत्येक व्हेरिएशनची मिळून सुमारे ९ लाख कॉम्बिनेशन्स बनू शकतात. ३ व्यंजनांची जोडाक्षरे विचारात घेतली आहेत. ४/५ व्यंजनांची जोडाक्षरे जवळपास नाहीतच. चौथे व्यंजन जोडले तर काही लाख अक्षरे विनाकारण तयार होतात आणि त्यातली लागणारी असतात फक्त २ किंवा ३. अर्थात संगणकासाठी असे शब्द जोडून याद्या तयार करणे म्हणजे माऊसचा मळ आहे.

http://code.google.com/p/hunspell-marathi-dictionary/wiki/Jodakshar

वर दिलेल्या गुगल कोडच्या पानावर akshar_list हे टेबल कसे बनवायचे याचा कोड दिलाच आहे. संगणकाच्या सोयीने डेटा साठवण्याचा आणखी एक पर्याय असे याचे सध्याचे स्वरूप आहे. कोणाला उपयोग झाला तर उत्तम नाहीतर, गाजराची पुंगी....

काही शंका

स्वरचिन्हांसाठी १ ते ९ म्हणजे नऊच आकडे ठेवले आहेत. दीर्घ एकार-ओकार, ऍकार, ऑ, ऋ, ॠ, र्‍हस्व दीर्घ ॡ वगैरेंसाठी मात्राचिन्हे विचारात घेतली तीं एकूण १८ होतील. मग फक्त नऊ आकड्यांत ही स्वर मात्राचिन्हे कशी बसवली आहेत?
व्यंजनासाठी २५+९=३४ आकडे संपले. समजा स्वरांसाठी आणखी १८. एकूण ५२. पण सोय दोन आ़कडी म्हणजे ९९ अक्षरांसाठी आहे, तर त्या रिकाम्या ४७ जागी काय असते? काही खास जोडाक्षरे तिथे ठेवता येतील. शिवाय उभ्या मांडणीची आणि आडव्या मांडणीची जोडाक्षरे टंकित करायची काय सोय असते?
अनुस्वार आहे\नाही यासाठी फक्त दोन आकडे, त्या बाकीच्या आकड्यांचा उपयोग करता नाही येणार ?
४/५ व्यंजनांच्या जोडाक्षरांसाठी सोय ठेवणे फायद्याचे नाही हे समजले. मग आपण तसली जोडाक्षरे संगणकावर कशी टंकित करू शकतो? --वाचक्नवी

 
^ वर