मराठी हायफनेशन नियम
हायफनेशन म्हणजे काय?
कोणताही मजकूर लेफ्ट, राईट, सेंटर व जस्टिफाय अशा चार प्रकारे दर्शविता येतो. यातील जस्टिफाय हा पर्याय स्विकारल्यास काही शब्द मधेच अलग करावे लागतात. यालाच हायफनेशन म्हणतात.
आजच्या टाईम्समधील पहिल्याच पानावरील एका वाक्यात दोन शब्द हायफनेट केले आहेत. sat-urday आणि Na-tional
Kokre was admitted as a
suspected H1N1 case on Friday
and moved to the critical care
unit for confirmed cases on Sat-
urday afternoon after the Na-
tional Institute of Virgology said
he was H1N1 positive.
मग प्रॉब्लेम काय आहे?
इंग्रजी भाषेत असे शब्द कुठेही तोडले तरी फारसा फरक पडत नाही. पण भारतीय भाषा एकापेक्षा अधिक मुळाक्षरे व स्वर मिळवून बनत असतात. त्यामुळे "मिळवून" या शब्दातील "मिळव" एका ओळीत तर "ून" दुसर्या ओळीत असे करून चालणार नाही. या शब्दाची फोड "मिळ वून" अशीच करावी लागेल. सध्या मराठी वर्तमानपत्रे व डी. टी. पी. वाले दोन शब्दांतील स्पेस वाढवतात किंवा लेफ्ट जस्टिफाय करुन हायफनेशनची गरजच लागणार नाही असे पाहतात. स्पेस वाढवल्याने तितक्याच मजकुरासाठी जास्त जागा लागते आणि वाचनात व्यत्यय येतो.
इतर भारतीय भाषांनी काय केले आहे?
संतोष थोटिंगल यांनी भारतातील बहुतेक सर्व भाषांसाठी हायफनेशन नियम नक्की केले आहेत. हिंदी भाषेतील नियम मराठीला देखील लागू पडतात का हे मला जाणकारांकडून पडताळून हवे आहे. ओपन ऑफिस मध्ये खाली दिलेले एक्श्टिंशन जोडून घेता येईल.
http://extensions.services.openoffice.org/project/hyph_hi_IN
ओपन ऑफिसच्या रायटरमध्ये हिंदी भाषा निवडा.
Tools - Options - Language settings - Languages - CTL - Hindi
आता मराठी मजकूर हायफनेट करण्यासाठी:
Format - Paragraph... - Text Flow - Hypenation - Automatically
![]() |
marathi hyphen |
यात बदल करणे कसे शक्य आहे?
त्याचा सोर्स कोड येथे आहे.
http://git.savannah.gnu.org/cgit/smc.git/tree/hyphenation/hyph_hi_IN.dic
यातील एक आकड्याचा अर्थ असा आहे की येथे शब्द तोडला तरी चालेल तर २ चा अर्थ असा आहे की येथे शब्द अलग करू नये.
सुधारण्यास कुठे वाव आहे?
मराठी भाषेतील मजकूर हायफनेट करण्यासाठी हिंदी भाषा निवडावी लागते, त्याऐवजी मराठी एक्श्टिंशन उपलब्ध करून देणे किती कठीण आहे? कोणीतरी पाठपुरावा करुन स्वतंत्र ऍड-ओन बनवून घेतले पाहिजे असे मला वाटते. हायफनेशन रुल्स सुधारण्यासही वाव आहे असेही माझे मत आहे.
यात आर्थिक लाभ कोणाला व कसा होतो?
मोफत व मुक्त स्त्रोत असल्यामुळे यातील आपले योगदान कुठेना कुठे, कुणाला ना कुणाला उपयोगी पडेल. रेड हेट, गुगल सारख्या कंपन्या देखील मुक्त स्त्रोत संपदेचा उपयोग आपल्या नफ्यासाठी करतात हे सर्वश्रुत आहे. पण शेवटी भारतीय भाषा जर भविष्यातील आव्हाने स्विकारण्यास सक्षम बनत असतील तर काय हरकत आहे?
Comments
जालावरील मजकुराचे हायफनेशन
मी वर ओपन ऑफिसच्या रायटरचे उदाहरण दिले आहे. पण जालावरील पाने देखील जस्टिफाय केल्यावर फार चांगल्या तर्हेने वाचता येतात. आणि वर दिलेली युक्ति वापरल्यास आवश्यक त्या ठिकाणी हायफन आपोआप उमटतो.
http://ftp.twaren.net/Unix/NonGNU/smc/hyphenation/web/example.html
view - text size हा ऑप्शन वापरून फॉन्टचा आकार कमी जास्त करून पाहा. वेगवेगळे शब्द आवश्यकतेनुसार अलग होत आहेत.
आपल्यापैकी कोणी प्रोग्रॅमर असेल तर view - source हा ऑप्शन वापरून याचा कोड आपण पाहू शकता आणि वापरून पाहू शकता.
अशोक केळकरांचे मत
हायफन (संयोगीचिह्नाबद्दल) प्रा. अशोक केळकर यांचे मत पुढीलप्रमाणे -
(स्रोत : मध्यमा : भाषा आणि भाषाव्यवहार, लेखक अशोक रा. केळकर, मेहता पब्लिशिंग हाऊस, १९९६, पृष्ठ १९०-१९१)
बारीक असहमती :
लेखात म्हटले आहे -
हे योग्य नाही. हा दुवा बघावा.
इंग्रजीत (आणि कुठल्याही रोमन लिपी वापरणार्या भाषेत) शब्द "सिलॅबल"नंतरच तोडता येतो. वरील दुव्यात दिलेले उदाहरण "cabriolet" हा शब्द. हा इंग्रजीत cab-ri-o-let अशा तीन ठिकाणी तोडता येतो, मात्र फ्रेंच मध्ये ca-brio-let अशा वेगळ्या दोन ठिकाणी तोडता येतो. कारण या दोन भाषांत सिलॅबले वेगळी आहेत.
मराठीतही सिलॅबलांच्या नंतरच शब्द तोडता यावा - लेखी मराठीत साधारणपणे "अक्षर" म्हणजे व्यंजनानंतर स्वर, असे सिलॅबल असते. (काही संस्कृत तत्सम शब्द अपवाद - ते फार थोडे.)
- - -
शक्यतोवर सामासिक पद तोडताना मूळ जोडलेली पदे अर्धवट तोडू नये असे मला वाटते.
म्हणजे सर-स्वती-मंदिर या जागा चालतील, पण स-रस्व-ती-मं-दि-र या जागांवर तोडू नये.
हे माझे वैयक्तिक मत.
इंग्रजीतच काय पण मराठीतही...
इंग्रजी भाषेत असे शब्द कुठेही तोडले तरी फारसा फरक पडत नाही. इंग्रजीतच काय, पण मराठीतही शब्द हवे तिथे तोडता येत नाहीत.शाळेत शिकवलेली उदाहरणे: मदर किंवा फादर हे शब्द लिहिताना 'टी'नंतर संयोगचिन्ह येऊ देऊ नये. वाचणारा उच्चार मॉट्-हर किंवा फॅट्-हर करतो.
मराठीतली प्रसिद्ध उदाहरणे: काटक-सर, कर-मणूक,वगैरे. आणि,
कानात उ-
त्तम चिवडा.
कवितेतही यतिभंग हा दोष समजला जातो. गातानाही शब्द वाट्टेल तिथे तोडता येत नाहीत. अर्थाचा अनर्थ होऊ शकतो. नाट्यगीतातली उदाहरणे:
संगीत शारदातले गाणे, 'दाखवावयासि मला' हे, 'दाखवावया सिमला' असे म्हणणे, हे एक प्रसिद्ध उदाहरण. 'रूपबलि तो नरशार्दुल साचा' ही ओळ गाताना एका विख्यात गवयाला, श्रोत्यांमध्ये त्याला न आवडणारे नरसिंहराव केळकर दिसले. मग काय? त्याने ती ओळ 'नरशाssर्दुल साचा' अशी आळवून आळवून म्हणायला सुरुवात केली. नरशा म्हणजे नरसिंहराव हे उमजून श्रोते हसायला लागले. एक गवई गाताना 'पांडुकुमारा' हे शब्द घोळून घोळून आलाप घेऊन गात होते. श्रोत्यांमधला एक शेवटी वैतागला, आणि ओरडून म्हणाला. अहो, समजले, पांडुकु मारा हे समजले, पण कुठे मारले, केव्हा मारले, कुणी मारले हे एकदाचे सांगून टाका ना!--वाचक्नवी
मराठीत तर नाहीच
पण हे लेखातच सांगितले आहे. ("मराठीत तर लेखक म्हणतात तसे शब्द तोडता येत नाहीत ते नाहीतच, पण इंग्रजीतही तोडता येत नाहीत", असा प्रतिसादाचा मथितार्थ होता.)
मराठीतही तोडता येतात
माझ्या म्हणण्याचा मथितार्थ असा होता की, इंग्रजीप्रमाणेच मराठीतही शब्द तोडता येतात, फक्त ते तोडताना,
व्याकरण आणि उच्चार यांचे तारतम्य बाळगावे लागते.
आणखी एक तारतम्य न दाखवता केलेल्या यतिभंगाचे आठवलेले उदाहरणः मनाच्या श्लोकांतली एक ओळ--
शी करावी |
--वाचक्नवी
मोत्या...
'मोत्या शी-क=रे अ-आ-इ' या गाण्यातील यतिभंगाचे उदाहरणही (बहुधा किमानपक्षी साधारणतः आमच्या मातोश्रींच्या पिढीपासून) सुप्रसिद्ध आहे. (कोठल्या चित्रपटातील ते विसरलो.)
चित्रपटात?
'मोत्या शीक रे' हे गाणे बहुधा चित्रपटातले नसावे, ते एका फार जुन्या शालेय क्रमिक पुस्तकात होते.--वाचक्नवी
बरोबर, पण...
बरोबर. परंतु ते कोठल्यातरी सुप्रसिद्ध मराठी चित्रपटातही उचलले होते, असे वाटते. (चूभूद्याघ्या.)
आणखी एक उदाहरण - हिंदीतले
एखाद्या वकिलाने न्यायालयात प्रतिपक्षाच्या वकिलाचा मुद्दा खोडून काढताना 'कौन साला ऐसा कहता है?' असा प्रतिप्रश्न केला, तर न्यायालयाच्या नियमांप्रमाणे तो आक्षेपार्ह ठरावा.
परंतु त्याऐवजी 'कौनसा ला (उच्चारी 'ला' = 'लॉ' = कायदा) ऐसा कहता है?' हा प्रतिप्रश्न ग्राह्य व्हावा.
(हे उदाहरण घडलेले आहे असे समजते. चूभूद्याघ्या.)
संयोगचिन्ह्
मराठी शब्दांच्या बाबतीत असे शब्द तोडता येणार नाही. 'प्रेम-विवाह' असे संयोग चिन्हाने दोन शब्द जोडता येतील किंवा ओळीच्या शेवटी शब्द अपूरा राहिल्यास 'उप-
क्रमवर' असे करता येते. पण धनजंय जसे म्हणत आहे तसे उ-प-क्र-म असे करता येणार नाही, असे वाटते.
-दिलीप बिरुटे
बहुधा आपली सहमती आहे
अशोक केळकरांच्या मते वरच्या किंवा खालच्या ओळीत एकच अक्षर येऊ नये. त्यामुळे आपणा सर्वांच्याच मते "उप-क्रम" या एकाच ठिकाणी हा शब्द तोडता येतो. हेच माझेही मत आहे. (स्पष्टीकरण : "उ-प-क्र-म" अशा तीन तोडायच्या जागा आहेत असे माझे मत नाही.)
मी स्वतः त्याहून अधिक म्हणतो, की शक्यतोवर पदविभाग अर्थपूर्ण आहेत तिथेच तोडावेत. (बहुधा तुम्ही तेच म्हणत आहात.) आणि "सरस्वतीमंदिर" या लांब शब्दांत मला विभाग ठीक वाटतात, आणि ठीक वाटत नाहीत ती ठिकाणे वरील प्रतिसादात मी दाखवली आहेत.
आता प्रश्न आहे ४-अक्षरांपेक्षा लांब शब्दांचा. उदाहरणार्थ "उदाहरणार्थ"
केळकरांच्या परिच्छेदावरून त्यांना चालणार्या जागा :
१. उदा-हरणार्थ, २. उदाह-रणार्थ, आणि ३. उदाहर-णार्थ
मला त्या तीन्ही आवडत नाहीत (कारण तुकडे निरर्थक आहेत), पण मी चालवून घेईन.
आणखी एक उदाहरण घेऊया: "उपक्रमाच्याहीबद्दल"
(मला अन्य संकेतस्थळाबद्दल आपुलकी आहे, तशी उपक्रमाच्याहीबद्दल आहे.)
येथे मला वाटते, शक्यतोवर खंड पाडवेत त्या पर्यायी जागा अशा -
मला अन्य संकेतस्थळाबद्दल आपुलकी आहे, तशी उप-
क्रमाच्याहीबद्दल आहे.
मला अन्य संकेतस्थळाबद्दल आपुलकी आहे, तशी उपक्रमा-
च्याहीबद्दल आहे.
अन्य संकेतस्थळाबद्दल आपुलकी आहे, तशी उपक्रमाच्या-
हीबद्दल आहे.
त्या संकेतस्थळाबद्दल आपुलकी आहे, तशी उपक्रमाच्याही-
बद्दल आहे.
(उप-क्रमाच्याहीबद्दल,
उपक्रमा-च्याहीबद्दल
उपक्रमाच्या-हीबद्दल
उपक्रमाच्याही-बद्दल)
केळकरांच्या मते पुढील खंडही चालतील (पण माझ्या मते टाळावेत):
उपक्र-माच्याहीबद्दल
उपक्रमाच्याहीब-द्दल
थोडासा मतभेद
माझ्या मते, उच्चारताना आधीच्या अक्षरावर आघात देणार्या जोडाक्षरापूर्वी शब्द तोडू नये, त्यामुळे उप-क्रम किंवा सर-स्वती असे लिहिणे योग्य नाही.
उदाह-रणार्थ अयोग्य, कारण शब्द उच्चारताना 'ह'नंतर नैसर्गिक यति येत नाही.
शब्दयोगी अव्ययापूर्वी शब्द तोडता येतोच त्यामुळे, उपक्रमाच्याही-बद्दल आणि योग्य. 'हून'शिवाय अन्य प्रत्ययापूर्वी तोडू नये, म्हणून उपक्रमा-च्या, किंवा उपक्रमाच्या-ही हे योग्य वाटत नाहीत. शब्दाच्या पहिल्या अर्थहीन अक्षरानंतर किंवा शेवटच्या अक्षरापूर्वी संयोगचिन्ह देऊ नये, म्हणून उ-पक्रम किंवा उपक्र-म योग्य दिसत नाहीत्त. अन्य खंड टाळावेत असे माझे मत आहे.(श्रींचा निवास या अर्थीचा श्री-निवास लिहिता येईल, तसेच वास्तु-श्री. पण, श्रीनिवास ह्या विशेष नामाचे श्री-निवास असे खंड पाडता येणार नाहीत्त. (चूभूद्याघ्या).--वाचक्नवी
उच्चाराचा काय संबंध
शब्दावर दिल्या जाणार्या बलाचा आन तोडल्या जाणार्या शब्दाचा काय संबध नाय.
ह नैसर्गिक आसन नाय तर नस्सन. सार्थ शब्दातील लघूत्तोम घटकाची मोडतोड करु नये.
एखांद्या वळीतला शब्द त्या वळीत पूर्ण होत नसन तव्हा संयोग चिन्ह टाकून त्यो शब्द खालच्या वळीत पूर्ण करावा.
विद्या या शब्दात 'वि' वर आघात हाये म्हून काय वि-द्या असं थोडं लिव्हता येणार. हा हा हा
तव्हा बलाघात. सुरांचा चढउतार आण खंड पाडायचा कायबी संबंध नाय.
ह्याला काय वाटतं आणि त्याला काय वाटेल याचा इचार करायमधी आपून टैम नै घालीत फटकन लिहून मोकळं !
बाबूराव :)
इंग्रजीतही..
इंग्रजीतही शब्द तोडताना फक्त उच्चाराचा आणि आघाताचाच विचार केला जातो. इफेक्ट् हा शब्द तोडायची गरज पडली तर तो फक्त ef-fect असाच तोडता येतो. विद्या शब्द तोडताच येणार नाही, कारण अर्थहीन पहिल्या अक्षरानंतर, किंवा अर्थहीन शेवटच्या अक्षरापूर्वी शब्द तोडताच नाहीत. त्यामुळे दोन अक्षरी शब्द कधी तोडता येतील असे वाटत नाही. तीन अक्षरी शब्दसुद्धा ओं-कार, स्त्री-शक्ती, त्या-मुळे असे सकारण अपवाद वगळता तोडणे अयोग्य वाटते. चार आणि त्याहून जास्त अक्षरे असलेले शब्दच तोडायची गरज पडू शकते. इंग्रजीतला is कधी तोडलेला बघितला आहे? ओळीच्या शेवटी तोडलेल्या शब्दाचे जे अक्षर आले आहे त्याचा उच्चार पुढच्या ओळीतले (किंवा पान संपले असेल तर पुढच्या पानावरचे) पहिले अक्षर ठरवते. आघाताचा विचार न करता शब्द तोडला तर मजकूर वाचणे कठीण होईल. 'ब्रा-ह्मण' हा शब्द दोन टप्प्यात उच्चारता येईल?
लिहिलेला मजकूर स्वतःच वाचताना कसे वाटते याचाच विचार करून लिहिले की योग्य लिखाणनिर्मिती होते. ज्याला स्वतःलाच काही गैर वाटत नसेल त्याने दुसर्याने वाचावे म्हणून लिहूच नये.--वाचक्नवी
आणखी एक सूचना.
शब्दामधले एखादे अक्षर जर संधिनियमानुसार बनलेले असेल तर,शक्यतो त्या अक्षरानंतर शब्द तोडावा. उदाहरणार्थः अत्या-धुनिक, परमे-श्वर, अभ्यु-दय इ.इ. पाचसहा अक्षरी शब्द तोडताना हा नियम लागू पडेलच असे नाही. उदा. गुणाव-गुण(गुणा-वगुण नाही!), गंगाव-तरण(गंगा-वतरण नाही!). परंतु, राज्या-भिषेक किंवा राज्याभि-षेक. इथे,'रा'वर जोर द्यायचा की नाही ते 'ज्या' ठरवत नाही तर, 'भि' ठरवतो. म्हणून 'भि'नंतर शब्द तोडता येतो.
--वाचक्नवी
चालुंद्या
चार आणि त्याहून जास्त अक्षरे असलेले शब्दच तोडायची गरज पडू शकते
हसत-खेळत, रमत-गमत,कण्हत-कुथत अशे शब्द संयोग चिन्हाने जोडाला पाह्यजेन.
या शब्दाला मधीच खंड देऊन नाय चालनार.
चार अक्षरी शब्द 'कडकडा-ट'असा नाय लिव्हता येणार त्याला कडकडाट असाच लिव्हा लागन.
ह्याला काय वाटतं आणि त्याला काय वाटेल याचा इचार करायमधी आपून टैम नै घालीत फटकन लिहून मोकळं !
बाबूराव :)
अगदी बरोबर
या शब्दाला मधीच खंड देऊन नाय चालनार.
अगदी मान्य. हसतखेळत, रमतगमत, हळूहळू असले जोडशब्द एकतर जोडून लिहावेत किंवा जर त्यांच्यातल्या एखाद्याचे पहिले पद ओळीच्या अंती आले तर त्या पदानंतर संयोगचिन्ह द्यावेच लागेल. हे शब्द अन्य प्रकारे तोडता येणार नाहीत. --वाचक्नवी
अर्थ, पद व संदर्भासहित हायफनायझेशन
धनंजय साहेब आपल्या अभ्यासपूर्ण प्रतिसादाचा गोषवारा मी संतोष यांना कळवला आहे. याला आणखीन एक पैलू आहे आणि तो म्हणजे संदर्भ लक्षात घेऊन शब्द अलग करणे. उदा.
अ-
संभव
हे बरोबर आहे. पण...
अ-
तिशीत
असे न म्हणता
अति-
शीत
अशी तोड (अक्षरशः) योग्य वाटते. याचा अर्थ "अ" या अक्षरानंतर शब्द अलग करायला हरकत नाही अशी मुभा दिली तर अ-तिशीत असे अ-संभव सारखे हायफन मान्य करावे लागेल. अर्थ, पद लक्षात घेऊन संगणक हायफन निर्णय घेईल का हा प्रश्न मी संतोष यांना नेमक्या शब्दात विचारू शकलेलो नाही असे वाटते. त्यांचे काय उत्तर येते ते आपल्या समोर मांडेनच.
अर्थ आणि उच्चार दोन्ही..
शब्द तोडताना अर्थ आणि उच्चार या दोघांचा विचार करायला पाहिजे अ-संभव चालणार नाही, असं-भव असेच हवे. मात्र अतिशीत हे अति-शीत असेच. बोलताना किंवा वाचताना जिथे नैसर्गिक यति येतो, तिथे शब्द तोडायचा. बालोद् यान चालणार नाही, बालोद्यान पाहिजे.--वाचक्नवी
चर्चेची दिशा वेगळी हवी का?
माझ्यामते इथे फक्त मते देऊन फायद्याचे नाही तर ठोस तर्कप्रवाह (अल्गोरिदम नसला तरि एक प्रवाह-फ्लो) अपवादासकट, देणे गरजेचे (अपेक्षित) आहे. कारण त्या तर्कावर आज्ञावली लिहिली जाणार आहे.
एका प्रोग्रामरच्या दृष्टीने वरील चर्चेतून केवळ शक्यता आल्या आहेत. आता या चर्चेवरून एखाद्या तज्ञाला त्या चर्चेतून ठोस तर्कप्रवाह तयार करता आला तर तो अधिक उपयोगी पडावा (असे वाटते).
अर्थातच मला मुळ विषयाबद्द्ल माहीती नाही, फक्त चर्चेचा रोख मला जो असायला हवा असे वाटले ते स्पष्ट करायला केलेली ही लुडबुड
(लुडबुड्या)ऋषिकेश
------------------
समाजातली सामाजिक जाणीवही अगदी नसल्यातच जमा आहे. सुस्त, मद्दड जनता गोळाभर अन्न गिळून, टीव्हीवरच्या मालिका बघून झोपी जात आहे - सन्जोप राव
ओपन ऑफिसचे एक्स्टिंशन
संतोष यांनी मराठी भाषेसाठीचे हायफनेशन नियम एक्श्टिंशनच्या स्वरुपात उपलब्ध करून दिले आहेत. त्याबद्दल मी त्यांचा अत्यंत आभारी आहे.
http://extensions.services.openoffice.org/project/hyph_mr_IN
ओपन ऑफिसच्या रायटरमध्ये मराठी स्पेलचेक मी यापूर्वीच उपलब्ध करून दिले आहे.
http://extensions.services.openoffice.org/project/dict-mr
ही दोन्ही अवजारे वापरून मजकुर कसा दिसतो ते खाली दिलेल्या चित्रातून स्पष्ट होईल.
स्त्री-शी
शिष्टाचारा-च्या
दुभाष्या-चे
हे शब्द अलग केले गेले आहेत व ते ठीक आहेत असे वाटते.
होते.वनवास
यात "होते.-वनवास" असा हायफन आला आहे कारण पूर्णविरामानंतर स्पेस दिलेली नाही.
ही कथा
पहिला भाग संपतो
या शब्दांमधील अंतर वाढवून तो पैरिग्राफ जस्टिफाय केला गेला आहे त्याचे कारण या ओळींच्या शेवटी एंटर मार्क न वापरता लाईन ब्रेक (shift + enter) वापरला आहे.
ह्यो संतोश कोण हाये
संतोष यांनी मराठी भाषेसाठीचे हायफनेशन नियम एक्श्टिंशनच्या स्वरुपात उपलब्ध करून दिले आहेत.
शंतनु साहेब, ह्यो संतोश कोण हाये आन त्याला काहून् भाव देऊन राह्यले.
त्याला कशाला हायफनेशन् नियम समजून सांगून राह्यले काय तर खूलासा करा.
ह्याला काय वाटतं आणि त्याला काय वाटेल याचा इचार करायमधी आपून टैम नै घालीत फटकन लिहून मोकळं !
बाबूराव :)