Menu

14 August 2010

हिन्दी अनुवाद संबंधी (idea for hindi to any Indic lang)

---------- Forwarded message ----------
From: Ankur Gupta <ankurgupta555 AT gmail.com>
Date: 2010/8/13
Subject: अनुवाद संबंधी


नरेन्द्र भैया,
नमस्ते

मैंने यूट्यूब पर कुछ भाषा संबंधी वीडियो देखे तो पता चला कि चाहे तमिल हो गुजराती हो या हिन्दी हो सब में "अ","आ","इ","ई" होता है। अंग्रेजी की तरह अलग वर्णमाला नही होती है।
इन भारतीय भाषाओं में मुझे केवल लिपि और शब्दों का अंतर समझ में आया बाकी सब वही है।
मेरे दिमाग में आया कि क्यों न कुछ ऐसा सॉफ्टवेयर बनाया जाए जो कि किसी भी भारतीय भाषा में लिखे पाठ्य को दूसरी भारतीय भाषा में लिपि और शब्दों समेत बदल दे। इससे देशी इंटरनेट फोरमों में अंग्रेजी से काफी निजात मिल सकती है क्योंकि उनमें फिर हर भारतीय अपनी मातृभाषा में लिखेगा भी और पढ़ेगा भी। और केवल इंटरनेट फोरम ही क्यों पूरा का पूरा भारतीय साहित्य एक भाषा से दूसरी भाषा में परिवर्तित आसानी से हो जाएगा। ईमेल हर कोई अपनी भाषा में कर सकेगा और पढ़ भी सकेगा।
आप बोलेंगे कि गूगल पहले से ही गूगल ट्रांसलेट नामक सेवा चला रहा है। तो महत्वपूर्ण बात यह है कि वह सेवा केवल एक भारतीय भाषा हिन्दी के लिए है, उसमें और भारतीय भाषाएं नही हैं। दूसरा ये कि उसकी तकनीक बंद स्रोत है यानि कि मशीनी अनुवाद की वो विद्या केवल गूगल के चंद इंजीनियर ही जानते हैं। तीसरा ये कि भारतीय भाषाएं आपस में मिलती जुलती हैं अत: मुझे लगता है कि इनके लिए आपस में अनुवाद का सॉफ्टवेयर अधिक अच्छा बन सकता है।

मेरा आपको ईमेल करने का उद्देश्य यह जानना था कि  क्या आप पहले किसी ऐसे अनुवाद सॉफ्टवेयर में काम कर चुके हैं? इसके एल्गोरिद्म आदि के संबंध में यदि पहले कुछ काम हो चुका हो तो उसके संबंध में जानकारी मिल जाए तो बहुत अच्छा रहे।

आपका,
अंकुर गुप्ता

Posted via email from LUG@IITD Community Blog

3 comments:

Anonymous said...

One need to understand the difference between translation and transliteration clearly. I suppose the idea gentleman is putting forth is for transliteration.

Baraha is already providing such transliteration, albeit it is not FOSS.

Samyak

ePandit said...

पहली बात तो ये कि ये अनुवाद नहीं लिप्यन्तरण का मामला है।

दूसरी बात ये कि इस तरह के दो वेब तन्त्र पहले से मौजूद हैं।

गिरगिट तथा गूगल लिपि परिवर्तक

इनमें से गिरगिट ओपन सोर्स है।

ePandit said...

अंकुर जो कार्य आप करना चाहते हैं उसे अनुवाद नहीं लिप्यन्तरण (ट्राँसलिट्रेशन) कहा जाता है। इस कार्य के लिये दो टूल पहले से उपलब्ध हैं - एक आलोक जी का गिरगिट तथा दूसरा गूगल का लिपि परिवर्तक

इनमें से गिरगिट मुक्त स्रोत है जिसका स्रोत कूट यहाँ उपलब्ध है।

http://girgit.googlecode.com/