opensubscriber
   Find in this group all groups
 
Unknown more information…

s : smc-discuss@googlegroups.com 2 September 2010 • 11:55AM -0400

Re: [smc-discuss] [RFC]Project: Malayalam Autocorrect in openoffice
by santhosh.thottingal

REPLY TO AUTHOR
 
REPLY TO GROUP





നിര്‍ദ്ദേശങ്ങള്‍ക്കു നന്ദി. പക്ഷേ ആരും ഈ പ്രൊജക്ട് ഏറ്റെടുക്കാന്‍ മുന്നോട്ടു വന്നില്ലല്ലോ.  

ഒരു 10 വാക്കെങ്കിലും ഉള്ള ഒരു ഓട്ടോകറക്ട് ഡിക്ഷ്ണറി ആദ്യം ഉണ്ടാക്കണം. എന്നിട്ടതു് ഓപ്പണ്‍ഓഫീസില്‍ പരീക്ഷിക്കണം.  അതു പ്രവര്‍ത്തിക്കുന്നുണ്ടെങ്കില്‍ സാങ്കേതികമായ കാര്യങ്ങളെല്ലാം ഓകെ ആണെന്നു കരുതാം. ആര്‍ക്കെങ്കിലും ഇതു ചെയ്യാമോ? നിലവിലുള്ള ഭാഷകളുടെ ഉദാഹരണത്തിനു് ഇംഗ്ലീഷിന്റെ ഡിക്ഷ്ണറി റെഫര്‍ ചെയ്താല്‍ മതി.

നമ്മുടെ നിഘണ്ടുവില്‍ എകദേശം 10000 വാക്കുകളുണ്ടു്. നിലവിലെ സ്പെല്‍ചെക്ക് ഡിക്ഷ്ണറിയില്‍ 1,40000 വാക്കുകളുണ്ട്. ഇവ രണ്ടും കൂട്ടിച്ചേര്‍ത്ത് സോര്‍ട്ട് ചെയ്യണം(by avoiding duplicates). എന്നിട്ടു് ഓരോ വാക്കും എടുത്തു് അതിനു് വരാവുന്ന, സാധാരണ കാണുന്ന അക്ഷരത്തെറ്റുകള്‍ ഉണ്ടോന്നു നോക്കണം. ഉണ്ടെങ്കില്‍ അതു ഓട്ടോകറക്ട് ഡിക്ഷണറിയില്‍ ചേര്‍ക്കണം.

വേറൊരു നിര്‍ദ്ദേശം ഇതാണു്: ഇംഗ്ലീഷ് വിക്കിപീഡിയയില്‍ സാധാരണ കാണുന്ന അക്ഷരത്തെറ്റുകള്‍ ലിസ്റ്റ് ചെയ്തിട്ടുണ്ടു്. മലയാളം വിക്കിപീഡിയയ്ക്കും ഇതു ചെയ്യാവുന്നതല്ലേ?

വേറൊന്നു് ഓര്‍ക്കാനുള്ളതു് മലയാളത്തിലെ പലവാക്കുകളുടെയും എഴുത്തുരീതിയ്ക്കു് ഏകീകൃത സ്വഭാവം ഇല്ല.  അദ്ധ്യാപകനും അധ്യാപകനും ശരിയാണെന്നും ഊര്‍ജവും ഊര്‍ജ്ജവും ശരിയാണെന്നും ഒന്നു മാത്രമേ ശരിയുള്ളൂവെന്നും പലവാദങ്ങളുണ്ടു്. ഇതില്‍ എന്തു സമീപനമെടുക്കണം?


-സന്തോഷ്

--
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് - എന്റെ കമ്പ്യൂട്ടറിനു് എന്റെ ഭാഷ
സംരംഭം: https://savannah.nongnu.org/projects/smc
വെബ്‌സൈറ്റ് : http://smc.org.in  IRC ചാനല്‍ : #smc-project @ freenode
പിരിഞ്ഞു പോകാന്‍: smc-discuss-unsubscribe@goog...

Bookmark with:

Delicious   Digg   reddit   Facebook   StumbleUpon

Related Messages

opensubscriber is not affiliated with the authors of this message nor responsible for its content.