നിര്ദ്ദേശങ്ങള്ക്കു നന്ദി. പക്ഷേ ആരും ഈ പ്രൊജക്ട് ഏറ്റെടുക്കാന് മുന്നോട്ടു വന്നില്ലല്ലോ.
ഒരു 10 വാക്കെങ്കിലും ഉള്ള ഒരു ഓട്ടോകറക്ട് ഡിക്ഷ്ണറി ആദ്യം ഉണ്ടാക്കണം. എന്നിട്ടതു് ഓപ്പണ്ഓഫീസില് പരീക്ഷിക്കണം. അതു പ്രവര്ത്തിക്കുന്നുണ്ടെങ്കില് സാങ്കേതികമായ കാര്യങ്ങളെല്ലാം ഓകെ ആണെന്നു കരുതാം. ആര്ക്കെങ്കിലും ഇതു ചെയ്യാമോ? നിലവിലുള്ള ഭാഷകളുടെ ഉദാഹരണത്തിനു് ഇംഗ്ലീഷിന്റെ ഡിക്ഷ്ണറി റെഫര് ചെയ്താല് മതി.
നമ്മുടെ നിഘണ്ടുവില് എകദേശം 10000 വാക്കുകളുണ്ടു്. നിലവിലെ സ്പെല്ചെക്ക് ഡിക്ഷ്ണറിയില് 1,40000 വാക്കുകളുണ്ട്. ഇവ രണ്ടും കൂട്ടിച്ചേര്ത്ത് സോര്ട്ട് ചെയ്യണം(by avoiding duplicates). എന്നിട്ടു് ഓരോ വാക്കും എടുത്തു് അതിനു് വരാവുന്ന, സാധാരണ കാണുന്ന അക്ഷരത്തെറ്റുകള് ഉണ്ടോന്നു നോക്കണം. ഉണ്ടെങ്കില് അതു ഓട്ടോകറക്ട് ഡിക്ഷണറിയില് ചേര്ക്കണം.
വേറൊരു നിര്ദ്ദേശം ഇതാണു്: ഇംഗ്ലീഷ് വിക്കിപീഡിയയില് സാധാരണ കാണുന്ന അക്ഷരത്തെറ്റുകള് ലിസ്റ്റ് ചെയ്തിട്ടുണ്ടു്. മലയാളം വിക്കിപീഡിയയ്ക്കും ഇതു ചെയ്യാവുന്നതല്ലേ?
വേറൊന്നു് ഓര്ക്കാനുള്ളതു് മലയാളത്തിലെ പലവാക്കുകളുടെയും എഴുത്തുരീതിയ്ക്കു് ഏകീകൃത സ്വഭാവം ഇല്ല. അദ്ധ്യാപകനും അധ്യാപകനും ശരിയാണെന്നും ഊര്ജവും ഊര്ജ്ജവും ശരിയാണെന്നും ഒന്നു മാത്രമേ ശരിയുള്ളൂവെന്നും പലവാദങ്ങളുണ്ടു്. ഇതില് എന്തു സമീപനമെടുക്കണം?
-സന്തോഷ്
--
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് - എന്റെ കമ്പ്യൂട്ടറിനു് എന്റെ ഭാഷ
സംരംഭം:
https://savannah.nongnu.org/projects/smc
വെബ്സൈറ്റ് :
http://smc.org.in IRC ചാനല് : #smc-project @ freenode
പിരിഞ്ഞു പോകാന്:
smc-discuss-unsubscribe@goog...
opensubscriber is not affiliated with the authors of this message nor responsible for its content.