Saturday, October 1, 2011

വിക്കിഗ്രന്ഥശാലയിലെ ഡിജിറ്റൈസേഷന്‍


വിക്കിഗ്രന്ഥശാലയിലെ പുതിയ ഡിജിറ്റൈസിങ് സങ്കേതത്തെ പരിചയപ്പെടുത്തുന്നതാണ് ഈ പോസ്റ്റ്. ഇംഗ്ലീഷ് വിക്കിസോഴ്സിലും മറ്റും വളരെയധികം ഉപയോഗിക്കുന്ന ഈ രീതി പക്ഷേ ഇതരഭാഷാ വിക്കികളില്‍ വളരെ കുറവേ കാണുന്നുള്ളൂ. അതത് ഭാഷകള്‍ക്കുള്ള OCR സംവിധാനത്തിന്റെ അപര്യാപ്തതയാണ് ഇതിന് കാരണം.  മലയാളം OCR ന്റെ വികസനത്തിനും ഈ വിക്കി ഗ്രന്ഥശാലാ  പദ്ധതികള്‍ ഉപകരിക്കുമെന്ന്  പ്രതീക്ഷിക്കുന്നു.
വിക്കിഗ്രന്ഥശാലയില്‍ എന്ത് ചെയ്യാനാകും. എങ്ങനെ സഹായിക്കാനാകും എന്ന് ചിന്തിച്ച് നില്ക്കുന്നവര്‍ക്ക് ഈ പോസ്റ്റ് സഹായിക്കും എന്ന് കരുതുന്നു.
സാധാരണ ഉപയോഗിക്കുന്ന പിഡിഎഫ് ഫോര്‍മാറ്റിന് പകരം ദേജാവൂ എന്ന സ്വതന്ത്ര ഫോര്‍മാറ്റാണ് സ്കാന്‍ ചെയ്ത പുസ്തകത്തിന് ഉപയോഗിക്കുന്നത്. ഇത് എങ്ങനെ ഉണ്ടാക്കാം/പിഡിഎഫിനെ രൂപമാറ്റം നടത്തിയെടുക്കാം എന്ന് ഇവിടെ [S:Help:DjVu_files] നിന്നും മനസ്സിലാക്കാം.
ഒരോ പുസ്തകത്തിന്റേയും സൂചുകാ (ഇന്റക്സ്) പേജിലാണ് ഡിജിറ്റൈസേഷന്റെ അവസ്ഥ മനസ്സിലാക്കാന്‍ കഴിയുക.
ദൂതവാക്യം ഗദ്യം എന്ന പുസ്തകത്തിന്റെ സ്ക്രീന്‍ഷോട്ടുകള്‍ ശ്രദ്ധിക്കുക.

സൂചികാ താള്‍ (ദൂതവാക്യം ഗദ്യം)
ചുവന്ന വൃത്തത്തില്‍ കാണിച്ചിരിക്കുന്ന താളുകള്‍ എന്ന വിഭാഗത്തില്‍ ഓരോ താളുകളുടേയും അവസ്ഥ കാണാം.
ഓരോ നിറങ്ങളും ഓരോ അവസ്ഥയെ സൂചിപ്പിക്കുന്നു.
ചുവന്ന ലിങ്കുകള്‍ ശൂന്യമായ താളുകളാണ്. അവ ടൈപ്പ് ചെയ്ത് സൃഷ്ടിക്കേണ്ടിയിരിക്കുന്നു.
തെറ്റുതിരുത്തൽ വായന നടന്നിട്ടില്ലാത്തവ
തെറ്റുതിരുത്തൽ വായന കഴിഞ്ഞവ
സാധുകരിച്ചവ (രണ്ട് പ്രാവശ്യം തെറ്റുതിരുത്തല്‍ വായന കഴിഞ്ഞവ)
എഴുത്ത് ഇല്ലാത്തവ 
പ്രശ്നമുള്ളവ

ഇതില്‍ നിന്നും പ്രൂഫ് റീഡ് ചെയ്യാന്‍ താല്പര്യമുള്ളവര്‍ക്ക് റോസ് നിറത്തിലുള്ള പേജുകളിലേയ്ക്ക് പോകാം. ടൈപ്പ് ചെയ്യേണ്ടവര്‍ക്ക് ചിവന്ന ലിങ്കുകളില്‍ ക്ലിക്ക് ചെയ്ത് അതത് താളുകള്‍ സൃഷ്ടിക്കാം.

ഒരു താള്‍ തുറന്നാല്‍ കാണുന്നതിന്റെ മാതൃകയാണ് താഴെ.

ഒരു താളിന്റെ ഘടന
വലത് ഭാഗത്ത് കറുത്ത വൃത്തത്തില്‍ കാണുന്നതാണ് സ്കാന്‍ ചെയ്ത പേജിന്റെ ചിത്രം. ഇടത് ഭാഗത്തായി ടൈപ്പ് ചെയ്യാനുള്ല ഒരു സ്ഥലം കാണാം. സാധാരണ വിക്കിയുടെ പണിയിടം പോലെ തന്നെ. മഞ്ഞ ചതുരത്തില്‍ ഉപയോഗിക്കാവുന്ന ഫോര്‍മാറ്റിങ് ടൂളുകളും കാണാം. ഗ്രന്ഥശാലയില്‍ ഇത് വല്ലപ്പോഴുമേ ആവശ്യം വരാറുള്ളൂ.
വലതുഭാഗത്തെ ചിത്രത്തില്‍ കാണുന്ന അക്ഷരങ്ങള്‍ ഇടത് ഭാഗത്ത്  ടൈപ്പ് ചെയ്യുക മാത്രമാണ് ജോലി. പേജ് സൃഷിക്കാന്‍ നേരത്ത് ഇംഗ്ലീഷ് അക്ഷരങ്ങള്‍ കാണുന്നുണ്ടെങ്കില്‍ അതെല്ലാം ഡെലിറ്റ് ചെയ്ത് കളയുക. വിക്കിയിലെ OCR സംവിധാനം പ്രവര്‍ത്തിച്ച് കിട്ടുന്ന അക്ഷരങ്ങളാണിതെല്ലാം. മലയാലത്തിന് ഇത് ഉപകാരമായിട്ടില്ല.
ഇനി സേവ് ചെയ്യുന്നതിന് മുമ്പായി താളിന്റെ തല്സ്ഥിതി എന്നതിലെ കളര്‍ ബട്ടണുകള്‍ തിരെഞ്ഞെടുക്കണം.(നേരത്തെ പറഞ്ഞ കളറുകള്‍ തന്നെ) ആ റേഡിയോ ബട്ടണ്‍ ഞെക്കുമ്പോല്‍ ചുരുക്കം   എന്ന കള്ളിയില്‍ അതിനനുയോജ്യമായ വാചകം വന്നിട്ടുണ്ടെന്ന് ഉറപ്പുവരുത്തു താള്‍ സേവ് ചെയ്യക എന്നത് ക്ലിക്ക് ചെയ്യുക.
ഇത്രേ ഉള്ളൂ കാര്യം. വളരെ എളുപ്പത്തില്‍ എല്ലാവര്‍ക്കും ചെയ്യാവുന്ന കാര്യമാണ്. മലയാളം ടൈപ്പിങ്ങ് അറിയാമെങ്കില്‍ ചിലവിടാന്‍ കുറച്ച് സമയമുണ്ടെങ്കില്‍ ആര്‍ക്കും ചെയ്യാവുന്ന ഒരു കാര്യമാണ്. നമ്മുടെ കഴിഞ്ഞ കാലത്തെ അമൂല്യ ഗ്രന്ഥങ്ങള്‍ സൂക്ഷിച്ച് ഡിജിറ്റല്‍ രൂപത്തില്‍ സൂക്ഷിച്ച് വയ്ക്കേണ്ടത് ഓരോരുത്തരൂടേയും കടമയാണ്. ഇത്തിരി സമയം കിട്ടിയാല്‍ ഇവിടെയെത്തി രണ്ട് പേജ് പ്രൂഫ് വായിക്കാനോ ഒരു പേജ് ടൈപ്പ് ചെയ്യാനോ അധികം ബുദ്ധിമുട്ട് ആര്‍ക്കും ഉണ്ടാവിലെന്ന് കരുതുന്നു. ഇതുപോലെ നൂറുകണക്കിന് ആളുകളുടെ ശ്രമഫലമായിട്ടാണ് വിക്കിഗ്രന്ഥശാല ഈ വിധം വളര്‍ന്നത്.
ഭാഷെയെ സ്നേഹിക്കുവെങ്കില്‍ നിങ്ങളും ഇതില്‍ പങ്കാളിയാണെന്ന് ഉറപ്പുവരുത്തുക. അഭിമാനിക്കുക. :)
ഓഫ് ലൈനായി ഇത് ചെയ്യാനാകുമോ ?
ഇതിനെ വിക്കിഗ്രന്ഥശാല പ്രോത്സാഹിപ്പിക്കുന്നില്ല. കാരണമെന്തെന്നാല്‍ ഓഫ്ലൈനായി ടൈപ്പ് ചെയ്ത് വിക്കിയില്‍ ചേര്‍ക്കാന്‍ വര്മ്പോഴേക്കും വേറെ ആരെങ്കിലും അത് ചെയ്യാന്‍ സാധ്യതയുണ്ട്. ഡ്യൂപ്ലിക്കേഷന്‍ നടന്നേക്കാം . എന്നിരുന്നാലും ഞാന്‍ ഈ താള്‍ ടൈപ്പ് ചെയ്യുന്നു എന്ന് പ്രസ്തുത താളിലോ അല്ലെങ്കില്‍ അതിന്റെ സംവാദം താളിലോ കുറീപ്പായി ഇട്ട് ഓഫ്ലൈനായി ടൈപ്പ് ചെയ്യാവുന്നതാണ്.  ഏറ്റവും മുകളില്‍ ചിത്രം എന്നതില് ക്ലിക്ക് ചെയ്താല്‍ അതിന്റെ ചിത്രരൂപം ഡൗണ്‍ലോഡ് ചെയ്തെടുക്കാവുന്നതാണ്. ഓഫ്ലൈനായി ടൈപ്പ് ചെയ്ത ശേഷം എത്രയും വേഗത്തില്‍ അത് വിക്കിയിലോട്ട് പുതുക്കുക.
പകര്‍പ്പാവകാശം കഴിഞ്ഞ പുസ്തങ്ങള്‍ കയ്യിലുണ്ട്. 
പകര്‍പ്പാവകാശം കഴിഞ്ഞ പുസ്തങ്ങളുടെ സ്കന്‍ ചെയ്തോ/ഫോട്ടോ എടുത്തോ  സംഭാവന ചെയ്യാനാകുമെങ്കില്‍ http://groups.google.com/group/mlwikilibrarians എന്ന ഗൂഗിള്‍ ഗ്രൂപ്പുമായി ബന്ധപ്പെടുക. സ്കാന്‍ ചെയ്യുകയാണെങ്കില്‍ 300dpi യില്‍ സ്കാന്‍ ചെയ്യുന്നത് ഉചിതം. ഭാവിയിലെ OCR പരീക്ഷണങ്ങള്‍ക്ക് സഹായിച്ചേക്കും. ഗ്രന്ഥശാലയില്‍ വായിക്കാനാകുന്ന ക്ലാരിറ്റിയിലുള്ള സ്കാനുകള്‍ ആയാലും മതിയാകും.  വിക്കി ഗ്രന്ഥശാലയിലോ വിക്കിമീഡീയ കോമണ്‍സിലോ ഇത് അപ്ലോഡ് ചെയ്യാവുന്നതാണ്.
ടൈപ്പ് ചെയ്യാനുള്ള പുസ്തകങ്ങളുടെ പട്ടിക എവിടെ കിട്ടും ?
djvu ഫോര്‍മാറ്റില്‍  സ്കാന്‍ ചെയ്ത് ടൈപ്പിങ്ങിന് റെഡിയായി നില്ക്കുന്ന (അവസ്ഥ കളര്‍ കോഡ് നോക്കി മനസ്സിലാക്കാം) പുസ്തകങ്ങളുടെ പട്ടിക http://ml.wikisource.org/wiki/Special:IndexPages
വിക്കിഗ്രന്ഥശാലയിലെ വിവിധപദ്ധതികളെകുറിച്ചുള്ള വിവരങ്ങള്‍ വിക്കിഗ്രന്ഥശാല:വിക്കിപദ്ധതി
ദേജാവൂ രീതിയില്‍ ഡിജിറ്റൈസ് ചെയ്ത ചില പുസ്തകങ്ങള്‍
സംശയങ്ങളുണ്ടെങ്കില്‍ വിക്കിഗ്രന്ഥശാലയില്‍ സംവാദം താളുകളിലോ വിക്കിഗ്രന്ഥശാലയുടെ ഗൂഗില്‍ ഗ്രൂപ്പിലോ ചോദിക്കുക.
ഒരു നല്ല വിക്കിഗ്രന്ഥശാല അനുഭവം ആശംസിച്ചുകൊണ്ട്, സസ്നേഹം –മനോജ്‌ .കെ 01:30, 1 ഒക്ടോബര്‍  2011 (UTC)
CC BY-SA
വിക്കിഗ്രന്ഥശാലയിലെ ഡിജിറ്റൈസേഷന്‍ എന്ന നോജ്.കെ യുടെ പോസ്റ്റ് blog.manojkmohan.com നെ അടിസ്ഥാനപ്പെടുത്തി  ക്രിയേറ്റീവ് കോമൺസ് ആട്രിബ്യൂഷൻ/ഷെയർ-എലൈക്ക് അനുമതിപത്ര (കടപ്പാട്, സമാനമായ അനുമതിപത്രം, എന്നിവ നൽകുക)   പ്രകാരം പ്രസിദ്ധീകരിച്ചിരിക്കുന്നു.

No comments:

Post a Comment