தேவன் கிறிஸ்தவக் களஞ்சியம்

Join the forum, it's quick and easy

தேவன் கிறிஸ்தவக் களஞ்சியம்
தேவன் கிறிஸ்தவக் களஞ்சியம்
Would you like to react to this message? Create an account in a few clicks or log in to continue.
Latest topics
அன்பும் இரக்கமுள்ள எந்தன் இயேசுவே பாடல்Wed May 01, 2019 4:04 pmAdminபழைய ஏற்பாடு குறித்த சில குறிப்புகள்Thu Apr 11, 2019 10:23 pmmediltaவேகமாக தட்டச்சு செய்யThu Apr 11, 2019 10:12 pmசார்லஸ் mcபழைய ஏற்பாட்டு தீர்க்கதரிசிகள் Thu Apr 11, 2019 10:04 pmசார்லஸ் mcகாரியம் மாறுதலாய் முடிந்ததுThu Apr 11, 2019 9:54 pmசார்லஸ் mcவேதாகம வாய்ப்பாடுSat Mar 16, 2019 8:40 amசார்லஸ் mcஏழு பூக்கள் - சிலுவை தியான செய்திTue Mar 12, 2019 9:59 pmசார்லஸ் mcஇரண்டு தூண்கள்Tue Mar 12, 2019 9:49 pmAdminஉங்கள் அக்கினி எரிந்து கொண்டேயிருக்கட்டும்Thu Jan 10, 2019 8:12 amசார்லஸ் mcபுத்தாண்டு வாழ்த்துக்கள்Fri Jan 04, 2019 9:52 pmAdmin தந்தையாரின் மறைவுTue Oct 23, 2018 7:35 pmAdminதேவனின் நாமங்கள்Sat Oct 13, 2018 7:48 pmmediltaஆன்லைன் இன்ஜி., கவுன்சிலிங்; விருப்பப் பதிவு முறைSat Jul 28, 2018 9:13 amAdminபர்ஸ்ட் க்ளாஸ் வாரிசு யார்? Thu Jul 26, 2018 3:50 pmAdminதத்தெடுப்பது எப்படி?Sat Jul 14, 2018 8:13 pmசார்லஸ் mcகுழந்தை உளவியல்Fri Jul 13, 2018 7:09 amசார்லஸ் mcமுகத்தின் வேர்வையால்Sat Jul 07, 2018 11:43 amசார்லஸ் mcபிறனிடத்திலும் அன்புகூருவாயாகSat Jul 07, 2018 11:39 amசார்லஸ் mcஇயேசு வெளிநாட்டு கடவுளா?Sat Jul 07, 2018 11:36 amசார்லஸ் mcஆன்லைன் மூலம் நுகர்வோர் புகார் - என்ன செய்ய வேண்டும்?Sat Jul 07, 2018 11:21 amசார்லஸ் mcஎந்நிலையிலும் மனநிறைவோடுSat Jul 07, 2018 11:19 amசார்லஸ் mcகேள்வி கேட்காத கீழ்ப்படிதல்Sat Jul 07, 2018 11:15 amசார்லஸ் mcஒரே சொத்து, இரண்டு பத்திரம் - என்ன செய்ய வேண்டும்?Sat Jul 07, 2018 10:58 amசார்லஸ் mcஅல்லேலூயா என்றால் என்ன அர்த்தம்?Fri Jul 06, 2018 4:27 amசார்லஸ் mcஆண்டவரின் சத்தம் கேக்குதா ?Fri Jul 06, 2018 4:24 amசார்லஸ் mc
Log in
Top posting users this month
No user
பார்வையிட்டோர்
புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! Counter

Go down
சார்லஸ் mc
சார்லஸ் mc
நிறுவனர்
நிறுவனர்
Posts : 16182
Join date : 18/12/2012
Location Location : தேவன் கிறிஸ்தவ களஞ்சியம்
http://nesarin.blogspot.in

புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! Empty புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்!

Fri Oct 23, 2015 5:32 am
இமேஜ் எழுத்துக்கள்

நேற்று எனக்கு ஒருவர் போன் செய்தார். என் புத்தகங்கள், சிடிக்கள் மூலமாக நிறைய கற்றுக்கொண்டதாக கூறிய அவர், தற்போது  வெப்சைட்டுகளை வடிவமைக்கும் அளவுக்கு தொழில்நுட்பத்தில் முன்னேறி இருப்பதாகவும் சொல்லி மகிழ்ந்தார். பேச்சினிடையே தன்னிடம் ஏராளமான ஸ்கேன் செய்த டாக்குமெண்ட்டுகள் இருப்பதாகவும், அவற்றை மீண்டும் டைப் செய்யாமல் எழுத்துக்களாக மாற்ற முடியுமா என்று கேட்டார். அவரின் சந்தேகத்துக்கு நான் கொடுத்த விளக்கம்தான் OCR. 

புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! Comp%205%20leftt(1)நாங்கள் பல வருடங்களாக இந்தத் தொழில்நுட்பத்தைப் பல விதங்களில் எங்கள் நிறுவனப் பணிகளுக்கு பயன்படுத்தி வருகிறோம். புத்தகங்களை வடிவமைக்க உதவும் டிடிபி தொழில்நுட்பத்துக்கு முந்தையகாலத்தில் பிரின்ட் செய்த புத்தகங்களுக்கு கம்ப்யூட்டரில் சோர்ஸ் ஃபைல் இருக்காது அல்லவா? அந்தப் புத்தகங்களை ஸ்கேன் செய்து இமேஜ் ஃபைல்களாக பதிவு செய்து, மீண்டும் அவற்றை டாக்குமென்ட் ஃபைல்களாக மாற்றி இ-கன்டன்ட் மற்றும் இ-புத்தகங்களை உருவாக்கி இருக்கிறோம். 

இந்தியில் உள்ள புத்தகங்களை OCR மூலம் டாக்குமென்ட் ஃபைலாக மாற்றம் செய்து, அவற்றைப் பயன்படுத்தி இந்தி மொழியிலேயே வெப்சைட்டை வடிவமைத்திருக்கிறோம்.

OCR என்றால் என்ன?

OCR என்பது Optical Character Recognition. OCR மூலம் ஸ்கேன் செய்த இமேஜ் ஃபைல்களை நாம் எடிட் செய்யும் டாக்குமெண்ட் ஃபைல்களாக மாற்ற முடியும். அதாவது நாம் நேரடியாக மாற்றம் செய்ய முடியாத இமேஜ்களில் உள்ள எழுத்துக்களை, OCR தொழில்நுட்பத்தைப் பயன்படுத்தி அவற்றை டாக்குமென்ட் ஃபைல்களாக மாற்றம் செய்துகொண்டால் அவை டைப் செய்த தகவல்களாக மாறிவிடும். அதில் தேவையான மாற்றங்களை செய்துகொள்ளலாம். புதிதாக டைப் செய்து இணைக்கலாம். தேவை இல்லாதவற்றை நீக்கிக்கொள்ளலாம்.

கூகுள் டிரைவ் கொடுக்கும் OCR வசதி


சுமார் 248 உலக மொழிகளில் பயன்படுத்தப்படும் கூகுளில் OCR தொழில்நுட்பம் பெரும்பாலான இந்திய மொழிகளுக்கும் சப்போர்ட் செய்கிறது என்பது குறிப்பிடத்தக்கது.  கூகுள் நிறுவனத்தின் OCR தொழில் நுட்பம் மூலம், .JPG, .PNG, .GIF போன்ற இமேஜ் ஃபைல்களை தனித்தனியாகவோ அல்லது PDF ஃபைல்களில் உள்ள இமேஜ் ஃபைல்களை, ஒட்டு மொத்தமாகவோ டெக்ஸ்ட் டாக்குமென்ட்டுகளாகவோ மாற்ற செய்ய முடியும். அவற்றை நம் பிற பயன்பாடுகளுக்கு உபயோகப்படுத்துவதற்கு  முன்னர், ஒருமுறை புரூஃப் பார்த்துக்கொள்வது சிறந்தது. ஏனெனில் ஓரிரு எழுத்துக்கள் சரியாக மாற்றம் அடையாமல் இருக்கலாம்.  

OCR மூலம் கன்வெர்ட் செய்ய பயன்படுத்தப்படும் இமேஜ் ஃபைல்களுக்கு,  கூகுள் சில விதிமுறைகளைக் கொடுத்துள்ளது. 

* இமேஜ் ஃபைல்கள், ஸ்கேன் செய்யப்பட்டவையாக இருக்கலாம்.


* டிஜிட்டல் கேமிரா அல்லது மொபைலில் புகைப்படம் எடுத்ததாகவும் இருக்கலாம்.


* ஹை-ரெசல்யூஷன் (High Resolution)  இமேஜ் ஃபைல்களாக இருக்க வேண்டும்.


* ஃபைலின் அளவு 2 MB ஆக இருக்க வேண்டும்.


* அதிகபட்சம் 10 பக்கங்கள் கொண்ட PDF ஃபைல்கள் 


* இமேஜ்கள் நீளவாக்கிலோ (Portrait)  அல்லது அகலவாக்கிலோ (Landscape),  ஒரே திசையில் (Orientation) இருக்க வேண்டும். 10 பக்கங்கள் கொண்ட PDF ஃபைல்களாக இருந்தால்  அத்தனை பக்கங்களும் ஒரே திசையில் இருந்தால்தான், அவை பிழையின்றி டெக்ஸ்ட் டாக்குமென்ட்டாக மாற்றம் செய்யப்படும்.

கூகுள் டிரைவின் OCR தொழில்நுட்பத்தைப் பயன்படுத்துவது எப்படி?

புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! Comp%205%20600%201(1)
drive.google.com என்ற வெப்சைட் மூலம் கூகுளில் சைன் இன் செய்துகொள்ள வேண்டும். 
 

புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! Comp%205%20600%202%203(1)
இப்போது கூகுள் டிரைவின் வெப்சைட் வெளிப்படும். இதில் My drive என்ற விவரத்தின் மீது மவுசின் பாயின்ட்டரை வைத்து வலப்புற பட்டனால் கிளிக் செய்தால் சிறிய பாப்-அப் விண்டோ கிடைக்கும். அதில் Upload Files… என்ற விவரத்தை கிளிக் செய்துகொள்ள வேண்டும்.புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! Comp%205%20600%204(1)
இப்போது தேவையான ஃபைலை நம் கம்ப்யூட்டரில் இருந்து அப்லோட் செய்துகொள்ள வேண்டும். உதாரணத்துக்கு, இங்கு Preface13.JPG என்ற ஃபைலை அப்லோட் செய்துள்ளோம். இந்த இமேஜில் உள்ள தகவல்கள் இந்தி மொழியில் உள்ளன.
 

புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! Comp%205%20600%205(1)
இந்த ஃபைல் மீது மவுசின் பாயின்ட்டரை வைத்து வலப்புற பட்டனால் கிளிக் செய்தால் கிடைக்கும் விண்டோவில் Open with > Google Docs என்ற மெனுவிவரத்தை தேர்ந்தெடுத்துக்கொள்ள வேண்டும்.
புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! Comp%205%20600%206%207(1)
உடனடியாக அந்த ஃபைல் கூகுள் டாக்குமென்ட் சாஃப்ட்வேரில் திறக்கப்படும். அதில் மேல்பக்கம் நாம் தேர்ந்தெடுத்த இமேஜ் ஃபைல் வெளிப்பட்டிருக்கும். அதன் கீழ் டாக்குமென்ட்டாக மாற்றம் அடைந்த ஃபைல் வெளிப்பட்டிருக்கும். இமேஜ் ஃபைலை கிளிக் செய்து டெலிட் செய்துகொள்ளலாம். 

உதாரணத்துக்கு, இமேஜ் ஃபைலில் உள்ள தமிழ் மொழித் தகவல்களை டாக்குமெண்ட் ஃபைலாக மாற்றியுள்ளதை பார்வையிடவும். 

இப்படி மாற்றம் செய்த டாக்குமெண்ட் ஃபைல்களை, கூகுள் டிரைவில் இருந்தபடியே தேவையான நபர்களுக்கு இமெயிலில் அனுப்பலாம். சமூக வலைத்தளங்களில் ஷேர் செய்துகொள்ளலாம் அல்லது கூகுள் டிரைவில் இருந்து நம் கம்ப்யூட்டருக்கு டவுன்லோட் செய்துகொள்ளலாம்.

குறிப்பு

புதிதாய் படிக்கலாம் பழைய புத்தகங்களை... ஓ.சி.ஆர் சொல்லும் ரகசியம்! IT%20field%20lefttt(1)* இந்த உதாரணத்தில் இந்தி மற்றும் தமிழ் மொழியில் ஸ்கேன் செய்யப்பட்ட இமேஜ் ஃபைல்களை டாக்குமென்ட் ஃபைல்களாக மாற்றம் செய்து விளக்கி உள்ளேன். இதைப்போல, இமேஜ் ஃபைல்களில் உள்ள தகவல்கள்  எந்த மொழியில் இருந்தாலும் அவற்றை டாக்குமென்ட் ஃபைல்களாக மாற்றம் செய்து பயன்படுத்த முடியும். தற்சமயம் 248 உலக மொழிகளுக்கு கூகுள் OCR சப்போர்ட் செய்கிறது. 

* PDF ஃபைலில் உள்ள முழு புத்தகத்தையும் டாக்குமெண்ட் ஃபைலாக மாற்றம் செய்யும் ஆராய்ச்சிகள் நடைபெற்று வருகின்றன. 

ஓரிருவர் ஆராய்ச்சி வெர்ஷனில் அவற்றை வெளியிட்டும் இருக்கிறார்கள்.

* லோ-ரெசல்யூஷனில் ஸ்கேன் செய்யப்பட்ட அல்லது புகைப்படமெடுக்கப்பட்ட இமேஜ்களையும், மிகப் பழைய காகிதங்களில் உள்ள தகவல்களை ஸ்கேன் செய்யப்பட்ட இமேஜ்களையும் தவறின்றி டாக்குமெண்ட் ஃபைல்களாக மாற்றம் செய்யும் முயற்சிகளும் எடுக்கப்பட்டு வருகின்றன.

Desclimer

இந்தக் கட்டுரையில் பயன்படுத்தியுள்ள சாஃப்ட்வேரின் தயாரிப்பாளர்களுடைய விதிமுறைகளுக்கு உட்பட்டு இந்த கட்டுரை தயார் செய்யப்பட்டுள்ளது. வெப்சைட்டிலும், சாஃப்ட்வேரிலும், கட்டணத்திலும் அவர்கள் எப்போது வேண்டுமானாலும் மாற்றங்கள் செய்யலாம் என்பதை நினைவில் கொள்ளவும்.  

- காம்கேர் கே. புவனேஸ்வரி
Back to top
Permissions in this forum:
You cannot reply to topics in this forum