উত্তর:
লিনাক্সের জন্য প্রচুর ওসিআর পাঠক রয়েছে যা চিত্র থেকে পাঠ্যে রূপান্তর করতে পারে। নিম্নলিখিত বিকল্পগুলি দেখুন:
ওক্রপাস ব্যতীত উপরের সমস্তগুলি একই নামের একটি প্যাকেজে উবুন্টু সংগ্রহস্থলে উপস্থিত রয়েছে।
বিভিন্ন পাঠক বিভিন্ন চিত্রের ফর্ম্যাটকে সমর্থন করে, সুতরাং আপনার ডকুমেন্টটি থাকা ফাইল ফর্ম্যাট দ্বারা আপনি আপনার বিকল্পগুলিতে সীমাবদ্ধ থাকতে পারেন ternative বিকল্পভাবে, আপনি যদি কোনও নির্দিষ্ট ওসিআর রিডার ব্যবহার করতে চান তবে ফর্ম্যাটটি পরিবর্তন করতে আপনি ইমেজম্যাগিক থেকে রূপান্তর সরঞ্জামটি ব্যবহার করতে পারেন ।
আমার উত্তর থেকে এখানে অভিযোজিত ।
আপনাকে প্রথমে আপনার লিনাক্স মেশিনে "টেসারেক্ট-ওসিআর" ইনস্টল করতে হবে।
sudo apt-get install tesseract-ocr
আপনি এটি সিএলআই থেকে ম্যানুয়ালি করতে পারেন বা আমি তার জন্য পিএইচপি কোড তৈরি করেছি, আপনি চাইলে এটি ব্যবহার করতে পারেন।
দ্রষ্টব্য: এই কোডটি চালানোর জন্য, exec কমান্ডটি php.ini তে সক্ষম হওয়া উচিত
<?php
//IMAGE TO TXT Conversion
$input_file = $_REQUEST['input_file'];
$out = explode(".",$input_file);
$output_file = $out[0]."_".$out[1];
$output_file_name = $output_file.".txt";
echo "<br />----IMAGE To TXT conversion Started-----</br />";
echo exec('tesseract '.$input_file.' '.$output_file);
echo "<br />----TXT conversion Done-----</br />";
echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />";
?>
এই কোডটি মূল ফোল্ডারে রাখুন এবং এটি ব্রাউজার থেকে অ্যাক্সেস করুন,
যেমন:
http://yourserver.com?input_file=1.png
দ্রষ্টব্য: 1.png ফাইলটি আপনার বর্তমান ডিরেক্টরিতে উপস্থিত থাকা উচিত।
আমার কাছে ছবি আপলোড করার অধিকার নেই, আমি এই চিত্রটি রেফারেন্সের জন্য ব্যবহার করেছি, http://plone.org/docamentation/kb-old/copy_of_ocr-in-plone-used-tesseract-ocr/phototest.gif/image_preview