আমি পিডিফোকারআরবি দিয়ে সবেমাত্র সাফল্য পেয়েছি (16.04 এর নিচে) । এটি উবুন্টু উইকিতে তালিকাভুক্ত
এখানে একটি পিপিএ কিন্তু 16.04 এর জন্য সংগ্রহস্থল আপডেট করা হয়নি। গিথুব থেকে উপরের রুবি স্ক্রিপ্টটি এখনও 16.04 এর সাথে কাজ করে।
আপনি এটি গিথুব থেকে ডাউনলোড করতে পারেন। আপনার নিম্নলিখিত প্যাকেজগুলি ইনস্টল করা দরকার:
ruby tesseract-ocr pdftk exactimage
তারপরে pdfocr.rb এক্সিকিউটেবল এবং রান করে:
./pdfocf.rb -i source.pdf -o output.pdf
Ptionচ্ছিকভাবে আপনি -l LANG
প্যারামিটারটি ব্যবহার করতে পারেন । সেক্ষেত্রে আপনাকে tesseract-ocr-LANG
প্যাকেজ ইনস্টল করতে হবে , যেখানে LANG
আইএসও 639-2 ভাষার কোডটি রয়েছে three এখন আপনার 16.04 রেপোতে 108 টি ভাষা রয়েছে।