আমি পিডিফোকারআরবি দিয়ে সবেমাত্র সাফল্য পেয়েছি (16.04 এর নিচে) । এটি উবুন্টু উইকিতে তালিকাভুক্ত
এখানে একটি পিপিএ কিন্তু 16.04 এর জন্য সংগ্রহস্থল আপডেট করা হয়নি। গিথুব থেকে উপরের রুবি স্ক্রিপ্টটি এখনও 16.04 এর সাথে কাজ করে।
আপনি এটি গিথুব থেকে ডাউনলোড করতে পারেন। আপনার নিম্নলিখিত প্যাকেজগুলি ইনস্টল করা দরকার:
ruby tesseract-ocr pdftk exactimage
তারপরে pdfocr.rb এক্সিকিউটেবল এবং রান করে:
./pdfocf.rb -i source.pdf -o output.pdf
Ptionচ্ছিকভাবে আপনি -l LANGপ্যারামিটারটি ব্যবহার করতে পারেন । সেক্ষেত্রে আপনাকে tesseract-ocr-LANGপ্যাকেজ ইনস্টল করতে হবে , যেখানে LANGআইএসও 639-2 ভাষার কোডটি রয়েছে three এখন আপনার 16.04 রেপোতে 108 টি ভাষা রয়েছে।