আমার কাছে লিনাক্স পুদিনা 17.2 x32 দারুচিনি রয়েছে। সম্ভবত এই পদক্ষেপগুলি উবুন্টু 14.04 x32 এও কাজ করবে।
- পরীক্ষামূলক ওসিআর ইনস্টল করুন sudo apt-get ইনস্টল -y tesseract-ocr tesseract-ocr-eng আপনি অতিরিক্ত প্যাকেজ ইনস্টল করে অন্যান্য ভাষা যুক্ত করতে পারেন। এই স্ক্রিনশটটি সিনাপটিক থেকে এসেছে: সিনাপটিক
ভাষায় পরীক্ষামূলক ভাষা প্যাকেজ
পরীক্ষার ব্যবহার
বিকল্প 1 - কমান্ডলাইন ওপেন টার্মিনাল দ্বারা, তারপরে আপনি ফোল্ডারে যান যেখানে আপনি চিত্র ফাইল রাখেন (jpg, png) এবং কমান্ড চালান:
ক) সমস্ত চিত্র ফাইলগুলিকে পাঠ্যে রূপান্তর করা
for i in *png; do b=`basename "$i" .png`; tesseract -l eng "$i" "$b" text; done
সমস্ত পাঠ্য ফাইলকে একটিতে মার্জ করতে, একটি কমান্ড চালান cat *.txt >> all.txt
খ) সমস্ত চিত্র ফাইলকে এইচকেআর ফাইলগুলিতে রূপান্তর করতে (ফায়ারফক্সের সাথে খুলুন)
for i in *png; do b=`basename "$i" .png`; tesseract -l eng "$i" "$b" hocr; done
বিকল্প 2 - জিইউআই দ্বারা
ক) জিগ্যামারইডার ইনস্টল করুন এবং এটি ব্যবহার করুন
sudo add-apt-repository -y ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install -y gimagereader
খ) দ্বিতীয় অ্যাপ্লিকেশনটি ভিয়েটোক্রিআর। আসল সংস্করণটি 4.0, সুতরাং ভিয়েতনাম সিআরএস 4.0.zip ডাউনলোড করুন
ফাইলগুলি আনপ্যাক করুন এবং জাভা দ্বারা ভিয়েট ওসিআর.জার খুলুন:
জাভা দ্বারা ভিয়েটোকিআর খুলুন
আপনি যদি জাভা ইনস্টল না করেন তবে আপনি এটি সংগ্রহস্থল থেকে ইনস্টল করতে পারেন বা আপনি ওরাচল জাভা 8 ইনস্টল করতে পারেন উবুন্টু 14.04 এ ওরাকল জাভা 8 ইনস্টল করার পদক্ষেপগুলি
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-installer
sudo apt-get install oracle-java8-set-default
আমি ভিয়েটোক্রিআরকে প্রস্তাব দিচ্ছি, কারণ এটি আপনাকে পিডিএফ ফাইলগুলিতে ওসিআর করতে দেয়, বাল্ক রূপান্তরকরণও একটি বিকল্প।