কিন্তু কিভাবে এই সম্ভব?
মূলত, একটি প্রোগ্রাম ইনপুট ফাইলে ওসিআর সম্পাদন করে এবং তারপরে এটি চিত্রের উপরে পাঠ্যের একটি অদৃশ্য স্তর রাখে। বিকল্পভাবে, এটি একই প্রভাব প্রদান করে ছবির নীচে পাঠ্যের একটি দৃশ্যমান স্তর স্থাপন করতে পারে ।
আপনি যখন কিছু নির্বাচন করেন, তখন পাঠ্য স্তরটি নির্বাচিত হওয়ার কারণে ছবিটির কোনও গুরুত্ব নেই।
এটি কীভাবে তৈরি করা যায়?
বিভিন্ন উপায় আছে। অ্যাক্রোব্যাট ইতিমধ্যে প্রস্তাবিত হয়েছে যে দেওয়া, আমি কিছু বিনামূল্যে বিকল্প যুক্ত করব (এবং সৌভাগ্যক্রমে আপনি উইন্ডোজ সেগুলি ব্যবহার করতে বাধ্য হন না)।
পিডিএফ-এক্সচেঞ্জ ভিউয়ার
এটি ট্র্যাকার সফ্টওয়্যার দ্বারা পরিচালিত একটি স্থানীয় উইন্ডোজ প্রোগ্রাম । আপনি একটি 32 বিট prefix মধ্যে 32 বিট সংস্করণ ব্যবহার বিনামূল্যের সংস্করণ মদ অধীনে জরিমানা চালায়, তাই আপনি Windows, MacOS এবং Linux তে এটি ব্যবহার করতে পারেন। শেষ দুটি ক্ষেত্রে, আপনার যথাক্রমে প্লেঅনম্যাক বা প্লেঅনলিনাক্সের প্রয়োজন হবে।
এই জিজ্ঞাসা উবুন্টুকে ছেড়ে দেওয়া উত্তর থেকে একটি চিত্র এখানে দেওয়া হয়েছে :
OCRmyPDF
এটি ঘোস্টস্ক্রিপ্ট, টেসারেক্ট এবং আনপারপেপারের ভিত্তিতে পাইথনে লিখিত একাধিক প্ল্যাটফর্ম প্রোগ্রাম । দস্তাবেজগুলি থেকে:
ওসিআরমিপিডিএফ কী করে
ওসিআরমিপিডিএফ কোনও বিষয়বস্তু না হারিয়ে page পৃষ্ঠার সমস্ত তথ্য ক্যাপচার করার জন্য প্রয়োজনীয় রঙিন স্থান এবং রেজোলিউশন (ডিপিআই) নির্ধারণ করার জন্য একটি পিডিএফের প্রতিটি পৃষ্ঠার বিশ্লেষণ করে। এটি পৃষ্ঠাটি রাস্টারাইজেশনের জন্য ঘোস্টস্ক্রিপ্ট ব্যবহার করে এবং তারপরে একটি ওসিআর "স্তর" তৈরি করতে রাস্টারযুক্ত চিত্রটিতে ওসিআর সম্পাদন করে। তারপরে স্তরটি মূল পিডিএফের উপরে ফিরে কলম করা হয়।
এটি ডেবিয়ান এবং উবুন্টু ডেরিভেটিভগুলিতে সহজেই ইনস্টল করা যেতে পারে:
apt-get install ocrmypdf
বা ম্যাকোজে:
brew tap jbarlow83/ocrmypdf
brew install ocrmypdf
উইন্ডোজে আপনাকে ডকার চিত্রটি ব্যবহার করতে হবে। বিস্তারিত জানার জন্য অফিসিয়াল ডক্স দেখুন।
ব্যবহার খুব সহজ এবং আমি আপনাকে আরও ভাল ফলাফলের জন্য -d
alচ্ছিক (ডেস্কিউ) এবং -c
(পরিষ্কার) পরামিতিগুলি ব্যবহার করার পরামর্শ দিই । এটি প্রতিটি পৃষ্ঠা সোজা করে ওসিআর প্রক্রিয়া চালানোর আগে ছোট বিন্দু / অপূর্ণতাগুলি পরিষ্কার করবে।
আপনি ভাষাটি সরবরাহ করতে পারেন (এবং হওয়া উচিত) -l
।
ইতালিয়ান ভাষায় লেখা এই স্কিওড ডকুমেন্ট থেকে নেওয়া একটি উদাহরণ এখানে :
আমি যে আদেশটি ব্যবহার করেছি তা হ'ল:
ocrmypdf -l ita -d -c input.pdf output.pdf
অনলাইন সরঞ্জাম
কয়েকটি অনলাইন সরঞ্জাম রয়েছে যা একই কাজ করে। উল্লেখযোগ্য, পিডিএফ 24 ওসিআরমিপিডিএফের একটি বিনামূল্যে ওয়েব-ভিত্তিক সংস্করণ হোস্ট করে যা সীমাবদ্ধতা ছাড়াই ব্যবহার করা যায় used
আরো দেখুন: