অপটিকাল চরিত্র স্বীকৃতি সফ্টওয়্যার সুপারিশ?


15

আমি কিছু ইবুক / কাগজপত্র দেখেছি যা স্পষ্টতই তাদের কাগজের সংস্করণগুলি থেকে স্ক্যান করা হয়েছিল তবে ইবুক / কাগজের পাঠ্যগুলি আশ্চর্যরূপে অনুলিপি করা যেতে পারে। আমি মনে করি যে সরাসরি স্ক্যান করা সংস্করণগুলি অবশ্যই কিছু অপটিক্যাল ক্যারেক্টার রিকগনিশন সফ্টওয়্যার দ্বারা প্রক্রিয়া করা হয়েছে।

সুতরাং আমি জানতে চাইলে প্রস্তাবিত অপটিক্যাল ক্যারেক্টার রিকগনিশন সফটওয়্যারগুলি কী কী? বিশেষত সেগুলি হয় হয় উবুন্টু বা বিনামূল্যে? উইন্ডোজগুলির জন্য যদি এটি আরও বেশি উন্নত হয় তবে দয়া করে আমাকেও জানান।

আমি বিশেষত সেই ওসিআরগুলিতে আগ্রহী যারা স্ক্যান হওয়া পিডিএফ ফাইলটিকে ইনপুট হিসাবে গ্রহণ করতে পারে এবং এখনও অন্য পিডিএফ ফাইল আউটপুট হিসাবে উত্পন্ন করতে পারে যা ইনপুটটির সাথে একই দেখায় তবে এর পাঠ্য অনুলিপিযোগ্য।

ধন্যবাদান্তে!

দয়া করে প্রতিটি উত্তরে একটি সফ্টওয়্যার সীমাবদ্ধ করুন

উত্তর:


10

ওসিআর পরীক্ষা করুন পরীক্ষামূলক ওসিআর ইনস্টল করুন

আসল ইঞ্জিনটি ৮০ এর দশকের শেষদিকে এইচপি এবং আইবিএম দ্বারা তৈরি করা হয়েছিল তবে এটি আমি ব্যবহার করেছি সেরা ওকুলার রিকগনিশন সফ্টওয়্যারগুলির মধ্যে একটি হিসাবে প্রমাণিত। এটি সম্প্রতি ইঞ্জিনটিতে অনেকগুলি আপডেট পেয়েছে এবং এটি বাজারের অন্যতম বিস্তৃত ওসিআর সরঞ্জামে পরিণত হয়েছে। অন্যান্য সমস্ত ওসিআর সরঞ্জামগুলির বিরুদ্ধে আউটসোর্সিং (পাঠ্যের মিলগুলির উচ্চতর 90 শতাংশের কিছু সহ) এটি স্ট্যান্ডার্ড ডকুমেন্টের টাইপ-ফেসটিকে সহজেই পাঠ্যে রূপান্তর করতে পারে।

নিচেরটি একটি উদাহরণ:

tesseract ScannedDocument.png out

আউট.টেক্সট নামে একটি ফাইল তৈরি করবে


ধন্যবাদ! আমি দেখতে পাইনি যে টেসারেক্ট আউটপুট পিডিএফ সমর্থন করে। আপনি এই সম্পর্কে জানেন?
টিম

@ টিম, নেটিভালি আমি বিশ্বাস করি না যে টেসারেক্ট অনেকগুলি ইনপুট / আউটপুট ফর্ম্যাটকে সমর্থন করে। যাইহোক, জ্যানসির উত্তরের হিসাবে উল্লেখ করা হয়েছে, gscan2pdf ওসিআরের জন্য টেসারেক্ট ব্যবহার করে এবং এর নাম থেকেই বোঝা যায় যে এটি পিডিএফ আউটপুট সমর্থন করে।
টিম লিটল

নোট করুন যে ওসিআর অপটিকাল চরিত্রের স্বীকৃতি: en.wikedia.org/wiki/Optical_character_recognition
জোসে

8

এটি করতে সক্ষম হওয়া উচিত এমন আরও একটি প্রকল্প হ'ল gscan2pdf

sudo apt-get install gscan2pdf

এই প্রকল্পটি টেসারেক্টের পাশাপাশি অন্যান্য ওপেন সোর্স ওসিআর সরঞ্জামগুলিও ব্যবহার করতে পারে।


3

আমি উবুন্টুর জন্য কোনও ওসিআর জানি না, তবে উইন্ডোজের জন্য আপনার প্রয়োজনীয় বৈশিষ্ট্যগুলি রয়েছে। এটি অ্যাবিবিওয়াই ফাইনরিডার এটি পৃষ্ঠাটি তবে এটি নিখরচায় নয়


1
টিম যেমন চায় তেমনি ফিনআরডারটি ব্যবহার করেছি (সুরক্ষিত পিডিএফ খোলার জন্য)
এক্সটেন্ডার

3

রেপোস , কনিফর্ম (এবং এর জন্য জিনোম ফ্রন্ট্যান্ড হিসাবে ওয়াইএজিএফ ) -এ বিনামূল্যে সমাধান বিদ্যমান


ধন্যবাদ! কুনিফর্ম কি পিডিএফকে ইনপুট এবং আউটপুট ফর্ম্যাট হিসাবে সমর্থন করে? আমি এটির উইকিপিডিয়া পৃষ্ঠা এবং এটির অফিসিয়াল পৃষ্ঠাতে দেখিনি।
টিম

হয়তো না, তবে টিআইএফএফ-র ধারাবাহিকতায় পিডিএফ বিভক্ত করা যাইহোক সহজ কাজ :)
বর্ধক

3

মনে হচ্ছে ডেকাপড প্রকল্পটি পিডিএফ-তে করে বা রফতানি করবে, সুতরাং কোন পাঠ্যটি পাওয়া গেছে তা জানতে টেসারকে অবশ্যই কোনওভাবে প্রয়োজনীয় তথ্য রফতানি করতে হবে।


1

অ্যাডোব অ্যাক্রোব্যাট (পাঠক নয়, একটি নিখরচায় অ্যাপ্লিকেশন নয়) স্ক্যান হওয়া পিডিএফ ডকুমেন্টকে ওসিআর-ইন করতে এবং চিত্রের উপরে একটি অদৃশ্য পাঠ্য স্তর যুক্ত করতে সক্ষম, যাতে পাঠ্যটি নির্বাচন করা এবং অনুলিপি করা যায়। দুর্ভাগ্যক্রমে অ্যাক্রোব্যাটের ইউআইতে সেই বৈশিষ্ট্যটি ঠিক কোথায় রয়েছে তা যাচাই করা আমার পক্ষে সহজ নয় তবে আপনি যেভাবে উল্লেখ করেছেন আমি একই উদ্দেশ্যে এটি বেশ কয়েকবার সফলভাবে ব্যবহার করেছি।

এবং হ্যাঁ, এটি একটি উইন্ডোজ সফ্টওয়্যার, লিনাক্সের নয়, তবে ওয়াইন এইচকিউ অ্যাপ্লিকেশন ডাটাবেসের মতে এটি ওয়াইনের অধীনে কাজ করে


1

সেরা ওসিআর সফ্টওয়্যারটি সাধারণত মুদ্রক / স্ক্যানার / কপিয়ারগুলিতে এম্বেড থাকে। আমার অফিসে থাকা ক্যানন আইআরসি 3880 আমার জানা কোনও ডেস্কটপ প্রোগ্রামের চেয়ে দুর্দান্ত ওসিআর পিডিএফ সহজ এবং দ্রুত আউটপুট করতে পারে। বইটি ট্রেতে (আনবাউন্ড) রাখুন, আপনার মেইল ​​ঠিকানা নির্বাচন করুন, সবুজ বোতাম টিপুন।

নেট থেকে পাওয়া ওসিআরের বেশিরভাগ পিডিএফ একই ধরণের মেশিনের জন্য আসে। সমস্যাটি হ'ল বাড়ির ব্যবহারের জন্য দাম খুব বেশি (প্রায় 12000 ইউরো আইআরসি)।


1

আমার প্রিয় বিনামূল্যে, অনলাইন ওসিআর সফ্টওয়্যারটি রিকো ইনোভেশনগুলি অফার করে। এটি একটি বিটা প্রোগ্রাম, তবে আমি এটি বেশ ভালভাবে কাজ করে দেখছি। এটি এখানে দেখুন: http://beta.rii.ricoh.com/betalabs/content/docament- রূপান্তর


1

OCRFeeder

এটি একটি জিইউআই অ্যাপ্লিকেশন।

এখানে চিত্র বর্ণনা লিখুন

এটি ওসিআর ইঞ্জিন হিসাবে টেস্ট্রাক্ট - ওসিআর বা ওকরড ব্যবহার করে।

সফটওয়্যার সেন্টার বা এর সাথে ইনস্টল করতে পারেন ,

sudo apt-get install ocrfeeder

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.