লিনাক্সের জন্য স্ক্যান-টু-পিডিএফ সফ্টওয়্যার?


18

আমার একটি ওয়ার্কফ্লো রয়েছে যার মাধ্যমে আমি ফুজিৎসু স্ক্যানস্নাপ এস 500 নথি স্ক্যানার ব্যবহার করে অনুসন্ধানযোগ্য পিডিএফগুলিতে কাগজ নথিগুলি স্ক্যান করি । আমি বান্ডিলযুক্ত সফ্টওয়্যারটির দুর্দান্ত অনুরাগী নই, তবে এটি ব্যবহার করার জন্য এটি মৃত সহজ: শীর্ষে কাগজের একটি স্ট্যাক রাখুন, সবুজ বোতামটি চাপুন এবং একটি অনুসন্ধানযোগ্য পিডিএফ বেরিয়ে আসে।

এখন, আমি লিনাক্সে (উবুন্টু 10.10) তে অনুরূপ কিছু করতে চাই। স্ক্যানারটি বাক্সের বাইরে সমর্থিত।

আমি দেখেছি gscan2pdfএবং XSane:

  • XSane শক্তিশালী দেখায়, তবে ওয়ার্কফ্লো সমাধান হিসাবে সত্যই উপযুক্ত নয়;
  • gscan2pdf "বোতামটি চাপুন, পিডিএফটি পান" আদর্শের কিছুটা কাছে, তবে এখনও সেখানে 100% নেই।

আপনি যে কোনও সফ্টওয়্যার সুপারিশ করতে পারেন (বিনামূল্যে বা অন্যথায়)?


আমি পিডিএফ-কাপ ব্যবহার করি, তবে এটি এমন একটি চিত্র যা অনুসন্ধানযোগ্য পাঠ্য নয়
রোবটহুমানস

1
Gscan2pdf সহ '100% সেখানে নেই' কী?
ডিজিটালপ্প

@ ডিজিট এক্সপ্রেস আমি কোনও পণ্যের জন্য লন্ড্রি ইস্যু, পছন্দ এবং অপছন্দের তালিকা দিয়ে প্রশ্নটি ফাঁস করতে চাই না। তবে, যেহেতু আপনি জিজ্ঞাসা করেছেন, gscan2pdfআমার 'আনপপারিং' নিয়ে অদ্ভুত নিদর্শন ছিল, ওসিআর বেশিরভাগই ব্যবহারের অযোগ্য ছিল (কিছু ইঞ্জিন অন্যদের চেয়ে ভাল) এবং সামগ্রিকভাবে এটি মূল সমাধানের মতো মোটামুটি প্রবাহিত হয়নি। যাইহোক, আমার প্রশ্নের সারমর্মটি হ'ল সেখানে কী আছে তা দেখার জন্য যাতে আমি বিভিন্ন সমাধান চেষ্টা করতে পারি এবং আমার জন্য কী সবচেয়ে ভাল কাজ করে তা দেখতে পাবে।
এনপিই

@ ডিজিটক্সপক্স আমি আমার আগের মন্তব্যটি পুনরায় পড়েছি এবং এটি বেশ নেতিবাচক বলে মনে হচ্ছে। এটা উদ্দেশ্য ছিল না। gscan2pdfপ্রকৃতপক্ষে আমি যা খুঁজছি তার থেকে প্রায় কাছাকাছি, তবে এমন কয়েকটি ক্ষেত্র রয়েছে যেখানে আসল সমাধানের তুলনায় দুঃখের সাথে এটির অভাব রয়েছে।
এনপিই

উত্তর:


18

এই বছরের শুরুর দিকে গবেষণা করার সময় আমি এখানে কিছু জিনিস পেয়েছি। দুঃখিত, আমার সীমিত রেটিংয়ের কারণে আমি একাধিক হাইপারলিংক পোস্ট করতে পারি না, তাই লিঙ্কগুলির জন্য আপনার কাছে Google এ থাকতে হবে।

gscan2pdf

সত্যিই একটি ভাল জিইউআই সিস্টেম যা ব্যাকএন্ডের জন্য বিভিন্ন ওসিআর ইঞ্জিন ব্যবহার করতে পারে। এটি সম্ভবত আপনার ওয়ান-টাচ সলিউশনটি পূরণ করবে (এবং এটি ডিজিট এক্সপ্রেস ইতিমধ্যে উল্লেখ করেছে)।

ওসিআর ইঞ্জিন পরীক্ষা করুন

Gscan2pdf ব্যবহার করা যেতে পারে।

Ocropus

আমি ওক্রোপাসের সাথে খুব বেশি দূরে যাইনি যেহেতু এটি ব্যাপক প্রশিক্ষণ ছাড়াই পাঠ্যকে স্বীকৃতি দিচ্ছে না। এটি সম্ভবত বইগুলির পক্ষে ভাল হবে তবে বিল এবং এগুলি সহ আমার পক্ষে ভাল কাজ হয়নি। YMMV।

কীলকাকার

আমি কুনিফর্মের সাথে সর্বোত্তম সাফল্য পেয়েছি এবং নিম্নলিখিত ওয়ার্কফ্লোর অনুরূপ স্ক্রিপ্টিং কমান্ড দ্বারা অনুসন্ধানযোগ্য পিডিএফ তৈরি করতে সক্ষম হয়েছি:

# extract images from scans
# (not shown)

# convert to black-and-white
optimize2bw -n -i nuance-test.png  -o bw.bmp                               

# do the OCR process and generate an hOCR file
cuneiform -l eng -f hocr -o nuance-test.html bw.bmp

# reassemble the original image with the hOCR file to generate a new PDF
hocr2pdf -s -i nuance-test.png -o nuance-test.hocr.pdf < nuance-test.html  

আপনাকে এক্সটসিটিজ প্যাকেজ ইনস্টল করতে হবে।

ওসিআর'এর পিডিএফ ব্যবহারের জন্য বিভিন্ন ওপেন-সোর্স প্রকল্পগুলি পাশাপাশি কুনিফর্ম এবং হকার 2 পিডিএফ :

  • WatchOCR
  • Archivista

তুমি কি খুঁজে পেলে আমাকে জানাও!

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.