অ্যাক্রোব্যাটের ওসিআর বৈশিষ্ট্যের অনুরূপ স্ক্যান হওয়া পিডিএফ ফাইলগুলির ওসিআর স্বয়ংক্রিয় করার জন্য কোনও সরঞ্জাম? [বন্ধ]


10

মুক্ত উত্স পছন্দসই, তবে প্রয়োজনীয় নয় necessary

আমি অ্যাডোব অ্যাক্রোব্যাট 8 পেয়েছি, এবং সত্যই ওসিআর বৈশিষ্ট্যটি পছন্দ করে যা স্ক্যান করা নথির শীর্ষে ওসিআর পাঠ্যটির একটি অদৃশ্য স্তর রাখতে পারে। সুতরাং আপনি স্ক্রিনে যা দেখেন তা হ'ল আসল স্ক্যান করা নথি তবে ফলাফলটি অনুসন্ধানযোগ্য।

আমি যা খুঁজছি তা এই প্রক্রিয়াটি স্বয়ংক্রিয় করার একটি উপায়। আমি বর্তমানে কয়েকটি স্ক্রিপ্ট পেয়েছি যা আমরা স্ক্যান করা ফাইলগুলি প্রসেসিং এবং সংরক্ষণাগার জন্য ব্যবহার করি এবং অ্যাক্রোব্যাটের সাথে আমি যা করতে পারি তার অনুরূপ পদ্ধতিতে ওসিআর করার জন্য আমি এই ব্যাচ প্রক্রিয়াটিতে সরাসরি প্লাগ করতে পারি এমন কিছু সন্ধান করছি।

সমস্ত পরামর্শ স্বাগত জানাই, ধন্যবাদ!


1
পিএস - আমি ব্যবহারকারীর প্রশ্নের প্রশ্নগুলিকে সুপারভাইজারে রাখার চেষ্টা করি। তবে, এই প্রশ্নটি থেকে কার্যকর হওয়া বাস্তবায়ন অবশ্যই সার্ভারে বেঁচে থাকবে যে আমি স্ক্যান করা ডকুমেন্টেশন প্রসেসিং করেছি ... সুতরাং এটি টসআপ ছিল।
বোডেন

উত্তর:


8

আমি এটি একটি কোম্পানির নথি সংরক্ষণাগার প্রকল্পে প্রয়োগ করেছি। স্ক্যান করা ফাইলটি একটি টিআইফ ফাইল (একক পৃষ্ঠা)। তারপর ব্যবহার কুনেইফর্ম একক TIF একটি hocr ফাইল তৈরি করতে। তারপরে hocr2pdf পিডিএফ ফাইল আউটপুট ব্যবহার করে । যদি একাধিক স্ক্যান পৃষ্ঠাগুলি হয় তবে আমি পিডিএফগুলিকে একক পিডিএফ ডকুমেন্টের সাথে সংযুক্ত করতে জিএস ব্যবহার করি। সত্যই ভাল কাজ করে, ওসিআর আমাদের প্রয়োজনের জন্য যথেষ্ট ভাল এবং কোনও পিডিএফ দর্শনে সন্ধানযোগ্য।


মজাদার. আমি এটি দেখার জন্য অনেক বেশি সময় ব্যয় করার আগে, ফলাফলটি পিডিএফটি কোনও এমবেডড টেক্সট স্তর সহ মূল স্ক্যান থেকে প্রাপ্ত চিত্রটি হয় বা এটি কেবল পাঠ্য?
বোডেন

এটি এম্বেড থাকা পাঠ্য স্তর সহ মূল স্ক্যানের চিত্র। এইচকেআর ফাইল হ'ল এইচটিএমএল মার্কআপগুলি সহ পাঠ্য আউটপুট।
xeon

চমৎকার। আমি এটি একটি শট দিতে যাচ্ছি। দেখে মনে হচ্ছে এটি কাজ করবে আমি আপনার উত্তর গ্রহণযোগ্য হিসাবে চিহ্নিত করব। ধন্যবাদ!
বোডেন

1
আবার ধন্যবাদ. এই দুটি ছেলেকে ইনস্টল করতে কিছুটা ব্যথা হচ্ছে, কিন্তু এটি কাজ করছে। আমি নতুন .fif ফাইলগুলির জন্য একটি এফটিপি ফোল্ডার যাচাই করার জন্য একটি সাধারণ স্ক্রিপ্ট লিখেছিলাম যার উপর এটি কিউনিফর্ম এবং হকার 2 পিডিএফ চালায়, তারপরে কার্ল ব্যবহার করে ফলাফলগুলি শারিপয়েন্ট ডকুমেন্ট লাইব্রেরিতে আপলোড করে। এইভাবে লোকেরা অনুলিপি মেশিন থেকে ডকুমেন্ট সংরক্ষণাগারভুক্ত করতে পারে এবং সংরক্ষণাগারগুলি সম্পূর্ণ পাঠ্য অনুসন্ধানযোগ্য sear প্রশ্ন: আপনি কি জানেন যে hocr2pdf এর "রেজোলিউশন ওভাররাইট" বিকল্পটি কী করে?
বোডেন

আমি আনন্দিত এটি আপনার জন্য কাজ করছে। আমি জানি না যে -r যুক্তিটি করে।
xeon

1

আপনি কি ওয়াচসিআর-এর দিকে নজর রেখেছেন? আপনি এটি http://www.watchocr.com থেকে ডাউনলোড করতে পারেন এটি একটি নিখরচায় ও ওপেন সোর্স ওসিআর সার্ভার যা কেবলমাত্র পিডিএফএসকে দেখানো ফোল্ডার বা নেটওয়ার্ক শেয়ার থেকে পাঠ্য অনুসন্ধানযোগ্য পিডিএফগুলিতে রূপান্তর করে।


0

আমি জিওনের উত্তরের শব্দগুলি পছন্দ করি , যদিও ওসিআরপাস বেশ মজাদার বলে মনে হয়।


যখন আমি গবেষণা এবং বিভিন্ন সমাধান পরীক্ষা করছিলাম। আমি চেষ্টা করেছি এবং পরীক্ষামূলক-ওসিআর এবং তখন পিডিএফগুলিতে তাদের ভাল উপায় আউটপুট ছিল না। তাদের এই বৈশিষ্ট্যগুলি আছে কিনা তা আমি খতিয়ে দেখিনি ... আমি জানি
টেস্টারাক্ট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.