TL; ড? নুয়েন্স পাওয়ারপিডিএফ অ্যাডভান্সড দিয়ে শুরু করুন।
আমি ডিসেম্বরে 2014 সালে বড় প্রকল্পের প্রস্তুতিতে ওসিআর সফ্টওয়্যারটি মূল্যায়ন করেছি - ব্যাচগুলিতে কয়েক মিলিয়ন ইংলিশ ভাষার পৃষ্ঠাতে ওসিআর। আপনি কয়েকশো ডলার ব্যয় করতে ইচ্ছুক হলে আপনার কাছে অনেকগুলি বিকল্প রয়েছে; পরীক্ষামূলক সংস্করণগুলি আপনাকে কয়েকশ পৃষ্ঠাগুলিতে রূপান্তর করতে হলে আপনাকে এনে দিতে পারে।
অনেকগুলি সফ্টওয়্যার প্যাকেজগুলি সমস্ত ইনপুট ফাইলগুলি লোড করতে চায়, ওসিআর করে এবং মেসকে একক আউটপুটকে একত্রিত করে। আইএমএইচও এটি মারা গেছে, আমার কেও চাইবে না যে এটি কে চাইবে। আমি সত্য ব্যাচের সন্ধান করছিলাম: প্রতিটি ইনপুট ফাইলের জন্য একটি আউটপুট ফাইল, অপরিবর্তিত অপারেশন, কোনও কিছুর জন্য থামবে না, আমাকে শেষে একটি বিশদ প্রতিবেদন দিন। স্পোলার সতর্কতা: আমি এটি পাইনি।
বর্ণানুক্রমিক ক্রমে প্যাকেজগুলি অনুসরণ করে। নীচে দেখানো দামগুলি তালিকাভুক্ত তবে ছাড় ছাড়। নুনের দানা দিয়ে নির্ভুলতা সম্পর্কে আমার মন্তব্যগুলি নিন; আপনার ইনপুটগুলি আমার ইনপুটগুলির মতো হবে না তাই আপনার মাইলেজটি অবশ্যই পৃথক হবে।
এবিওয়াই ফিনারিডার 12 কর্পোরেট: $ 400 ব্যাচের বৈশিষ্ট্যটিকে "টাস্ক ম্যানেজার" বলা হয় এবং এটি সরঞ্জাম মেনুতে রয়েছে। এটি সাবফোল্ডার সহ ফোল্ডার থেকে ফাইলগুলি প্রক্রিয়া করবে; এটি আনন্দের সাথে প্রতিটি ইনপুট ফাইলের জন্য পৃথক আউটপুট ফাইল তৈরি করবে। এটি ইনপুট ফোল্ডার স্তরক্রম সংরক্ষণে সক্ষম বলে মনে হচ্ছে না; সমস্ত আউটপুট ফাইল একই আউটপুট ফোল্ডারে গিয়েছিল। আমার পরীক্ষাগুলিতে যথার্থতা বেশি ছিল, তবে আমি এখানে তালিকাভুক্ত প্যাকেজগুলির মধ্যে এখনও সর্বনিম্ন।
অ্যাডোব অ্যাক্রোব্যাট একাদশ: $ 300 ব্যাচের বৈশিষ্ট্যটিকে "পাঠ্য স্বীকৃতি / একাধিক ফাইল ইন" বলা হয় যা সরঞ্জামগুলিতে (তৃতীয় সরঞ্জামদণ্ড, মূল পর্দার উপরের ডান দিকে) ক্লিক করে পাওয়া যাবে। প্রক্রিয়া সাবফোল্ডার, প্রতিটি ইনপুট জন্য একটি আউটপুট। কোনও পাসওয়ার্ড-সুরক্ষিত ফাইলের সন্ধান পেলে প্রম্পট থামায় এবং রাখে। ডিফল্টরূপে ইনপুট ডিরেক্টরি ট্রি সংরক্ষণ করে না; ইনপুট হিসাবে একই ফোল্ডারে আউটপুট লিখে তা করতে পারে। আমার পরীক্ষাগুলিতে নির্ভুলতা বেশ ভাল ছিল।
ন্যানান্স ওমনিপেজ আলটিমেট (ওরফে ভি 19): 500 ডলার। ব্যাচের বৈশিষ্ট্যটিকে "ডকুডাইরেক্ট" বলা হয় এবং এটি একটি পৃথক প্রোগ্রাম যা প্যাকেজটির সাথে আসে। এটি ফোল্ডার এবং সাবফোল্ডারগুলি প্রক্রিয়া করবে; যদি আপনি বৈশিষ্ট্যগুলি ঠিক ঠিক নির্বাচন করেন তবে এটি আউটপুট অঞ্চলে ইনপুট ডিরেক্টরি গাছ সংরক্ষণ করবে। প্রতিটি ইনপুট জন্য একটি আউটপুট। একটি সুরক্ষিত ফাইলের জন্য স্টপ এবং পাসওয়ার্ডের দাবি করে। সমান্তরাল কাজগুলি চালনার জন্য মাল্টি-কোর প্রসেসরের দুর্দান্ত সুবিধা নেওয়া বলে মনে হচ্ছে। সঠিকতা ছিল চমৎকার । তবে ব্যাচ প্রসেসরের স্থিতিশীলতা খুব কম; একটি অস্পষ্ট দলিল এটিকে তার ট্র্যাকগুলিতে থামিয়ে দেবে, পুনরুদ্ধার করতে পারবে না, সহজেই একটি ব্যাচকে লেনদেন করবে।
নুন্যাস পাওয়ারপিডিএফ অ্যাডভান্সড ভি 1.1 (ওমনিপেজ চূড়ান্তের উত্তরসূরি): $ 150 ব্যাচের বৈশিষ্ট্যটিকে "ব্যাচ রূপান্তরকারী" বলা হয় এবং এটি অ্যাডভান্সড প্রসেসিং ট্যাবের অধীনে মূল প্রোগ্রাম থেকে পৌঁছনীয়। এটি ফোল্ডার এবং সাবফোল্ডারগুলি প্রক্রিয়া করবে, আউটপুটটিতে ইনপুট কাঠামো সংরক্ষণ করবে। প্রতিটি ইনপুট জন্য একটি আউটপুট। একাধিক কোর ব্যবহার করবে, তবে আক্রমণাত্মকভাবে নয়; এর অর্থ কী আমি কোনও মাল্টি-কোর হোস্টকে পূরণ করতে পারি না get যথাযথতা উদ্বিগ্ন , ওমনিপেজের চেয়ে ভাল বা ভাল। খারাপ বা अस्पष्ट ফাইলগুলির কারণে এটি স্তব্ধ হয়ে যায়নি। ব্যাচ প্রসেসর আউটপুট ডিরেক্টরিতে একটি প্লেইন-পাঠ্য লগ ফাইল লিখে ( শক )।
ReadIris কর্পোরেট 14: $ 600। ব্যাচ বৈশিষ্ট্যটি "ব্যাচ ওসিআর" আইটেম দ্বারা চালিত হয়েছে যা মূল স্ক্রিনের "ফাইল থেকে" বোতামে ক্লিক করে প্রকাশিত হয়। এটি ফোল্ডার এবং সাবফোল্ডারগুলি প্রতিটি ইনপুটের জন্য একটি আউটপুট প্রসেস করবে এবং ডিফল্টরূপে আউটপুট ডিরেক্টরি কাঠামোটি ইনপুট ডিরেক্টরি কাঠামোর সাথে মেলে। একটি অবৈধ ফাইলটিতে থেমে থাকা এবং ব্যবহারকারীদের ইনপুট দাবি; চিত্রটি ওসিআর-ইং দ্বারা দৃশ্যত সমস্ত অভিযোগ নথিভুক্ত অভিযোগ ছাড়াই প্রক্রিয়া করে ing যথাযথতা খুব ভাল ছিল, অ্যাক্রোব্যাট সমতুল্য।
আমার ডেস্কটপ মেশিনে (কেবলমাত্র ডুয়াল কোর), আমার নির্বাচিত ইনপুটগুলি সহ, প্রতিটি প্যাকেজের কোনও পৃষ্ঠা প্রক্রিয়া করার জন্য কমপক্ষে 3 সেকেন্ডের প্রয়োজন; কেউ কেউ আরও নিয়েছে। আরও কোর সহ একটি মেশিনে এটিকে চালিত করতে সক্ষম হতে পারে।
প্রচুর পরিমাণে গটচেস, তাদের জন্য পরিকল্পনার বিষয়ে নিশ্চিত হন: অবৈধ পিডিএফ (কিছু প্যাকেজ বন্ধ রয়েছে), পাসওয়ার্ড-সুরক্ষিত পিডিএফ (কিছু প্যাকেজ থামায়, অন্যরা যে কোনওভাবে রূপান্তর করে!) এবং ঘোরানো পৃষ্ঠাগুলি (প্রতিকৃতির পরিবর্তে ল্যান্ডস্কেপ)। আপনি যদি ব্যাচটি সম্পূর্ণরূপে চালিত করতে চান তবে আপনাকে খুব যত্ন সহকারে এই প্যাকেজগুলির জন্য ইনপুট অঞ্চলটি প্রস্তুত করতে হবে। পিডিএফ থেকে সুরক্ষা অপসারণ করার জন্য ঘোস্টস্ক্রিপ্ট প্যাকেজের মুদ্রণ-থেকে-পিডিএফ বৈশিষ্ট্যটি দেখুন।
বড় ব্যাচ চালানো স্মৃতিশক্তি-অবসন্নতা এবং ঝুলন্ত সমস্যা দেখা দিতে পারে, এমনকি এটি করা উচিত নয় (আর্গ - সম্ভবত মেমরি ফাঁস)। আপনি যদি কোনও ধরণের অটোমেশন করছেন তবে, একটি বড় সমস্যা আবিষ্কার হয়েছে যে আসলে কী ঘটেছে - কোন নথিগুলি প্রক্রিয়া করা যায় নি, যা প্রক্রিয়া চলাকালীন ব্যর্থ হয়েছিল ইত্যাদি It's "লগ ফাইল".
পরিশেষে কোনও অর্থ পরিশোধকারী গ্রাহক হিসাবে সমর্থন পাওয়া এই গণ-বাজার প্যাকেজগুলির পক্ষে বেশ কঠিন। উদাহরণস্বরূপ, আমি কোনও বৃহত্তর ইনপুটগুলির জন্য ঝুলন্ত একটি প্যাকেজ (যা নামহীন থাকবে) সম্পর্কে একজন সম্মানিত গ্রাহক সহায়তা প্রতিনিধিকে অভিযোগ করেছি। আমি ছেড়ে দেওয়ার আগে 36 ঘন্টা অপেক্ষা করেছি :)। তারা মিষ্টিভাবে ব্যাচের আকার 300 ডকুমেন্টের মধ্যে সীমাবদ্ধ করার পরামর্শ দিয়েছিল। এটি আমার কাছে সম্পূর্ণ অগ্রহণযোগ্য ছিল, তবে ওহে এটা কি সমর্থন টিকিট বন্ধ ডাং দ্রুত পেয়েছে, তাই না? এবং এটাই সব কিছু, তাই না? দীর্ঘশ্বাস.
আছে HTH