আজ যেহেতু আমি জানি: PDF ফাইল থেকে টেক্সট নিষ্কাশন জন্য ভাল জিনিস হল টিইটি, টেক্সট নিষ্কাশন টুলকিট । টিইটি হ'ল পিডিএফলিব ডটকমের পরিবারের অংশ।
পিডিএফলিব.কম হ'ল টমাস মের্জের সংস্থা। আপনি যদি তার নামটি স্বীকৃতি না পান: থমাস মের্জ "পোস্টস্ক্রিপ্ট এবং পিডিএফ বাইবেল" র লেখক।
টিইটির প্রথম অবতার একটি গ্রন্থাগার । পৃষ্ঠার প্রতিটি উপাদান সম্পর্কিত অবস্থানগত তথ্য সহ এটি সম্ভবত বুডা 6006 যা যা করতে চেয়েছিল তা করতে পারে। ওহ, এবং এটি চিত্রগুলিও বের করতে পারে। এটি চিত্রগুলিকে পুনরায় সংযুক্ত করে যা টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো হয়ে আছে।
pdflib.com এছাড়াও এই প্রযুক্তির আরেকটি অবতার, অ্যাক্রোব্যাটের জন্য টিইটি প্লাগইন সরবরাহ করে । এবং তৃতীয় অবতার হ'ল পিডিএফলিব টিইটি আইইফিল্টার । এটি ব্যবহারকারী ডেস্কটপগুলির জন্য একক সরঞ্জাম tool এগুলি উভয়ই ব্যক্তিগত, অ-বাণিজ্যিক উদ্দেশ্যে ব্যবহারের জন্য বিনামূল্যে (বিয়ারের মতো) মুক্ত।
এবং এটি সত্যই শক্তিশালী। অ্যাডোবের নিজস্ব পাঠ্য উত্তোলনের চেয়ে উপায় ভাল। এটি আমার কাছে পাঠ্য আহরণ করেছে যেখানে অন্যান্য সরঞ্জামগুলি (অ্যাডোব সহ) কেবল আবর্জনা ছাড়াই।
আমি কেবল ডেস্কটপ স্ট্যান্ডএলোন সরঞ্জাম পরীক্ষা করেছি এবং তারা তাদের ওয়েবপৃষ্ঠায় যা বলে তা সত্য is এটির একটি খুব ভাল কমান্ডলাইন রয়েছে। আমার কিছু "সমস্যাযুক্ত" পিডিএফ পরীক্ষার ফাইলগুলি আমার সম্পূর্ণ সন্তুষ্টির জন্য হ্যান্ডেল করেছিল।
এই জিনিসটি এখন থেকে প্রতিটি পরিশীলিত এবং চ্যালেঞ্জিং পিডিএফ পাঠ্য নিষ্কাশন প্রয়োজনীয়তার জন্য আমার সুপারিশ হবে।
টিইটি হ'ল দুর্দান্ত। এটি টেবিলগুলি সনাক্ত করে। টেবিলের অভ্যন্তরে, এটি একাধিক কলামগুলিকে বিস্তৃত সেলগুলি সনাক্ত করে। এটি পৃথকভাবে প্রতিটি টেবিল ঘরের টেবিল সারি এবং সামগ্রীগুলি সনাক্ত করে। এটি হাইফেনেশনের সাথে খুব ভাল আচরণ করে: এটি হাইফেনগুলি সরিয়ে দেয় এবং সম্পূর্ণ শব্দ পুনরুদ্ধার করে। এটি অ-এসসিআইআই ভাষাগুলি (সিজেকে, আরবি এবং হিব্রু সহ) সমর্থন করে। লিগচারের মুখোমুখি হওয়ার সময়, এটি মূল চরিত্রগুলি পুনরুদ্ধার করে ...
একবার চেষ্টা করে দেখো.