ঠিক আছে ... আমি মনে করি pdflatexএখানে অনুপস্থিত অংশ।
ওপি বলেন মধ্যে লাগছিল হয়েছে poppler-utilsএবং pdftk। আমাকে এটি যোগ করতে দিন pdfimages। এগুলি একসাথে pdflatexএকটি সমাধানের টুকরো।
pdfimages -f 4 -l 20 -j -png target.pdf imageroot
উপরোক্ত উদাহরণে কোড সালে pdfimages 20 মাধ্যমে 4 পেজ সৌন্দর্য target.pdfনামের সাথে এবং চায়ের সমস্ত চিত্র ফাইল মধ্যে শুরু imageroot।
poppler-utilsউপলব্ধ pdftotext। আমি সেই -layoutবিকল্পটি প্রস্তাব দিচ্ছি যা দস্তাবেজকে মানব পাঠযোগ্য রাখার জন্য দুর্দান্ত কাজ করে।
pdftotext -layout $1.pdf $1.txt
পিডোসরাসimagemagick দ্বারা প্রদত্ত সমাধানটি নিয়ে ওপির আপত্তি হ'ল কোনও চিত্রের নিষ্কাশনযোগ্য পাঠ্য নেই। আমি যে ইউটিলিটিগুলি উল্লেখ করেছি সেগুলি দিয়ে, ওপিতে এখন সমস্ত চিত্রের পাশাপাশি সমস্ত নিষ্কাশিত পাঠ্য থাকবে এবং পৃষ্ঠা নম্বর এবং বিষয়বস্তু -layoutঅপশন দ্বারা ধরে রাখা থাকবে । ওপি পাঠ্যের সঠিক পৃষ্ঠাটি সনাক্ত করতে পারে এবং এটি একটি .texফাইলের মধ্যে চক করতে পারে যা কোনও %includegraphicsনির্দেশের সাথে শেষ হয় এবং ফাইলের নাম দ্বারা প্রতিস্থাপনের চিত্রটি বোঝায়। আপনি pdflatexএটির পরে এবং আপনার নথির বাকী অংশটি সন্নিবেশ করতে একটি নতুন একক পৃষ্ঠা .পিডিএফ দিয়ে শেষ করবেন pdftk। আপনি যদি জানতেন যে মূল পৃষ্ঠার পাঠ্যটিতে চিত্রটি কোথায় রয়েছে তবে আপনি %includegraphics [h]চিত্রটি সঠিক জায়গায় পেতে পারেন ।