পাঠ্য করার জন্য আমার পিডিএফ ফাইলগুলি দরকার যাতে আমি কমান্ডলাইন থেকে এগুলি সন্ধান করতে পারি। উবুন্টু, ওবিএসডি বা অনুরূপ ডিস্ট্রোর জন্য কি কিছু কনভার্টার রয়েছে?
সম্ভবত সম্পর্কিত পোস্ট, উবুন্টু সহ ওসিআর এখানে ।
pdftotext
= pdfcat
।
পাঠ্য করার জন্য আমার পিডিএফ ফাইলগুলি দরকার যাতে আমি কমান্ডলাইন থেকে এগুলি সন্ধান করতে পারি। উবুন্টু, ওবিএসডি বা অনুরূপ ডিস্ট্রোর জন্য কি কিছু কনভার্টার রয়েছে?
সম্ভবত সম্পর্কিত পোস্ট, উবুন্টু সহ ওসিআর এখানে ।
pdftotext
= pdfcat
।
উত্তর:
আপনার কাছে প্রচুর বিকল্প রয়েছে!
pdftotext
পপ্পলার থেকে ইতিমধ্যে উল্লেখ করা হয়েছে।
এখানে একটি হাস্কেল প্রোগ্রাম রয়েছেpdf2line
যা ভালভাবে কাজ করে।
ধীশক্তি এর ebook-convert
কমান্ড প্রোগ্রাম (বা নিজেই ধীশক্তি) অন্য কোনো বিকল্প নেই; এটি পিডিএফটিকে প্লেইন পাঠ্যে বা অন্য ই-বুক-ফরম্যাটে (আরটিএফ, ইপাব) রূপান্তর করতে পারে, আমার মতে এটি পিডিফুটটেক্সট এর চেয়ে ভাল ফলাফল উত্পন্ন করে, যদিও এটি যথেষ্ট ধীর।
ebook-convert file.pdf file.txt
অ্যাবিওয়ার্ড কমান্ড-লাইন থেকে জানা কোনও ফর্ম্যাটগুলির মধ্যে রূপান্তর করতে পারে এবং কমপক্ষে optionচ্ছিকভাবে একটি পিডিএফ আমদানি প্লাগইন রয়েছে:
abiword --to=txt file.pdf
তবুও অন্য বিকল্প podofotextextract
থেকে podofo পিডিএফ টুলস গ্রন্থাগার। আমি আসলে চেষ্টা করে দেখিনি।
যদি আপনি দুটি ঘোস্ট স্ক্রিপ্ট সরঞ্জামগুলি একত্রিত করেন pdf2ps
এবং ps2ascii
, আপনার কাছে অন্য একটি বিকল্প রয়েছে।
আমি আসলে আরও কয়েকটি পদ্ধতি সম্পর্কে ভাবতে পারি, তবে আমি আপাতত এটিকে রেখে দেব। ;)
pdftotext
এর চেয়ে আরও সঠিক ফলাফল দেয় ebook-convert
এবং এটি খুব দ্রুত। ebook-convert
আলস্য।
pdftotext
-layout
বিকল্প শিলা সঙ্গে ! calibre
ইনস্টল করতে 600mb এরও বেশি প্রয়োজন! এটি পাগল)
আপনি পিডিএফটি টেক্সট পিডিএফটোটেক্সট ( উলবুন্টু : পপলার-ইউটিস ; ওপেনবিএসডি: xpdf-utils
প্যাকেজ) দিয়ে পাঠ্যে পিডিএফগুলি রূপান্তর করতে পারেন ।
আপনি পিডিএফ সহ বিভিন্ন ফর্ম্যাটযুক্ত পাঠ্য নথির ধরণের সন্ধানের জন্য রিকোল
(উবুন্টু: রিকোল ; ওপেনবিএসডি: কোনও বন্দর নেই, তবে ফ্রিবিএসডি এর জন্য একটি আছে ) ব্যবহার করতে পারেন। একটি জিইউআই রয়েছে এবং এটি হুডের নীচে স্বয়ংক্রিয়ভাবে একটি সূচক তৈরি করে। এটি pdftotext
পিডিএফটিকে পাঠ্যে রূপান্তর করতে ব্যবহার করে।
অ্যাক্রোব্যাট রিডার (লিনাক্সের অন্তত 9 সংস্করণ) এর সীমিত একাধিক-ফাইল অনুসন্ধানের ক্ষমতা রয়েছে (আপনি একটি ডিরেক্টরিতে সমস্ত ফাইল সন্ধান করতে পারেন)।
পিডিফোটটেক্সট সম্ভবত আপনি যা খুঁজছেন তা হ'ল: http://en.wikedia.org/wiki/Pdftotext যদি না আপনি পাঠ্যটি উত্তোলন করতে চান তবে সত্যই এটি গ্রাফিকাল ফর্মের অধীনে নেই, যা পিডিএফ নথিগুলির সাথে সাধারণ নয়।
জিপিডিএফটেক্সট লম্বা লাইনের অনুচ্ছেদের জন্য পুনরায় ফর্ম্যাট করা ইবুক পিডিএফ বিষয়বস্তুকে ASCII পাঠ্যে রূপান্তরিত করে, এটি আমার পক্ষে কাজ করে এবং এর একটি গ্রাফিকাল ইন্টারফেস রয়েছে।
gPDFText
করা যায় তা যুক্ত করতে পারেন, এটি কীভাবে ইনস্টল করা যায় এবং ওপির প্রশ্নের উত্তর দেওয়ার জন্য এটি কীভাবে ব্যবহৃত হবে।