আমি কীভাবে পিডিএফ ফাইলের শব্দ গণনা পেতে পারি? আমি মনে করি যে বেশিরভাগ পিডিএফ ফাইলগুলির জন্য আমি মোট শব্দ গণনা পেতে চাইছি পাঠ্য স্তরটি এম্বেড করা আছে, সুতরাং আমার কোনও ওসিআর লাগবে না।
টাস্কটি জ্ঞাত আকারের কিছু বৈজ্ঞানিক কাগজ, যেমন 15000 শব্দের সন্ধান থেকে উদ্ভূত হয়েছিল। বেশিরভাগ মোডারের কাগজপত্র পিডিএফ ফর্ম্যাটে প্রকাশিত হয়
pdftotext
: ই ভুলবেন না। এবং যদি আপনি একটি একক কমান্ড ব্যবহার করতে পারেন:pdftotext myfile.pdf - | wc -w
।