ইভানসে একটি পিডিএফ ডকুমেন্টের শব্দ গণনা পাওয়া Get


22

উবুন্টুর ডিফল্ট পিডিএফ ভিউয়ার, আমি ইভিংসে দেখছি এমন কোনও পিডিএফ ডকুমেন্টের শব্দের গণনা পাওয়ার কোনও উপায় আছে কি? আমি ডকুমেন্টগুলি টেক্সট ফাইলগুলিতে রূপান্তর করতে এবং টার্মিনাল থেকে শব্দ গণনা পেতে সক্ষম হয়েছি, তবে আমি টার্মিনালটি ব্যবহার না করেই সেগুলি দ্রুত পেতে সক্ষম হতে চাই। এমন কোনও প্লাগইন রয়েছে যা এটি করতে পারে, বা এটি ইতিমধ্যে নির্মিত হয়েছে এবং আমি কেবল এটি মিস করছি?

পিএস আমি আমার দর্শকের পরিবর্তন না করাকে পছন্দ করি কারণ উবুন্টুতে অ্যাভিংসটি ডিফল্ট পিডিএফ ভিউয়ার এবং আমি ডিফল্ট অ্যাপ্লিকেশনগুলি ব্যবহার করে যতটা সম্ভব সম্ভব করতে চাই, এভিন্স অন্তর্ভুক্ত ছিল, সত্যিই দুর্দান্ত।

pdf  evince 

উত্তর:


32

আপনি কমান্ড লাইনের মাধ্যমে এটি করতে পারেন:

pdftotext filename.pdf - | tr -d '.' | wc -w

ধন্যবাদ, তবে আমি যেমন প্রশ্নে বলেছি, বরং এই ধরণের জিনিসটির জন্য কমান্ড লাইনটি ব্যবহার করার দরকার নেই।

4
@ ক্রিস তত্ক্ষণাত কোডগুলিতে সিস্টেম ("<কমান্ড উপরে") সংহত করার চেষ্টা করুন।
গুডেল

11

একটি দ্রুত বাশ স্ক্রিপ্ট সম্পর্কে কীভাবে জেনটি দরকার এবং তা প্রমাণিত হবে । যখন কোনও যুক্তি ছাড়াই ডাকা হয়, এটি আপনাকে একটি সংলাপ বাক্স দেবে যাতে আপনি কোনও ফাইল চয়ন করতে পারেন। যখন আর্গুমেন্টের সাথে ডাকা হয় (বা পরে কথোপকথন বাক্সের পরে), এটি উভয়ই ফাইলটি খোলার জন্য খুলবে এবং একটি শব্দের গণনা সহ একটি সংলাপ বাক্স দেবে।

অন্য কথায়, নীচের পাঠ্য ফাইলে অনুলিপি করুন, যাকে বলা হয় evince-word-count.shবা অন্য কোনও কিছু করুন, এটি আপনার পথে কোথাও সংরক্ষণ করুন (উদাহরণস্বরূপ, ~/bin/এটি এক্সিকিউটেবল করুন) (হয় নটিলাসের ডান ক্লিক এবং বৈশিষ্ট্যগুলির মাধ্যমে বা এর মাধ্যমে chmod +x ~/bin/evince-word-count.sh),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

এখন, নটিলাসের কিছু পিডিএফ-র কিছুতে ডান ক্লিক করুন, "এর সাথে খুলুন ..." নির্বাচন করুন এবং তারপরে এটি খোলার শব্দ-হিসাববিজ্ঞান.শব্দ দিয়ে খুলুন। এখন, আপনি যখন একটি পিডিএফ খুলবেন, এটি উভয়ই খোলার জন্য খোলা হবে এবং আপনাকে একটি শব্দ গণনা দেবে।

বিকল্প পাঠ


আপনি এই ফাইলটি / home/$USER/.local/share/nautilus/scriptts/ এ রেখে দিতে পারেন যা এটি নটিলাসের ডান-ক্লিক থেকে উপলভ্য করে (উবুন্টু ভ্যানিলা ফাইল ম্যানেজার)।
ড্যানিয়েল হলম

10

এভান্স মেলিং তালিকায় ওলাফ লেডিঞ্জারের প্রতিক্রিয়া:

আমি মনে করি যে এই জাতীয় বৈশিষ্ট্য নথি সম্পাদকদের জন্য আরও উপযুক্ত। কারণ তাদের কাছে একটি সরল দর্শক হিসাবে নথিতে আরও তথ্য রয়েছে এবং শব্দ গণনা তুচ্ছ। উদাহরণ হিসাবে পিডিএফ ফাইল নিন। আপনি পাঠ্য হিসাবে যা দেখছেন তা আসলে একরকম ভেক্টর গ্রাফিক আকার হতে পারে। এমনকি পাঠ্যটি পিডিএফ ফাইলে অন্তর্ভুক্ত থাকলেও আপনি যে শব্দগুলি দেখছেন সেগুলি একাধিক "টেক্সট এ অবস্থিত টেক্সট (y, x)" - কমান্ডের সমন্বয়ে গঠিত হতে পারে - উদাহরণস্বরূপ umlauts বা লাইনের শেষের ক্ষেত্রে। সুতরাং একটি শব্দ একাধিক শব্দ হিসাবে গণনা হতে পারে। অতএব আমি বিশ্বাস করি যে নির্ভরযোগ্যভাবে এই জাতীয় বৈশিষ্ট্যটি প্রয়োগ করা কঠিন। আমি কী বলতে চাইছি তা দেখতে পিডিফোটেক্সটেক্সে একবার দেখুন।

2
দস্তাবেজটি সংজ্ঞায়িত করতে যে কোনও ফাইলই ব্যবহৃত হয় যা "উত্স কোড" হিসাবে বিবেচিত হতে পারে, এবং ইভানসই মেশিন যা কোডটি কার্যকর করে। এক্সিকিউশনের আউটপুট কী হবে তা নির্ধারণ করতে উত্স কোড সম্পাদককে (যেমন একটি পাঠ্য সম্পাদক) জিজ্ঞাসা করা অনুচিত (এবং অসম্ভব), সুতরাং আসুন কেবল আউটপুটটি দেখুন (যেমন ইভিসন / পপলারের রেন্ডার করা চিত্র / পাঠ্য) look এভিনসে বাস্তবায়ন আমার পক্ষে কার্যকর হবে যেহেতু আমি আমার কাগজপত্র একটি ভাষা-অজ্ঞাত লেখার সম্পাদককে "কোডিং" করছি এবং আমার উত্সটি "চালানোর" জন্য ইভিন্স (প্যান্ডোক এবং পিডিফ্লেটেক্সের মাধ্যমে) ব্যবহার করব। এটি কী কী মাধ্যমে পেরেছিল তা কেবলমাত্র শেষে আমরা নিশ্চিত হতে পারি। মন্তব্য কোড বিবেচনা করুন।
ব্যবহারকারী29020

4

আমি বিশ্বাস করি না যে এটি সম্ভব (ভাল এটি প্রযুক্তিগতভাবে সম্ভব তবে কার্যকর করা হয়নি)।

আপনাকে মনে রাখতে হবে এভিন্স একটি নথি দর্শনকারী এবং শব্দের গণনা একটি সম্পাদকের ক্ষেত্রে সাধারণত একটি বৈশিষ্ট্য প্রয়োজন (হ্যাঁ আমি জানি এটি সর্বদা ক্ষেত্রে হয় না)।

আপনি এভিন্স বিকাশকারীদের সাথে যোগাযোগ করতে এবং তাদের এই বৈশিষ্ট্যটি বাস্তবায়নে আগ্রহী কিনা তা জিজ্ঞাসা করতে পারেন।


1
ধন্যবাদ। আমি তাদের সাথে যোগাযোগ করেছি এবং আমি একটি নির্দিষ্ট প্রতিক্রিয়া না পাওয়া পর্যন্ত প্রশ্নটি উন্মুক্ত রাখব।

আপনি যখন শুনছেন, কার্যকরভাবে নিজের প্রশ্নের উত্তর দিতে নির্দ্বিধায় :)
8128

ইভানস কঠোরভাবে "দর্শক" নয়। একটি দস্তাবেজ তৈরি করা এবং দেখা এবং সম্পাদনা করা কেবল "সম্পাদনা" এবং তারপরে "দেখুন" এর চেয়ে স্পষ্টতই একটি বড় ওয়ার্কফ্লো। প্রশ্ন সম্পর্কিত: ইভানস বর্তমানে নির্বাচিত পাঠ্য অনুলিপি করার অনুমতি দেয়। এটি কঠোরভাবে "দেখুন" ভূমিকা নয়। আমরা আসলে যা পড়ি (বা প্রকাশককে প্রেরণ করি) এটি চূড়ান্ত "রেন্ডারার" হওয়ায় এভিন্স ফলাফল শব্দের গণনা সন্ধানের জন্য দুর্দান্ত অবস্থানে রয়েছে। ইতিমধ্যে রেন্ডার করা পুরো শব্দ সনাক্ত করার একটি উপায় রয়েছে (কোনও শব্দকে ডাবল-ক্লিক করার চেষ্টা করুন!)। আমি "ফাইল-> বৈশিষ্ট্য" বাক্সে এটি সরবরাহ করতে ইভানসকে পছন্দ করব। এটি ইতিমধ্যে আমাকে পৃষ্ঠা গণনা (রেন্ডারিংয়ের উপর ভিত্তি করে) বলেছে।
ব্যবহারকারী29020
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.