ভিবিএ ছাড়াও ওয়ার্ড ডকুমেন্টের বিষয়বস্তু পড়তে ওপেনঅফিসের এপিআই ব্যবহার করে কেউ এ জাতীয় অ্যাপ্লিকেশন বিকাশ করতে পারে; এটি প্রক্রিয়া করুন এবং একটি স্প্রেডশিট অ্যাপ্লিকেশন খোলার জন্য ফলাফল CSV ফাইল হিসাবে রফতানি করুন।
তবে আপনি যদি কোনও প্রোগ্রামিং ভাষার সাথে পরিচিত হন তবে এটি আসলে কোডের কয়েকটি লাইন। উদাহরণস্বরূপ পাইথনে আপনি সহজে এটি এর মতো করতে পারেন:
এখানে আমরা একটি সাধারণ ক্রিয়াকলাপ সংজ্ঞায়িত করি যা শব্দগুলির একটি তালিকা দেওয়া হয়
def countWords(a_list):
words = {}
for i in range(len(a_list)):
item = a_list[i]
count = a_list.count(item)
words[item] = count
return sorted(words.items(), key = lambda item: item[1], reverse=True)
বাকীটি হ'ল ডকুমেন্টের সামগ্রীটি হস্তান্তর করা। প্রথমটি এটি আটকে দিন:
content = """This is the content of the word document. Just copy paste it.
It can be very very very very long and it can contain punctuation
(they will be ignored) and numbers like 123 and 4567 (they will be counted)."""
এখানে আমরা বিরামচিহ্ন, ইওএল, প্রথম বন্ধনী ইত্যাদি মুছে ফেলি এবং তারপরে আমাদের ফাংশনের জন্য একটি শব্দ তালিকা তৈরি করি:
import re
cleanContent = re.sub('[^a-zA-Z0-9]',' ', content)
wordList = cleanContent.lower().split()
তারপরে আমরা আমাদের ফাংশনটি পরিচালনা করি এবং এর ফলাফল (শব্দ-গণনা জোড়া) অন্য তালিকায় সংরক্ষণ করি এবং ফলাফলগুলি মুদ্রণ করি:
result = countWords(wordList)
for words in result:
print(words)
সুতরাং ফলাফল:
('very', 4)
('and', 3)
('it', 3)
('be', 3)
('they', 2)
('will', 2)
('can', 2)
('the', 2)
('ignored', 1)
('just', 1)
('is', 1)
('numbers', 1)
('punctuation', 1)
('long', 1)
('content', 1)
('document', 1)
('123', 1)
('4567', 1)
('copy', 1)
('paste', 1)
('word', 1)
('like', 1)
('this', 1)
('of', 1)
('contain', 1)
('counted', 1)
আপনি চাইলে অনুসন্ধান / প্রতিস্থাপন ব্যবহার করে বন্ধনী এবং কমা অপসারণ করতে পারেন।
আপনাকে পাইথন 3 ডাউনলোড করতে, এটি ইনস্টল করতে, আইডিএল খুলুন (পাইথনের সাথে আসে) আপনার শব্দ নথির বিষয়বস্তু প্রতিস্থাপন করুন এবং একবারে এবং প্রদত্ত ক্রমে কমান্ডগুলি চালনা করুন।