আমার বলার সাথে একটি বড় (প্রায় 12 এম সারি) ডেটা ফ্রেম ডিএফ আছে:
df.columns = ['word','documents','frequency']
সুতরাং নিম্নলিখিত সময় মতো ফ্যাশন চালিত:
word_grouping = df[['word','frequency']].groupby('word')
MaxFrequency_perWord = word_grouping[['frequency']].max().reset_index()
MaxFrequency_perWord.columns = ['word','MaxFrequency']
তবে এটি চালাতে অপ্রত্যাশিত দীর্ঘ সময় নিচ্ছে:
Occurrences_of_Words = word_grouping[['word']].count().reset_index()
আমি এখানে কি ভুল করছি? একটি বৃহত ডেটাফ্রেমে উপস্থিতি গণনা করার আরও ভাল উপায় আছে কি?
df.word.describe()
বেশ দৌড়াদৌড়ি করেছে, তাই আমি এই ঘটনাগুলি_স_ওয়ার্ড ডেটা ফ্রেমটি তৈরি করতে খুব বেশি সময় নিবে বলে আমি আশা করি না।
PS: যদি উত্তরটি সুস্পষ্ট হয় এবং আপনি এই প্রশ্ন জিজ্ঞাসা করার জন্য আমাকে শাস্তি দেওয়ার প্রয়োজন বোধ করেন তবে দয়া করে উত্তরটিও অন্তর্ভুক্ত করুন। ধন্যবাদ.
df.word.value_counts()['myword']
প্রায় দ্বিগুণ দ্রুতlen(df[df.word == 'myword'])
।