অতিরিক্ত মান সহ একটি ভেরিয়েবলের ফ্রিকোয়েন্সি বিতরণের জন্য আপনি ক্লাসে মানগুলি ভেঙে ফেলতে পারেন,
এখানে আমি employrate
ভেরিয়েবলের জন্য অতিরিক্ত মূল্যবোধ করি এবং এর সাথে প্রত্যক্ষ সহ ফ্রিকোয়েন্সি বিতরণের কোনও অর্থ হয় নাvalues_count(normalize=True)
country employrate alcconsumption
0 Afghanistan 55.700001 .03
1 Albania 11.000000 7.29
2 Algeria 11.000000 .69
3 Andorra nan 10.17
4 Angola 75.699997 5.57
.. ... ... ...
208 Vietnam 71.000000 3.91
209 West Bank and Gaza 32.000000
210 Yemen, Rep. 39.000000 .2
211 Zambia 61.000000 3.56
212 Zimbabwe 66.800003 4.96
[213 rows x 3 columns]
values_count(normalize=True)
শ্রেণিবিন্যাস সহ ফ্রিকোয়েন্সি বিতরণ , ফলাফলের দৈর্ঘ্য এখানে 139 (ফ্রিকোয়েন্সি বিতরণ হিসাবে অর্থহীন বলে মনে হচ্ছে):
print(gm["employrate"].value_counts(sort=False,normalize=True))
50.500000 0.005618
61.500000 0.016854
46.000000 0.011236
64.500000 0.005618
63.500000 0.005618
58.599998 0.005618
63.799999 0.011236
63.200001 0.005618
65.599998 0.005618
68.300003 0.005618
Name: employrate, Length: 139, dtype: float64
শ্রেণিবিন্যাস স্থাপন আমরা একটি নির্দিষ্ট পরিসরের সাথে সমস্ত মান স্থাপন।
0-10 হিসাবে 1,
11-20 হিসাবে 2
21-30 হিসাবে 3, এবং আরও
gm["employrate"]=gm["employrate"].str.strip().dropna()
gm["employrate"]=pd.to_numeric(gm["employrate"])
gm['employrate'] = np.where(
(gm['employrate'] <=10) & (gm['employrate'] > 0) , 1, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=20) & (gm['employrate'] > 10) , 1, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=30) & (gm['employrate'] > 20) , 2, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=40) & (gm['employrate'] > 30) , 3, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=50) & (gm['employrate'] > 40) , 4, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=60) & (gm['employrate'] > 50) , 5, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=70) & (gm['employrate'] > 60) , 6, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=80) & (gm['employrate'] > 70) , 7, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=90) & (gm['employrate'] > 80) , 8, gm['employrate']
)
gm['employrate'] = np.where(
(gm['employrate'] <=100) & (gm['employrate'] > 90) , 9, gm['employrate']
)
print(gm["employrate"].value_counts(sort=False,normalize=True))
শ্রেণিবদ্ধের পরে আমাদের স্পষ্ট ফ্রিকোয়েন্সি বিতরণ রয়েছে। এখানে আমরা সহজেই দেখতে পাচ্ছি যে 37.64%
দেশগুলির মধ্যে কাজের হার রয়েছে 51-60%
এবং 11.79%
দেশগুলির মধ্যে কাজের হার রয়েছে71-80%
5.000000 0.376404
7.000000 0.117978
4.000000 0.179775
6.000000 0.264045
8.000000 0.033708
3.000000 0.028090
Name: employrate, dtype: float64
.value_counts().sort_index(1)
, প্রথম কলামটি সম্ভবত সামান্য বাইরে-অর্ডার হওয়া রোধ করতে