নথি বলছে:
http://pandas.pydata.org/pandas-docs/dev/basics.html
"অবিচ্ছিন্ন মানগুলি কাটা (মানগুলির উপর ভিত্তি করে বিন) এবং কিউকুট (নমুনা কোয়ান্টাইলের ভিত্তিতে বিনগুলি) ফাংশন ব্যবহার করে পৃথক করা যায়"
আমার কাছে খুব বিমূর্ত মনে হচ্ছে ... আমি নীচের উদাহরণের মধ্যে পার্থক্যগুলি দেখতে পাচ্ছি তবে কিউকুট (নমুনা কোয়ান্টাইল) আসলে / মানে কী? আপনি কখন কুইকুট বনাম কাট ব্যবহার করবেন?
ধন্যবাদ
factors = np.random.randn(30)
In [11]:
pd.cut(factors, 5)
Out[11]:
[(-0.411, 0.575], (-0.411, 0.575], (-0.411, 0.575], (-0.411, 0.575], (0.575, 1.561], ..., (-0.411, 0.575], (-1.397, -0.411], (0.575, 1.561], (-2.388, -1.397], (-0.411, 0.575]]
Length: 30
Categories (5, object): [(-2.388, -1.397] < (-1.397, -0.411] < (-0.411, 0.575] < (0.575, 1.561] < (1.561, 2.547]]
In [14]:
pd.qcut(factors, 5)
Out[14]:
[(-0.348, 0.0899], (-0.348, 0.0899], (0.0899, 1.19], (0.0899, 1.19], (0.0899, 1.19], ..., (0.0899, 1.19], (-1.137, -0.348], (1.19, 2.547], [-2.383, -1.137], (-0.348, 0.0899]]
Length: 30
Categories (5, object): [[-2.383, -1.137] < (-1.137, -0.348] < (-0.348, 0.0899] < (0.0899, 1.19] < (1.19, 2.547]]`