আমার একটি ওজনযুক্ত নমুনা রয়েছে, যার জন্য আমি কোয়ান্টাইলগুলি গণনা করতে চাই। 1
আদর্শভাবে, যেখানে ওজন সমান (যদিও = 1 বা অন্যথায়), ফলাফলগুলি scipy.stats.scoreatpercentile()
আর আর এর সাথে সামঞ্জস্যপূর্ণ হবে quantile(...,type=7)
।
একটি সহজ পদ্ধতির দেওয়া ওজন ব্যবহার করে নমুনাকে "গুণিত" করা হবে। এটি কার্যকরভাবে ওজন> 1 এর ক্ষেত্রে স্থানীয়ভাবে "ফ্ল্যাট" ইসিডিএফ দেয়, যা নমুনাটি আসলে একটি সাব-নমুনা হওয়ার সময় স্বজ্ঞাতভাবে ভুল পদ্ধতির মতো মনে হয়। বিশেষত, এর অর্থ হল যে 1 এর সমান ওজনযুক্ত একটি নমুনায় 2 বা 3 এর সমান ওজনযুক্ত একের চেয়ে পৃথক কোয়ান্টাইল থাকে (নোট, তবে, [1] এ উল্লিখিত কাগজটি এই পদ্ধতির ব্যবহার করে বলে মনে হয়।)
http://en.wikedia.org/wiki/Percentile#Weighted_percentile ওয়েটেড পারসেন্টাইলের জন্য একটি বিকল্প সূত্র দেয়। এই সূত্রটিতে এটি স্পষ্ট নয় যে অভিন্ন মানগুলির সাথে সংলগ্ন নমুনাগুলি প্রথমে একত্রিত করা উচিত এবং তাদের quantile()
ওজনগুলি সংশ্লেষ করা উচিত এবং কোনও অবস্থাতেই এর ফলাফলগুলি অপরিবর্তিত / সমান ভারযুক্ত ক্ষেত্রে আর এর ডিফল্ট টাইপ 7 এর সাথে সামঞ্জস্যপূর্ণ বলে মনে হয় না । কোয়ান্টাইলগুলিতে উইকিপিডিয়া পৃষ্ঠাটিতে ওজনযুক্ত মামলার কোনও উল্লেখ নেই।
আর এর "টাইপ 7" কোয়ান্টাইল ফাংশনের ভারী জেনারালাইজেশন আছে কি?
[পাইথন ব্যবহার করে, তবে কেবল একটি অ্যালগরিদম সন্ধান করছি, সত্যই, তাই যে কোনও ভাষা তা করবে]
এম
[1] ওজন পূর্ণসংখ্যা; ওজনগুলি হ'ল বাফারগুলির মধ্যে যা http://infolab.stanford.edu/~manku/papers/98sigmod-quantiles.pdf এ বর্ণিত "পতন" এবং "আউটপুট" ক্রিয়ায় মিলিত হয় । মূলত ওজনযুক্ত নমুনা হ'ল সম্পূর্ণ অদ্বিতীয় নমুনার একটি উপ-নমুনা, প্রতিটি উপাদান x (i) সহ উপ-নমুনায় ওজনকে উপস্থাপন করে (i) পূর্ণ নমুনায় in