একটি সাধারণ বিতরণের প্যারামিটারগুলি অনুমান করা: গড়ের পরিবর্তে মিডিয়ান?


15

একটি সাধারণ বিতরণের প্যারামিটারগুলি অনুমানের জন্য সাধারণ পদ্ধতির মধ্যে গড় এবং নমুনার মানক বিচ্যুতি / বৈকল্পিকতা ব্যবহার করা।

যাইহোক, যদি কিছু আউটলিয়ার থাকে তবে মিডিয়ান থেকে মিডিয়ান এবং মিডিয়ান মধ্যস্থতার বিচ্যুতিটি আরও বেশি শক্তিশালী হওয়া উচিত, তাই না?

আমি চেষ্টা করেছি এমন কিছু ডেটা সেটগুলিতে, দ্বারা অনুমান করা সাধারণ বিতরণ ক্লাসিক ) এর চেয়ে অনেক বেশি ফিট ফিট বলে মনে হচ্ছে mean গড় এবং আরএমএস বিচ্যুতি ব্যবহার করে।N(median(x),median|xmedian(x)|)N(μ^,σ^)

আপনি যদি ধরে নেন যে ডেটা সেটে কিছু বিদেশী আছে তবে মিডিয়ানটি ব্যবহার না করার কোনও কারণ আছে কি ? আপনি এই পদ্ধতির জন্য কিছু রেফারেন্স জানেন? গুগলে একটি দ্রুত অনুসন্ধান আমাকে কার্যকর ফলাফলগুলি খুঁজে পায় নি যা এখানে মিডিয়ানদের ব্যবহারের সুবিধাগুলি নিয়ে আলোচনা করে (তবে স্পষ্টতই, "সাধারণ বিতরণ প্যারামিটার অনুমানের মাধ্যম" অনুসন্ধানের পদগুলির খুব নির্দিষ্ট সেট নয়)।

মিডিয়ান বিচ্যুতি, এটা কি পক্ষপাতদুষ্ট? পক্ষপাতিত্ব কমাতে আমার কি এটি with দিয়ে গুণ করা উচিত ?n1n

আপনি কি অন্যান্য বিতরণ যেমন গামা বিতরণ বা তাত্ক্ষণিকভাবে সংশোধিত গাউসীয় বিতরণ (যা প্যারামিটার অনুমানের মধ্যে স্কিউনেস প্রয়োজন, এবং প্রকৃতপক্ষে আউটলিয়াররা এই মানটি গণ্ডগোল করে) এর মতো একই শক্তিশালী পরামিতি অনুমানের পদ্ধতি জানেন?


2
আপনার যদি বিদেশি থাকে তবে এটি হতে পারে যে আপনার বিতরণটি সত্যিই গাউসিয়ান স্বাভাবিক নয়। এটি অবশ্যই আপনার প্রশ্নের উত্তর দেয় না, তবে আইএমও, এটি সর্বদা বিনোদন দেওয়া উচিত।
এসডিএস

2
আমার কোনও সাধারণ, পরিষ্কার, গাণিতিক বিতরণ নেই। আমার আসল তথ্য রয়েছে যা প্রকৃতির দ্বারা অগোছালো। নিখুঁত ফিটের জন্য কোনও বিতরণই হবেনা, কারণ আপনি পরিস্থিতি বিশ্লেষণ করে আর পরিচালনা করতে পারবেন না। এবং আউটলিয়াররা আসলে আমার আগ্রহ। :-)
এরিক শোবার্ট

উত্তর:


15

পর্যবেক্ষণ করে একটি দূষিত গসিয়ান বন্টন থেকে টানা ডেটা জড়িত একটি উদাহরণ, আপনি ব্যবহার করে ডেটার বাল্ক বর্ণনা পরামিতি ভাল অনুমান পেতে চাই পরিবর্তে মেড | x - মেড ( এক্স ) | পাগল ( এক্স ) যেখানে :madmed|xmed(x)|mad(x)

mad=1.4826×med|xmed(x)|

- কোথাও, হ'ল ( পাগল ( এক্স ) 2 ) = ভার ( এক্স ) যখন এক্স অনিয়ন্ত্রিত হয় - এটি মূলত গাউস (ওয়াকার দ্বারা তৈরি করেছিলেন ) , এইচ। (1931))।(Φ1(0.75))1=1.4826

E(mad(x)2)=Var(x)
x

medmadmadmadQnQnQn

xΓ(ν,λ)

med(x)λ(ν1/3)

এবং

mad(x)λν

(উভয় ক্ষেত্রেই যখন ভাল হয়ν>1.5

ν^=(med(x)mad(x))2

এবং

λ^=mad(x)2med(x)

সম্পূর্ণ বিকাশের জন্য চেন এবং রুবিন (1986) দেখুন।

  • জে। চেন এবং এইচ। রুবিন, 1986. গামা এবং পোইসন বিতরণের মধ্যমা এবং গড়ের পার্থক্যের জন্য সীমাবদ্ধ, পরিসংখ্যানবিদ। Probab। লেট।, 4, 281–283।
  • পিজে রুউসিউ এবং সি ক্রাউক্স, ১৯৯৩. আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের মেডিয়ান অ্যাবসুলিউট ডেভিয়েশন জার্নালের বিকল্প, খণ্ড। 88, নং 424, পৃষ্ঠা 1273-1283
  • ওয়াকার, এইচ। (1931)। পরিসংখ্যান পদ্ধতির ইতিহাসে অধ্যয়ন। বাল্টিমোর, এমডি: উইলিয়ামস এবং উইলকিনস কো। পি। 24-25।

1
Φ1(0.75)11.4826

@ এরিকসুবার্ট: আপনি ঠিক বলেছেন: আমি দ্বিতীয় বিপরীতটি ভুলে গিয়েছি .c
ব্যবহারকারী 60

2
n/(n1)

1
@ শুভ: এর জন্য ধন্যবাদ, আমি এখন আমার বাক্যটি বুঝতে পারি 'এটি আত্মার ক্ষেত্রে একই রকম ' সহজেই ভুল বোঝাবুঝি হতে পারে। আমি এটি সরিয়েছি।
ব্যবহারকারী 60

1
আমি এক্সনরমাল অংশটিকে একটি পৃথক প্রশ্ন করেছি: stats.stackexchange.com/questions/48907/… তবে আপনার জন্য আমার আরও একটি আছে: লগঅনরমাল বিতরণ - লগ প্রয়োগ করে হ্যান্ডেল করুন, তারপরে সাধারণ বিতরণ হিসাবে এগিয়ে যান?
এরিক শুবার্ট

7

যদি আপনি দৃsert়ভাবে বলে থাকেন যে, আউটলিয়ারদের কিছুটা ছোট অনুপাত বাদে ডেটাগুলি স্বাভাবিক থাকে তবে মিডিয়ান এবং মিডিয়ান পরম বিচ্যুতি স্থূল ত্রুটির পক্ষে দৃ be় হবে তবে বহির্মুখী তথ্যগুলিতে তথ্যের খুব কার্যকরী ব্যবহার করবে না।

আপনি যদি বহিরাগতদের অনুপাতের উপর ভিত্তি করে কিছু অগ্রাধিকার জানতেন তবে আপনি সেই অনুপাতটি গড়ের জন্য ট্রিম করতে পারেন এবং স্ট্যান্ডার্ড বিচ্যুতিটি উইনসরাইজ করতে পারেন। এই জাতীয় জ্ঞানের প্রয়োজন নেই এমন একটি বিকল্প হ'ল এমেরিকেটরগুলি স্থানের জন্য সম্পর্কিত পরিমাণ এবং সম্পর্কিত পরিমাণের জন্য ব্যবহার করা। আপনার অনুমানগুলি সঠিক হলে দক্ষতার লাভ (যেমন আউটলিয়ারের একটি অল্প শতাংশের বাইরে ডেটা সত্যই স্বাভাবিক হওয়া) কিছু পরিস্থিতিতে যথেষ্ট পরিমাণে হতে পারে।

মাঝারি বিচ্যুতিটি স্ট্যান্ডার্ড বিচ্যুতির অনুমান হিসাবে পক্ষপাতদুষ্ট - তবে মতো নয়এনএন-1

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.