একটি উচ্চ স্কিউ ভেরিয়েবলের সংক্ষিপ্তসার জন্য গড়


11

আমি অত্যন্ত স্কিউড ডেটা নিয়ে কাজ করছি, তাই আমি কেন্দ্রীয় প্রবণতার সংক্ষিপ্তকরণের গড়টির পরিবর্তে মিডিয়ানটি ব্যবহার করছি। যদিও আমি প্রায়ই জন ব্যক্তির বিষয়ে প্রতিবেদন দেখতে আমি বিচ্ছুরণ একটি পরিমাপ আছে চাই গড় স্ট্যানডার্ড ডেভিয়েশন±± ± বা মধ্যমা ক্যুয়ারটাইলস± কেন্দ্রীয় প্রবণতা সংক্ষেপ, এটা রিপোর্ট করতে ঠিক আছে মধ্যমা মধ্যমা পরম বিচ্ছুরণ (Mad)± ? এই পদ্ধতির সাথে কি কোনও সম্ভাব্য সমস্যা রয়েছে?

আমি নীচের এবং উপরের কোয়ার্টাইলগুলির প্রতিবেদন করার চেয়ে বিশেষত বড় আকারের টেবিলগুলিতে এই পদ্ধতিকে আরও কমপ্যাক্ট এবং স্বজ্ঞাত বলে মনে করব।


3
আমার মনে হয়, মধ্যম, নিম্ন এবং উচ্চতর ভাগের অংশগুলি যৌথভাবে ডেটা আরও ভালভাবে বর্ণনা করবে। আপনি এখানে কিছু বর্ণনামূলক পরিসংখ্যান খুঁজে পেতে পারেন ।

1
আমি যতটা সম্ভব সংক্ষিপ্ত হতে চাই: মিডিয়ান + 2 কোয়ার্টাইল ঠিক আছে কি?
মুলোন

4
এমএডি হ'ল একটি ব্যাচের উপাত্তের বিস্তারকে প্রকাশ করার জন্য একটি সূক্ষ্ম পরিসংখ্যান - এটি আন্তঃখণ্ডজ পরিসরের চেয়েও বহিরাগতদের প্রতিরোধী। তবে আপনি হয়ত ভাবতে চাইতে পারেন যে মিডিয়ান- এমএডের অর্থ কী হবে এবং আপনার শ্রোতাদের কীভাবে এটি ব্যাখ্যা করা উচিত। এটি একই অ্যাসিপটোটিক বা চেবিশেভ অসমতার মতো বৈশিষ্ট্যগুলি এসডির উপভোগ করে না । এ কারণেই সম্ভবত এ জাতীয় অভিব্যক্তি খুব কমই ব্যবহৃত হয় if ±±±
whuber

1
আমি সবসময়ই ভেবেছিলাম এমএডি এমএসের সাথে নিরঙ্কুশ বিচ্যুতির এনালগের পক্ষে দাঁড়িয়েছে যার অর্থ স্কোয়ার ত্রুটি। এটি মধ্যম নয় মধ্যম থেকে পরম বিচরণের গড়। আমি ঠিক আছি বা আমি এমএডি যাচ্ছি?
মাইকেল আর চেরনিক

2
চিত্র হাজার শব্দ, যদি সম্ভব হিস্টোগ্রাম প্রদর্শন করা খুব শক্তিশালী।
বিডিয়নভিক

উত্তর:


7

আমি মনে করি না মধ্যমা না ক্ষিপ্ত সাধারণভাবে উপযুক্ত। ±

আপনি সহজেই এমন বিতরণ তৈরি করতে পারেন যেখানে ৫০% ডেডিয়েন্ট মিডিয়ানের তুলনায় ভগ্নাংশের চেয়ে কম থাকে এবং ৫০% ডেটা মিডিয়ানের চেয়ে অনেক বেশি ছড়িয়ে পড়ে - যেমন (৪.৯,৪.৯,৪.৯,৪.৯,৫,০০,০০০,1000000,100000 , 1000000)। 5 0.10 স্বরলিপিটি মনে হয় যে আশেপাশে কিছু ভর রয়েছে (মিডিয়ান + পাগল ~ = 5.10), এবং এটি সর্বদা ক্ষেত্রে হয় না এবং আপনার ধারণা নেই যে 1000000 এর কাছাকাছি কোনও বড় ভর রয়েছে there's±

কোয়ারটাইলস / কোয়ান্টাইলগুলি অতিরিক্ত সংখ্যার ব্যয়ে বিতরণ সম্পর্কে আরও ভাল ধারণা দেয় - (4.9,5.0,1000000.0)। আমি সন্দেহ করি এটি সম্পূর্ণরূপে একটি সহ-ঘটনা যে স্কিউনেস তৃতীয় মুহূর্ত এবং স্বল্প বন্টনকে স্বজ্ঞাতভাবে কল্পনা করতে আমার তিনটি সংখ্যা / মাত্রা প্রয়োজন বলে মনে হয়।

এটি বলেছিল যে, সেপ্টেম্বর এর সাথে এটিতে কোনও সমস্যা নেই - আমি এখানে কেবল স্বজ্ঞাততা এবং পাঠযোগ্যতার পক্ষে যুক্তি দিচ্ছি। যদি আপনি এটি নিজের বা আপনার দলের জন্য ব্যবহার করেন তবে উন্মাদ হয়ে যান। তবে আমি মনে করি এটি একটি বিস্তৃত দর্শকদের বিভ্রান্ত করবে।


2
(+1) আমি যুক্ত করতে চাই যে তৃতীয় মুহুর্তের বিচারে skewness এর সংজ্ঞা আজকাল সর্বাধিক গ্রহণযোগ্য নয় কারণ এটি কেবল হালকা লেজযুক্ত বিতরণে প্রয়োগ করা যেতে পারে। স্কিউনেসের আরও আধুনিক সংজ্ঞা কোয়ান্টাইলের উপর ভিত্তি করে, এর কয়েকটি এখানে পাওয়া যাবে

1
@ মোয়েবা এটা কি? এমএডি-র উইকিপিডিয়া পৃষ্ঠাটি এটিকে মেডিয়ান (| একাদশ - মিডিয়ান (এক্স) |) হিসাবে সংজ্ঞায়িত করেছে, যা দেওয়া তথ্যের সাথে 0.1।
উচ্চ_পরে

@ উচ্চ_ক্যাস আপনাকে ধন্যবাদ আমি ভুল ছিলাম (প্রায় 5-5 = 0 শব্দটি ভুলে গেছি)। আমি আমার মন্তব্য মুছে ফেলব ভবিষ্যতের পাঠকদের বিভ্রান্ত না করার জন্য!
অ্যামিবা

4

এমএডি পরিমাণ ব্যবহার করে এটি ধরে নেওয়া যায় যে অন্তর্নিহিত বিতরণটি প্রতিসম হয় (মধ্যের উপরে এবং মধ্যমের নীচে বিচ্যুতি সমানভাবে বিবেচিত হয়)। যদি আপনার ডেটা স্কিউড হয় তবে এটি স্পষ্টতই ভুল: এটি আপনাকে আপনার ডেটার সত্যিকারের পরিবর্তনশীলতার চেয়ে বেশি মূল্যায়ন করতে পরিচালিত করবে।

ভাগ্যক্রমে, আপনি পাগলের যে বেশিরভাগ বিকল্প সমান শক্তিশালী, প্রায় গণনা করা সহজ এবং এটি প্রতিসাম্যতা ধরে না এমন কয়েকটি বিকল্পের মধ্যে একটি বেছে নিতে পারেন।

কটাক্ষপাত আছে Rousseeuw এবং Croux 1992 । এই ধারণাগুলি এখানে ভালভাবে ব্যাখ্যা করা হয়েছে এবং এখানে প্রয়োগ করা হয়েছে । এই দুটি অনুমানকারী ইউ-পরিসংখ্যানের তথাকথিত শ্রেণির সদস্য, যার জন্য একটি উন্নত তত্ত্ব রয়েছে।


1

"এই গবেষণাপত্রে অসমত্বের আরও সঠিক সূচক অধ্যয়ন করা হয়েছে। বিশেষত, বাম এবং ডান বৈকল্পিক ব্যবহারের প্রস্তাব দেওয়া হয় এবং তাদের উপর ভিত্তি করে অসমত্বের একটি সূচক প্রবর্তন করা হয়। বেশ কয়েকটি উদাহরণ তার কার্যকারিতা প্রদর্শন করে। আরও সঠিকভাবে বিস্তারের মূল্যায়ন করার প্রশ্ন সমস্ত অ-প্রতিসম সম্ভাবনামূলক বিতরণগুলিতে গড় সম্পর্কে ডেটাগুলির উত্থান ঘটে When যখন জনসংখ্যা বিতরণ অ-প্রতিসাম্যহীন হয়, তখন ডেটার একটি সেটের গড় এবং প্রকরণ (বা স্ট্যান্ডার্ড বিচ্যুতি) ডেটা বিতরণের একটি সঠিক ধারণা সরবরাহ করে না, বিশেষত আকৃতি এবং প্রতিসাম্য। এটি যুক্তিযুক্ত যে, গড়, প্রস্তাবিত বাম ভেরিয়েন্স (বা বাম স্ট্যান্ডার্ড বিচ্যুতি) এবং ডান ভেরিয়েন্স (বা ডান স্ট্যান্ডার্ড বিচ্যুতি) ডেটার সেটটিকে আরও সঠিকভাবে বর্ণনা করে। "

লিংক


3
আপনি একটি কাগজের বিমূর্তটি উদ্ধৃত করেছেন এবং এমন কিছু সরবরাহ করেছেন যা কোনও ইউআরএল এর অনুরূপ (আমি লিঙ্কটি ঠিক করার স্বাধীনতা নিয়েছি)। আমরা এখানে যে উত্তরটি খুঁজছি তা আসলে এটি নয়; আমি আপনাকে আপনার উত্তরটি সম্পাদনা করতে এবং কেন এই লিঙ্কটি প্রশ্নের উত্তর দিতে সহায়তা করে সে সম্পর্কে আপনার নিজের কিছু মন্তব্য যুক্ত করার চেষ্টা করতে উত্সাহিত করি। উত্তরটি অনেক উন্নত হবে যদি আপনি ব্যাখ্যা করেন যে কীভাবে এই অসম্পূর্ণ সূচকটি মধ্যবর্তী প্রবণতা এবং এমএডি সম্পর্কিত।
MånsT
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.