আমার ডেটা বিতরণটি প্রতিসম হয় কিনা কীভাবে বলবেন?


23

আমি জানি যে মাঝারি এবং গড়টি যদি প্রায় সমান হয় তবে এর অর্থ একটি প্রতিসম বন্টন আছে তবে এই বিশেষ ক্ষেত্রে আমি নিশ্চিত নই। গড় এবং মাঝারিটি বেশ কাছাকাছি (কেবলমাত্র 0.487 মি / গল পার্থক্য) যা আমাকে বলতে পারে যে একটি প্রতিসম বন্টন আছে তবে বক্সপ্লটকে দেখে মনে হচ্ছে এটি কিছুটা ইতিবাচকভাবে স্কিউড হয়েছে (মিডিয়ান Q3 এর তুলনায় Q1 এর কাছাকাছি নিশ্চিত হয়েছে) মান দ্বারা)।

(আপনার যদি এই সফটওয়্যারটির কোনও নির্দিষ্ট পরামর্শ থাকে তবে আমি মিনিতব ব্যবহার করছি))


অর্থোগোনাল একটি বিশদে মন্তব্য: মি / পিত্ত কি ইউনিট? এটি প্রতি গ্যালন মিটারের মতো দেখাচ্ছে এবং আমি আগ্রহী।
নিক কক্স

এটি এখানে একটি মারাত্মক সীমাবদ্ধতা যে বাক্স প্লটগুলি সাধারণত অর্থ দেখায় না!
নিক কক্স

এটি আপনার ডেটার মানক বিচ্যুতি কী? যদি 0.487 মি / গালের মানটি আপনার মানক বিচ্যুতির চেয়ে অনেক কম হয় তবে সম্ভবত আপনার বিতরণটি প্রতিসম হতে পারে বলে বিশ্বাস করার কারণ রয়েছে reasons যদি মানটি আপনার স্ট্যান্ডার্ড বিচ্যুতির চেয়ে অনেক বেশি হয় (বা এমএডি বা আপনি যে কোনও বিচ্যুতি পরিমাপ করেন তবে সম্ভবত বিতরণের প্রতিসাম্য পরীক্ষা করা আরও সময় হারাতে পারে।
usεr11852

1
-70,-63,-56,-49,-42,-35,-28,-21,-14,-7,0,1,4,9,16,25,36,49,64,81,100 হয় ইচ্ছাকৃতভাবে প্রতিসাম্য নয় (নিম্নার্ধে সমান, তবে উপরের অর্ধে নয়) এবং একটি বাক্স প্লট মধ্যমকে (গড়ের সমান) নীচের চৌকোটির চেয়ে আরও উচ্চতর চৌম্বকটির নিকটে রাখবে তবে সর্বাধিকের চেয়ে সর্বনিম্নের নিকটেও রাখবে।
হেনরি

@ নিককক্স এটি টাইপোর সাথে মিলিগালও হতে পারে । এটি প্রায় 500 গ্যাল! বা than g এর কম। (অবশ্যই উপরে উল্লিখিত হিসাবে, 10 - 4μ10-4
এমএডের

উত্তর:


29

কোনও সন্দেহ নেই যে আপনাকে অন্যথায় বলা হয়েছে, তবে এর অর্থ মধ্যমা প্রতিসাম্য বোঝায় না=

গড় মাইনাস মিডিয়ান (দ্বিতীয় পিয়ারসন স্কিউনেস) এর উপর ভিত্তি করে স্কিউনেসটির একটি পরিমাপ রয়েছে, তবে বিতরণটি যখন প্রতিসম হয় না তখন (সাধারণ স্কিউনেস ব্যবস্থাগুলির মতো) এটি 0 হতে পারে।

একইভাবে, মিডিন এবং মিডিয়েনের মধ্যকার সম্পর্কটি মিডহিনজ ( ) এবং মিডিয়েনের মধ্যকার অভিন্ন সম্পর্ককে বোঝায় না । তারা বিপরীত skewness পরামর্শ দিতে পারে, বা একটি মধ্যম সমান হতে পারে অন্যটি না।(প্রশ্নঃ1+ +প্রশ্নঃ3)/2

প্রতিসাম্যতা তদন্ত করার একটি উপায় একটি প্রতিসম প্লট * এর মাধ্যমে ।

যদি হ'ল ক্ষুদ্র থেকে বৃহত্তর (ক্রমের পরিসংখ্যান) থেকে অর্ডার করা পর্যবেক্ষণ হয় এবং হ'ল মধ্যম, তবে একটি প্রতিসম প্লট প্লট বনাম , বনাম ..., ... এবং আরও অনেক কিছু on M Y ( n ) - M M - Y ( 1 ) Y ( n - 1 ) - M M - Y ( 2 )ওয়াই(1),ওয়াই(2),,ওয়াই(এন)এমওয়াই(এন)-এমএম-ওয়াই(1)ওয়াই(এন-1)-এমএম-ওয়াই(2)

* মিনিতাব সেগুলি করতে পারে । প্রকৃতপক্ষে আমি এই প্লটটিকে একটি সম্ভাবনা হিসাবে উত্থাপন করেছি কারণ আমি তাদের মিনিতবতে দেখেছি।

এখানে চারটি উদাহরণ দেওয়া হল:

প্রতিসম প্লট
চারটি বন্টন থেকে প্রাপ্ত নমুনার জন্য উপরের ধরণের প্রতিসম প্লট pl

(প্রকৃত ডিস্ট্রিবিউশন (ডান, শীর্ষ সারি প্রথম) থেকে বাকি ছিল -। Laplace, গামা (আকৃতি = 0.8), বিটা (2,2) এবং বিটা (5,2) কোড হল রস Ihaka এর, থেকে এখানে )

ভারী-লেজযুক্ত প্রতিসম উদাহরণ সহ, এটি প্রায়শই এমন হয় যে সর্বাধিক চরম পয়েন্টগুলি লাইন থেকে খুব দূরে হতে পারে; আপনি যদি চিত্রের উপরের ডানদিকে থাকেন তখন আপনি এক বা দুটি পয়েন্টের লাইন থেকে দূরত্বের দিকে কম মনোযোগ দিন।

অবশ্যই আছে, অন্যান্য প্লট রয়েছে (আমি প্রতিসামান্য প্লটটি উল্লেখ করেছি সেই নির্দিষ্ট ব্যক্তির উকিল করার কোনও বিশেষ ধারণা থেকে নয়, তবে কারণ আমি জানতাম যে এটি ইতিমধ্যে মিনিতাবে প্রয়োগ করা হয়েছিল)। সুতরাং আসুন অন্য কিছু অন্বেষণ করা যাক।

নিক কক্স মন্তব্যগুলিতে প্রস্তাবিত সম্পর্কিত স্ককিপ্লটগুলি এখানে:

অসুস্থতা প্লট
মন্তব্যে নিক কক্সের পরামর্শ অনুসারে স্কিউনেস প্লট

এই প্লটগুলিতে, একটি ট্রেন্ড আপ বামের চেয়ে সাধারণত ভারী ডান লেজকে নির্দেশ করবে এবং নীচে একটি প্রবণতা ডানদিকের চেয়ে সাধারণত একটি ভারী বাম লেজ নির্দেশ করবে, যখন তুলনামূলকভাবে সমতল (যদিও মোটামুটি কোলাহলপূর্ণ) প্লট দ্বারা প্রতিসামন্ত্রের পরামর্শ দেওয়া হবে।

নিক পরামর্শ দেয় যে এই প্লটটি আরও ভাল (বিশেষত "আরও সরাসরি")। আমি সম্মত নত করছি; প্লটের ব্যাখ্যাটি ফলস্বরূপ কিছুটা সহজ বলে মনে হয়, যদিও সম্পর্কিত প্লটগুলির তথ্য প্রায়শই একই রকম হয় (আপনি প্রথম সেটে ইউনিট opeাল বিয়োগ করার পরে, আপনি দ্বিতীয় সেটটির মতো কিছু পাবেন)।

[অবশ্যই, এই বিষয়গুলির কোনওটিই আমাদের বলবে না যে ডেটা বিতরণ থেকে প্রাপ্ত ডেটা বিতরণটি আসলে প্রতিসম; নমুনাটি কতটা সমান্তরিত, তার একটি ইঙ্গিত আমরা পেয়েছি এবং সেই পরিমাণে আমরা বিচার করতে পারি যদি ডেটা কোনও নিকট-প্রতিসম জনসংখ্যার সাথে আঁকার সাথে যুক্তিসঙ্গতভাবে সামঞ্জস্য হয়।]


3
@ user72943 আপনি যদি এটির সাথে পুরোপুরি সন্তুষ্ট হন তবে ফিরে এসে গ্লেন_ব এর উত্তর নির্বাচন করতে ভুলবেন না। কেউ আরও ভাল উত্তর জমা দেয় কিনা তা দেখতে আপনি কিছুক্ষণ অপেক্ষা করতে চাইতে পারেন, তবে উত্তরটি স্বীকার করলে গ্লেন_বি আরও ক্রেডিট পাবেন।
ওয়েইন

3
+1, কিন্তু একটি quibble। আমি এখানে প্রতিসাম্য প্লটের চেয়ে সরাসরি (উচ্চ কোয়ান্টাইল নিম্ন কোয়ান্টাইল) / 2 বনাম (উচ্চ কোয়ান্টাইল নিম্ন কোয়ান্টাইল) এর একটি প্লট পেয়েছি । কোয়ান্টাইল পড়ার জন্য পরিসংখ্যান যদি প্রয়োজন হয়। রেফারেন্স পরিস্থিতিটি একটি প্রতিসম বন্টন, যাতে জুটিযুক্ত কোয়ান্টাইলের গড় গড়গুলি মধ্যমকে সমান করে, তাই একটি সরলরেখা হিসাবে একটি প্রতিসম বন্টন প্লট। হালকা এবং চিহ্নিত অসমমিতি উভয়ই স্পট করা সহজ, যেমনটি (যেমন) মাঝখানে আনুমানিক প্রতিসাম্য এবং এক বা উভয় লেজের ক্ষেত্রে ব্যতিক্রম চিহ্নিত রয়েছে। -+ +-
নিক কক্স

6
(ওয়াই(এন+ +1-আমি)+ +ওয়াই(আমি))/2আমিএন/2,এন/4,এন/8

1
@ শুভ এবং আমি একই অন্তর্নিহিত ধারণা সম্পর্কে কথা বলছি। পার্থক্যটি হ'ল সমস্ত জোড়িত অর্ডার পরিসংখ্যান (বাস্তবে খুব বিচলিত নয়) বা কিছু প্লট করার মধ্যে।
নিক কক্স

1
Stata-jorter.com/sjpdf.html?articlenum=gr0003 এ এবং স্টাটা ব্যবহারকারীদের skewplot(এসএসসি) এর জন্য ডকুমেন্টেশনে রেফারেন্স । কমপক্ষে উইলক, এমবি এবং জ্ঞানাদেসিকান, আর। ১৯৮৮-এর জেডাব্লু টুকি-র সাথে যুক্ত একটি পরামর্শে এই ধারণা ফিরে আসে data তথ্য বিশ্লেষণের সম্ভাব্যতা ষড়যন্ত্র পদ্ধতি। বায়োমেটিকার 55: 1-17।
নিক কক্স

6

সবচেয়ে সহজ জিনিসটি হ'ল নমুনা স্কিউনেস গণনা করা । তার জন্য মিনিতাবে একটি ফাংশন আছে। প্রতিসম বিতরণগুলির শূন্যতা থাকবে w জিরো স্কিউনেস এর অর্থ প্রতিসাম্যযুক্ত নয়, তবে বেশিরভাগ ব্যবহারিক ক্ষেত্রে এটি হবে।

@ নিককক্স যেমন উল্লেখ করেছেন, সঙ্কোচনের একাধিক সংজ্ঞা রয়েছে। আমি এক্সেলের সাথে সামঞ্জস্যপূর্ণ একটি ব্যবহার করি তবে আপনি অন্য কোনওটি ব্যবহার করতে পারেন।


2
আমি মনে করি এটির বানান দরকার। বিশেষত, "skewness" বলে কোনও জিনিস নেই। অনেকগুলি ব্যবস্থা রয়েছে এবং এমনকি অস্বাভাবিকগুলিও প্রায়শই সাধারণগুলির মতো দরকারী বা আকর্ষণীয় (যেমন এল-মুহুর্তগুলি)। এ ব্যাপারে প্রলুব্ধ মতো তৃতীয় মুহূর্ত আদর্শায়িত পরিমাপ (এবং এটা খুব আমার ডিফল্ট আছে,) মনে রাখতে হবে কার্ল পিয়ারসন জন্য, এবং ভাল 20th শতাব্দীর মধ্যে অনেক অন্যান্য লেখক জন্য, বক্রতা প্রায়শই মোডে আপেক্ষিক মাপা হয়।
নিক কক্স

অসম্পূর্ণতা (যেমন আপনি সঠিকভাবে মন্তব্য করেছেন) সনাক্তকরণের জন্য খুব বেশি ক্ষমতা না থাকা ছাড়াও যে কোনও স্কিউনেস সহগ রয়েছে, এটি (অত্যন্ত) অ-শক্তিশালী হওয়ার কারণেও ভোগেন, কারণ এটি তৃতীয় নমুনার মুহুর্তের উপর ভিত্তি করে। এছাড়াও, যেহেতু প্রতিসাম্যকে অনেকগুলি (এবং আকর্ষণীয়) উপায়ে লঙ্ঘন করা যায়, তাই গবেষণামূলক ডেটা বিশ্লেষণ সাহিত্যে বর্ণিত আরও সমৃদ্ধ গ্রাফিকাল ডায়াগনস্টিকগুলির প্রতিসাম্যের একক সংখ্যাসূচক বৈশিষ্ট্য একটি দুর্বল বিকল্প।
whuber

1

নমুনা গড় বাদ দিয়ে আপনার ডেটা শূন্যের কাছাকাছি কেন্দ্র করে Center এখন আপনার ডেটা নেগেটিভ এবং ধনাত্মককে দুটি ভাগে ভাগ করুন। নেতিবাচক ডেটা পয়েন্টগুলির নিখুঁত মান নিন। দুটি পার্টিশন একে অপরের সাথে তুলনা করে এখন একটি দ্বি-নমুনা কলমোগোরভ-স্মারনভ পরীক্ষা করুন। পি-মানের উপর ভিত্তি করে আপনার উপসংহার করুন।


0

আপনার পর্যবেক্ষণগুলিকে এক কলামে ক্রমবর্ধমান মান অনুসারে বাছাই করুন, তারপরে তাদের অন্য কলামে হ্রাসমান মানগুলিতে সাজিয়ে রাখুন।
তারপরে এই দুটি কলামের মধ্যে পারস্পরিক সম্পর্ক সহগ (এটি আরএম কল করুন) গণনা করুন।
চিরাল সূচকটি গণনা করুন: CHI = (1 + আরএম) / 2।
চিআইআই ব্যবধানে মান গ্রহণ করে [০.২.১]
সিআইএ নিখুঁত হয় যদি এবং কেবলমাত্র আপনার নমুনা প্রতিসমিতভাবে বিতরণ করা হয়।
তৃতীয় মুহুর্তের দরকার নেই।
থিওরি:
http://petitjeanmichel.free.fr/itoweb.petitjean.skewness.html
http://petitjeanmichel.free.fr/itoweb.petitjean.html
(এই দুটি পৃষ্ঠায় উদ্ধৃত বেশিরভাগ কাগজপত্র পিডিএফ-তে ডাউনলোডযোগ্য)
এটি আশা করি এমনকি ইদানীং সাহায্য করে।


পারস্পরিক সম্পর্ক, আরএম, অগত্যা নেতিবাচক হবে না? আরএম 1 না হলে CHI কীভাবে 1 হতে পারে তা আমি দেখতে পাচ্ছি না, তবে যেহেতু কল 1 ক্রমবর্ধমান বা ক্রমান্বয়ে বাছাই করা হচ্ছে এবং কম 2 ক্রমান্বয়ে হ্রাস হচ্ছে, আরএম <= 0, যার অর্থ CHI [0, .5] এ মান গ্রহণ করবে। আমি কিছু অনুপস্থিত করছি?
গুং - মনিকা পুনরায়

হ্যাঁ আরএম ইতিবাচক হতে পারে না এবং আসল লাইনে মান গ্রহণ করে এলোমেলো ভেরিয়েবল বিতরণের জন্য CHI 1/2 অতিক্রম করতে পারে না। প্রকৃতপক্ষে উপরের সীমা 1 চিরাল সূচক প্রবর্তন করে সাধারণ তত্ত্ব থেকে আসে। এটি আরও সাধারণ স্থানে মান গ্রহণ করে এলোমেলো ভেরিয়েবল বিতরণে অর্থবোধ করে। এই তত্ত্বটি বর্তমান আলোচনার বাইরে নয়, তবে এটি দুটি ওয়েব পৃষ্ঠায় উপস্থাপিত হয়েছিল যা আমি পূর্বে উল্লেখ করেছি।
পেটিজিজান

দয়া করে নিবন্ধভুক্ত করুন এবং / অথবা আপনার অ্যাকাউন্টগুলি মার্জ করুন (আপনি কীভাবে আমাদের সহায়তা কেন্দ্রের আমার অ্যাকাউন্ট বিভাগে এটি করবেন সে সম্পর্কে তথ্য পেতে পারেন ), তাহলে আপনি নিজের প্রশ্নে সম্পাদনা করতে এবং মন্তব্য করতে সক্ষম হবেন।
গং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.