স্বাভাবিকতা অনুমান সত্ত্বেও কেন র‌্যাঙ্কগুলির একটি পিয়ারসন সহবাস বৈধ?


9

আমি বর্তমানে পিয়ারসন পারস্পরিক সম্পর্কের জন্য অনুমান নিয়ে পড়া করছি। পরবর্তী টি-টেস্টের জন্য একটি গুরুত্বপূর্ণ অনুমান মনে হয় যে উভয় ভেরিয়েবলগুলি সাধারণ বিতরণ থেকে আসে; যদি তারা তা না করে তবে স্পিয়ারম্যান রহোর মতো বিকল্প ব্যবস্থাগুলির ব্যবহারের পক্ষে পরামর্শ দেওয়া হচ্ছে। স্পিয়ারম্যান পারস্পরিক সম্পর্ককে পিয়ারসন পারস্পরিক সম্পর্কের মতো গণনা করা হয়েছে, কেবল এক্স এবং ওয়াইয়ের পরিবর্তে কেবল এক্স এবং ওয়াইয়ের র‌্যাঙ্ক ব্যবহার করে, সঠিক?

আমার প্রশ্নটি হ'ল: পিয়ারসন পারস্পরিক সম্পর্কের ক্ষেত্রে যদি ইনপুট ভেরিয়েবলগুলি সাধারণত বিতরণ করা দরকার হয় তবে ইনপুট ভেরিয়েবলগুলি র‌্যাঙ্ক থাকা সত্ত্বেও স্পিয়ারম্যান পারস্পরিক সম্পর্কের গণনা কেন বৈধ? আমার স্থান অবশ্যই সাধারণ বিতরণ থেকে আসে না ...

আমি এতক্ষণে কেবলমাত্র যে ব্যাখ্যা নিয়ে এসেছি তা হ'ল পিএরসন পারস্পরিক সম্পর্ক টি-টেস্টের (এইভাবে যে স্বাভাবিকতার প্রয়োজন হয় না) এর চেয়ে rh এর তাত্পর্যটি আলাদাভাবে পরীক্ষা করা যেতে পারে তবে আমি এখনও পর্যন্ত কোনও সূত্র পাইনি। যাইহোক, আমি যখন কয়েকটি উদাহরণ দৌড়েছি, তখন পিএ-মানগুলি আরএইচওর জন্য এবং পিয়ারসন পারফেকশন সম্পর্কিত টি-টেস্টের জন্য সর্বদা মেলে, শেষ কয়েক অঙ্কের জন্য সংরক্ষণ করুন। আমার কাছে এটি এক যুগোপযোগী ভিন্ন পদ্ধতির মতো লাগে না।

আপনার যে কোনও ব্যাখ্যা এবং ধারণাগুলি প্রশংসিত হতে পারে!

উত্তর:


7

পিয়ারসন পারস্পরিক সম্পর্ক গণনা করার জন্য সাধারনতার প্রয়োজন হয় না; এটি ঠিক যে সম্পর্কিত জনসংখ্যার পরিমাণ সম্পর্কিত কিছু ফর্ম সাধারণ অনুমানের উপর ভিত্তি করে (সিআই এবং অনুমান পরীক্ষা)।

আপনার যদি স্বাভাবিকতা না থাকে তবে সেই নির্দিষ্ট ফর্মের অন্তর্ভুক্ত বৈশিষ্ট্যগুলি ধারণ করবে না।

স্পিয়ারম্যান পারস্পরিক সম্পর্কের ক্ষেত্রে, আপনার স্বাভাবিকতা নেই, তবে এটি ঠিক আছে কারণ স্পিয়ারম্যান পারস্পরিক সম্পর্কের জন্য অনুমানের গণনাগুলি (যেমন হাইপোথিসিস টেস্ট) কোনও স্বাভাবিকতা অনুমানের ভিত্তিতে নয়।

এগুলি অবিচ্ছিন্ন দ্বিখণ্ডিত বিতরণ থেকে জোড় করা র‌্যাঙ্কের এক সেট হওয়ার ভিত্তিতে উদ্ভূত; এক্ষেত্রে হাইপোথিসিস টেস্টটি পরিসংখ্যানগুলির পরিসংখ্যান বিতরণকে র‌্যাঙ্কের উপর ভিত্তি করে ব্যবহার করে।

পিয়ারসন রিলেশনশিপ হোল্ডের (দ্বিচারিত স্বাভাবিকতা) সাথে অনুমানের জন্য সাধারণ অনুমানগুলি যখন স্পিয়ারম্যান পারস্পরিক সম্পর্ক সাধারণত খুব কাছাকাছি থাকে (যদিও গড়ে 0 এর কাছাকাছি কিছুটা কাছাকাছি থাকে)।

(সুতরাং আপনি যখন পিয়ারসন ব্যবহার করতে পারতেন তখন স্পিয়ারম্যান প্রায়শই বেশ ভালভাবে কাজ করে। যদি আপনার অন্য কিছু প্রক্রিয়া (যা বিদেশী হয়ে থাকে) এর সাথে কিছু দূষণের বাইরে প্রায় বিভাজনযুক্ত সাধারণ তথ্য থাকে, তবে স্পিয়ারম্যান পারস্পরিক সম্পর্কটি নির্ধারণ করার আরও শক্তিশালী উপায় হতে পারে অনিয়ন্ত্রিত বিতরণ।)


আপনাকে ধন্যবাদ, অনুমোদন বিতরণের রেফারেন্স সহায়ক!
জিএসটি 95

"স্পিয়ারম্যান পারস্পরিক সম্পর্কের অনুমান করার জন্য আরও শক্তিশালী উপায়" নিতপিকের কাছে, স্পিয়ারম্যান অ্যাসোসিয়েশন অনুমান করবে , লিনিয়ার পারস্পরিক সম্পর্ক নয়।
ল্যান্ড্রোনি

1
@ল্যান্ড্রোনি যদি আমি স্পিয়ারম্যান সম্পর্কে সাধারণত কথা বলি তবে আপনি স্পিয়ারম্যান কী করেন তা আপনি সঠিকভাবে চিহ্নিত করেছেন - তবে এই বাক্যে আমি স্পষ্টভাবে দূষণের অধীনে জনসংখ্যার পারস্পরিক সম্পর্কের দুটি অনুমানের তুলনা করার বিষয়ে কথা বলছি এবং আমি সেখানে যা বলি তা বেশ আক্ষরিকভাবে বোঝাতে চাইছি। পারস্পরিক সম্পর্ক with সহ একটি দ্বিবিভক্ত স্বাভাবিকের কল্পনা করুন এবং তারপরে একটি সত্যই চরম আউটলেট যোগ করুন। যদি আমি সেই পরিস্থিতিতে অনুমান করতে চাই , তবে পিয়ারসন পারস্পরিক সম্পর্কের চেয়ে এর আরও মজবুত অনুমানকারী । ρρρ
গ্লেন_বি -রিনস্টেট মনিকা

1
@ল্যান্ড্রোনি ... এমন পরিস্থিতি দেখা দিতে পারে যেখানে আপনার প্রধান প্রক্রিয়া থাকে যা সুন্দরভাবে আচরণ করা হয় এবং কিছু দূষিত প্রক্রিয়া থাকে যা খুব চরম হতে পারে তবে কেবল মাঝে মধ্যে ঘটে। যদি আপনি অনিয়ন্ত্রিত প্রক্রিয়াটির পারস্পরিক সম্পর্কের অনুমান করতে আগ্রহী হন, তবে পিয়ারসন পারস্পরিক সম্পর্কটি স্পিয়ারম্যানের চেয়ে অনেক বেশি পরিমাণে দূষণের জন্য খুব সংবেদনশীল।
গ্লেন_বি -রিনস্টেট মনিকা

2

যখন আমি কয়েকটি উদাহরণ দৌড়েছি, পিএইচ-র মানগুলি আরএইচ এবং পিয়ারসন রিলেশন এর পারস্পরিক সম্পর্কের টি-টেস্টের জন্য সর্বদা মেলে, শেষ কয়েকটি অঙ্কের জন্য সংরক্ষণ করুন

আচ্ছা আপনি তখন ভুল উদাহরণ চালাচ্ছেন!

a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')

    Pearson's product-moment correlation

data:  a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.08621009  0.90762506
sample estimates:
      cor 
0.6130088 

cor.test(a,b,method='spearman')

    Spearman's rank correlation rho

data:  a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho 
  1 

ভেক্টর aএবং bএকটি ভাল, তবে নিখুঁত রৈখিক (পিয়ারসন) পারস্পরিক সম্পর্ক থেকে দূরে। যাইহোক, তাদের নিখুঁত র‌্যাঙ্ক পারস্পরিক সম্পর্ক রয়েছে। দেখুন - এই ক্ষেত্রে, এটির শেষ সংখ্যাটি 8.1, 9, 90 বা 9000 (এটি চেষ্টা করুন!) এর চেয়ে গুরুত্বপূর্ণ নয়, এটি 8 এর চেয়ে বড় হলেই তা গুরুত্বপূর্ণ । এগুলি পারস্পরিক সম্পর্কযুক্ত র‌্যাঙ্কগুলি তৈরি করে। ρb

বিপরীতভাবে, aএবং bনিখুঁত র‌্যাঙ্ক পারস্পরিক সম্পর্ক থাকার সময়, তাদের পিয়ারসন পারস্পরিক সম্পর্ক সহগ 1 টির চেয়ে কম This
পিয়ারসন পারস্পরিক সম্পর্ক একটি লিনিয়ার ফাংশন প্রতিবিম্বিত করে, একটি র‌্যাঙ্ক পারস্পরিক সম্পর্ক কেবল একটি একঘেয়ে ফাংশন। সাধারণ ডেটার ক্ষেত্রে, দু'জন একে অপরের সাথে দৃ strongly়রূপে মিলিত হবে এবং আমি সন্দেহ করি এ কারণেই আপনার ডেটা স্পিয়ারম্যান এবং পিয়ারসনের মধ্যে বড় পার্থক্য দেখায় না।

ব্যবহারিক উদাহরণের জন্য, নিম্নলিখিতগুলি বিবেচনা করুন; আপনি দেখতে চান লম্বা লোকেরা বেশি ওজন করে কিনা। হ্যাঁ, এটি একটি নির্বোধ প্রশ্ন ... তবে কেবলমাত্র ধরে নিন যে এটি আপনার যত্নশীল। এখন, ভরগুলি ওজন দিয়ে একরকম স্কেল করে না, কারণ লম্বা লোকেরাও ছোট লোকের চেয়ে প্রশস্ত হয়; সুতরাং ওজন উচ্চতার লিনিয়ার ফাংশন নয় । আপনার তুলনায় 10% লম্বা এমন কেউ (গড়) 10% এর চেয়ে বেশি ভারী। এই কারণেই বডি / ভর সূচক ডোনামিনেটরে কিউব ব্যবহার করে।
ফলস্বরূপ, আপনি উচ্চতা / ওজনের সম্পর্কের ভুলভাবে প্রতিফলিত করার জন্য একটি রৈখিক পারস্পরিক সম্পর্ক ধরে নিবেন। বিপরীতে, পদক্ষেপের সম্পর্ক এই ক্ষেত্রে পদার্থবিজ্ঞান এবং জীববিজ্ঞানের বিরক্তিকর আইনগুলির প্রতি সংবেদনশীল নয়; এটি উচ্চতায় বৃদ্ধি পাওয়ার সাথে সাথে লোকেরা যদি ভারীভাবে প্রসারিত হয় তবে এটি প্রতিফলিত হয় না, এটি কেবল প্রতিবিম্বিত হয় যদি লম্বা ব্যক্তিরা (এক স্কেলে র‌্যাঙ্কে উচ্চতর) ভারী হয় (অন্য স্কেলের র‌্যাঙ্কে উচ্চতর হয়)।

এর আরও সাধারণ উদাহরণ হতে পারে লিকার্টের মতো প্রশ্নাবলীর র‌্যাঙ্কিংয়ের, যেমন লোকেদেরকে "নিখুঁত / ভাল / শালীন / মধ্যম / খারাপ / ভয়ঙ্কর" হিসাবে কিছু রেটিং দেওয়া হয়। "নিখুঁত" "ভদ্র" থেকে অনেক দূরে যেমন "শালীন" স্কেলের "খারাপ" থেকে , তবে আমরা কি সত্যিই বলতে পারি যে দুজনের মধ্যকার দূরত্ব একই? একটি লিনিয়ার পারস্পরিক সম্পর্ক অবশ্যই উপযুক্ত নয় is র‌্যাঙ্ক পারস্পরিক সম্পর্ক আরও প্রাকৃতিক।

আরো সরাসরি আপনার প্রশ্নের সুরাহা করার জন্য: না, পি পিয়ারসন ও Spearman সম্পর্কযুক্তরূপে মান ভিন্নভাবে গণনা করা আবশ্যক । দুটি সম্পর্কে ধারণাগত পাশাপাশি সংখ্যার তুলনায় অনেকগুলি পৃথক, তবে যদি পরীক্ষার পরিসংখ্যান সমান হয়, তবে পি মানটি সমান হবে।

পিয়ারসন সংগতি স্বাভাবিকতার মধ্যে অনুমান প্রশ্নে এ দেখতে পান এই
আরো সাধারণভাবে, অন্য লোকেদের অনেক আমি স্থিতিমাপ বনাম অ স্থিতিমাপ সম্পর্কযুক্তরূপে বিষয় সংক্রান্ত পারা চেয়ে ভাল বিস্তারিত আছে (এছাড়াও দেখুন এখানে ), এবং কি এই distributional অনুমানের সংক্রান্ত উপায়।


ধন্যবাদ! পরের বার আমি উদাহরণগুলির সাথে আরও পরীক্ষা নিরীক্ষা করব। :)
জিএসটি 95

1
না, অপেক্ষা করুন, আসলে এটি আমার প্রশ্ন ছিল না। আমি পদ্ধতি = "পিয়ারসন" কে x এবং y এর পদ্ধতি = "স্পিয়ারম্যান" সংস্করণের সাথে তুলনা করিনি। আমি তুলনা cor.test(x, y, method = "spearman")সঙ্গে cor.test(rank(x), rank(y), method = "pearson")। কোনটি ডেটা চয়ন করে তা বিবেচনা করেই এই অনুমানগুলি অভিন্ন হবে। তবুও আপনাকে ধন্যবাদ! :)
জিএসটি 95

@ জিএসটি 95, স্পিয়ারম্যানের পারস্পরিক সম্পর্ক হ'ল র‌্যাঙ্ক-ট্রান্সফর্মড ডেটাতে পার্সনের পারস্পরিক সম্পর্ক। আপনার দুটি "পদ্ধতি" সত্যই একই পদ্ধতি।
ডেনিস

@ ডেনিস, ঠিক আছে, আমি (অভিন্ন) আরএও সহগের সাথে তুলনা করছিলাম না তবে পি-ভ্যালুগুলি দেখার জন্য যে তারা উভয়ই টি-পরীক্ষা দিয়ে প্রাপ্ত হয়েছিল কিনা।
জিএসটি 95
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.