পিয়ারসন বা স্পিয়ারম্যানের অ-সাধারণ ডেটার সাথে সম্পর্ক


113

আমি আমার পরিসংখ্যান সংক্রান্ত পরামর্শে এই প্রশ্নটি প্রায়শই যথেষ্ট পাই, আমি ভেবেছিলাম যে আমি এটি এখানে পোস্ট করব। আমার একটি উত্তর আছে, যা নীচে পোস্ট করা হয়েছে, তবে অন্যেরা কী বলবে তা শুনতে আমি আগ্রহী ছিলাম।

প্রশ্ন: আপনার যদি দুটি ভেরিয়েবল থাকে যা সাধারণত বিতরণ করা হয় না, তবে আপনার কি পারস্পরিক সম্পর্কের জন্য স্পিয়ারম্যানের rho ব্যবহার করা উচিত?


1
কেন উভয়ই গণনা এবং রিপোর্ট করবেন না (পিয়ারসনের আর এবং স্পিয়ারম্যানের ρ)? তাদের পার্থক্য (বা এর অভাব) অতিরিক্ত তথ্য সরবরাহ করবে।

একটি বিতর্কিত অনুমানের সাথে তুলনা করা প্রশ্ন যখন আমরা তাৎপর্যের জন্য একটি সহজ রিগ্রেশন সহগ বিটা পরীক্ষা করি এবং যখন আমরা পিয়ারসন সহসংযোগ সহগ (বিটার সাথে সংখ্যাসূচকভাবে) পরীক্ষা করি তখন stats.stackexchange.com/q/181043/3277
ttnphns

উত্তর:


77

পিয়ারসনের পারস্পরিক সম্পর্ক দুটি ক্রমাগত র্যান্ডম ভেরিয়েবলের মধ্যে রৈখিক সম্পর্কের একটি পরিমাপ। এটি সুনির্দিষ্ট রূপ এবং সসীম কোভেরিয়েন্স ধরে নিলেও এটি স্বাভাবিকতা গ্রহণ করে না। যখন ভেরিয়েবলগুলি বিভাজনযুক্ত স্বাভাবিক হয়, পিয়ারসনের পারস্পরিক সম্পর্কটি সমিতির সম্পূর্ণ বিবরণ সরবরাহ করে।

স্পিয়ারম্যানের পারস্পরিক সম্পর্ক র‌্যাঙ্কগুলিতে প্রযোজ্য এবং তাই দুটি ক্রমাগত এলোমেলো ভেরিয়েবলের মধ্যে একঘেয়ে সম্পর্কের একটি পরিমাপ সরবরাহ করে। এটি অর্ডিনাল ডেটাগুলির সাথেও কার্যকর এবং বহিরাগতদের কাছে শক্তিশালী (পিয়ারসনের পারস্পরিক সম্পর্কের বিপরীতে)।

উভয়ই পারস্পরিক সম্পর্ক সহগের বিতরণ অন্তর্নিহিত বিতরণের উপর নির্ভর করবে, যদিও উভয়ই কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের কারণে অ্যাসিপোটোটিকভাবে স্বাভাবিক।


12
পিয়ারসনের স্বাভাবিকতা গ্রহণ করে না, তবে যৌথ বন্টন মাল্টিভারিয়েট স্বাভাবিক হলে কেবল সংস্থার একটি বিস্তৃত পরিমাপ। এই বিভেদটি দেখা দেয় এমন বিভ্রান্তির পরে, আপনি এটি নিজের উত্তরে যুক্ত করতে চাইতে পারেন। ρ
ব্যবহারকারী 60

3
উপরোক্ত বিবৃতিটি সমর্থন করার জন্য এমন কোনও উত্স আছে যা উদ্ধৃত করা যেতে পারে (ব্যক্তির আর স্বাভাবিকতা ধরে নেয় না)? এই মুহূর্তে আমরা আমাদের বিভাগে একই যুক্তি করছি।

5
"যখন ভেরিয়েবলগুলি বিভাজনযুক্ত স্বাভাবিক হয়, পিয়ারসনের পারস্পরিক সম্পর্কটি সমিতির সম্পূর্ণ বিবরণ সরবরাহ করে।" এবং যখন ভেরিয়েবলগুলি বিভাজনযুক্ত হয় না, পিয়ারসনের পারস্পরিক সম্পর্ক কতটা কার্যকর?
ল্যান্ড্রোনি

2
এই উত্তরটি বরং অপ্রত্যক্ষ বলে মনে হচ্ছে। "যখন ভেরিয়েবলগুলি বিভাজনযুক্ত স্বাভাবিক হয় ..." এবং কখন নয়? এই ধরণের ব্যাখ্যা কেন আমি কখনও পরিসংখ্যান পাই না। "রব, আপনি আমার নতুন পোশাকটি পছন্দ করেন?" "গা dark় রঙ আপনার হালকা ত্বকে জোর দেয়।" "অবশ্যই, রব, তবে আপনি কী পছন্দ করেন এটি কীভাবে আমার ত্বকে জোর দেয়?" "হালকা ত্বককে অনেক সংস্কৃতিতে সুন্দর বলে মনে করা হয়।" "আমি জানি, রব, কিন্তু আপনি কি এটি পছন্দ করেন?" "আমি মনে করি পোষাকটি সুন্দর।" "আমারও তাই মনে হয় রব, তবে এটা কি আমার কাছে সুন্দর ?" "তুমি আমাকে সবসময় সুন্দর দেখায়, মধু।" দীর্ঘশ্বাস

1
আপনি যদি এর আগে দুটি বাক্যটি পড়েন তবে উত্তরটি খুঁজে পাবেন।
রব হ্যান্ডম্যান

49

কেনডালের তাউ ভুলে যাবেন না ! রজার Newson কেন্ডাল এর শ্রেষ্ঠত্ব জন্য যুক্তি দিয়েছেন τ একটি Spearman এর পারস্পরিক সম্পর্ক ধরে এস একটি কাগজ যার সম্পূর্ণ টেক্সট এখন সহজলভ্য অনলাইন হয় পারস্পরিক সম্পর্কের একটি র্যাঙ্ক ভিত্তিক পরিমাপ হিসাবে:

নিউজন আর। "ননপ্যারমেট্রিক" পরিসংখ্যানের পিছনে প্যারামিটারগুলি: কেন্ডালের টাউ, সামার্স ডি এবং মিডিয়েন পার্থক্যস্টাটা জার্নাল 2002; 2 (1): 45-64।

তিনি (p47 দিকে) রেফারেন্স কেন্ডাল অ্যান্ড গিব্বনস (1990) তর্ক যে হিসাবে "... Spearman এর জন্য আস্থা অন্তর এস কম নির্ভরযোগ্য এবং Kendall এর জন্য আস্থা অন্তর কম interpretable হয় τ -parameters কিন্তু নমুনা Spearman এর এস আরো অনেক কিছু সহজে হয় একটি কম্পিউটার ছাড়াই গণনা করা হয়েছে "(যা অবশ্যই আর বেশি গুরুত্ব দেয় না)। দুর্ভাগ্যক্রমে তাদের বইয়ের অনুলিপিটিতে আমার সহজে অ্যাক্সেস নেই:

কেন্ডল, এমজি এবং জেডি গিবনস। 1990. রেঙ্ক সহকারী পদ্ধতি । 5 তম সংস্করণ। লন্ডন: গ্রিফিন।


2
আমিও কেন্ডালের টাউয়ের খুব বড় ভক্ত। পিয়ারসন আমার স্বাদের জন্য প্রভাবশালী পয়েন্ট / আউটলিয়ারদের কাছে অনেক সংবেদনশীল এবং স্পিয়ারম্যান এই সমস্যায় ভুগছেন না, তবে ব্যক্তিগতভাবে আমি স্পেন্ডম্যানের চেয়ে কেন্ডালকে বোঝা, ব্যাখ্যা করা ও ব্যাখ্যা করা সহজ মনে করি। অবশ্যই, আপনার মাইলেজ পরিবর্তিত হতে পারে।
স্টিফান কোলাসা

অভিজ্ঞতা থেকে আমার স্মৃতিচারণা হ'ল স্পেনম্যানের তুলনায় কেন্ডালের টাউ এখনও অনেক ধীর গতিতে চলছে (আরে)। আপনার ডেটাসেট বড় হলে এটি গুরুত্বপূর্ণ হতে পারে।
শব্দসুখে

35

প্রয়োগিত দৃষ্টিকোণ থেকে, আমি এমন একটি দৃষ্টিভঙ্গি বেছে নেওয়ার সাথে আরও উদ্বিগ্ন যা আমার গবেষণার প্রশ্নের সাথে একত্রিত হয়ে এমন দুটি ভেরিয়েবলের মধ্যকার সম্পর্কের সংক্ষিপ্তসার করে। আমি মনে করি যে সঠিক স্ট্যান্ডার্ড ত্রুটি এবং পি-মানগুলি পাওয়ার জন্য কোনও পদ্ধতি নির্ধারণ করা এমন একটি প্রশ্ন যা দ্বিতীয় হওয়া উচিত। এমনকি যদি আপনি অ্যাসিম্পটোটিকের উপর নির্ভর না করা বেছে নিয়ে থাকেন তবে সর্বদা বুটস্ট্র্যাপ বা বিতরণীয় অনুমানগুলি পরিবর্তন করার বিকল্প রয়েছে।

একটি সাধারণ নিয়ম হিসাবে, আমি পিয়ারসনের পারস্পরিক সম্পর্ককে প্রাধান্য দিই কারণ (ক) এটি সাধারণত আমার তাত্ত্বিক স্বার্থের সাথে আরও প্রান্তিক হয়; (খ) এটি অধ্যয়ন জুড়ে প্রাপ্ত ফলাফলগুলির আরও সরাসরি তুলনা সক্ষম করে, কারণ আমার অঞ্চলের বেশিরভাগ গবেষণায় পিয়ারসনের পারস্পরিক সম্পর্ক সম্পর্কিত রিপোর্ট করা হয়েছে; এবং (সি) অনেক সেটিংসে পিয়ারসন এবং স্পিয়ারম্যান পারস্পরিক সম্পর্ক সহগগুলির মধ্যে ন্যূনতম পার্থক্য রয়েছে।

তবে এমন পরিস্থিতি রয়েছে যেখানে আমি মনে করি কাঁচা ভেরিয়েবলের সাথে পিয়ারসনের পারস্পরিক সম্পর্ক বিভ্রান্তিকর।

  • আউটলিয়ার্স: পিয়ারসনের পারস্পরিক সম্পর্কের ক্ষেত্রে আউটলিয়াররা দুর্দান্ত প্রভাব ফেলতে পারে। প্রয়োগ করা সেটিংসে প্রচুর অপ্রত্যাশিতরা পরিমাপ ব্যর্থতা বা এমন অন্যান্য বিষয়গুলি প্রতিফলিত করে যা মডেলটির সাধারণকরণের উদ্দেশ্যে নয়। একটি বিকল্প হ'ল এই ধরণের বিদেশীদের অপসারণ করা। স্পিয়ারম্যান এর rh সঙ্গে অবিচ্ছিন্ন আউটলিয়ারদের অস্তিত্ব নেই কারণ সবকিছুকে র‌্যাঙ্কে রূপান্তর করা হয়েছে। সুতরাং, স্পিয়ারম্যান আরও শক্তিশালী।
  • উচ্চ স্কু ভেরিয়েবলগুলি: স্কিউ ভেরিয়েবলগুলি বিশেষত উচ্চ স্কু ভেরিয়েবলগুলি সংযুক্ত করার সময় একটি লগ বা অন্য কোনও রূপান্তর প্রায়শই দুটি ভেরিয়েবলের মধ্যে অন্তর্নিহিত সম্পর্ককে পরিষ্কার করে তোলে (উদাহরণস্বরূপ, প্রাণীর দেহের ওজনে মস্তিষ্কের আকার)। এই ধরনের সেটিংসে এটি হতে পারে যে কাঁচা মেট্রিক কোনওভাবেই অর্থবহ মেট্রিক নয়। উভয় ভেরিয়েবলকে র‌্যাঙ্কে রূপান্তরিত করে স্পিয়ারম্যানের rh র রূপান্তরকরণের জন্য একই রকম প্রভাব ফেলে। এই দৃষ্টিকোণ থেকে, স্পিয়ারম্যানের rho দ্রুত এবং নোংরা পদ্ধতির হিসাবে দেখা যেতে পারে (বা আরও ইতিবাচকভাবে, এটি কম সাবজেক্টিভ)) যার ফলে আপনাকে অনুকূল রূপান্তর সম্পর্কে ভাবতে হবে না।

উপরের উভয় ক্ষেত্রেই আমি গবেষকদের পরামর্শ দিচ্ছি যে হয় পিয়ারসনের পারস্পরিক সম্পর্ক প্রয়োগের আগে অ্যাডজাস্টমেন্ট কৌশলগুলি (যেমন, রূপান্তরকরণ, বহির্মুখী অপসারণ / সমন্বয়) বিবেচনা করতে বা স্পিয়ারম্যানের আরএইচও ব্যবহার করার পরামর্শ দিন।


রূপান্তরের সমস্যাটি হ'ল, সাধারণভাবে, এটি প্রতিটি পয়েন্টের সাথে যুক্ত ত্রুটিগুলি এবং এইভাবে ওজনকেও রূপান্তরিত করে। এবং এটি আউটলারের সমস্যা সমাধান করে না।
স্ক্যান

11

আপডেট করা হয়েছে

স্বাভাবিকতা নিয়ে প্রশ্ন করা হলে প্রশ্নটি পিয়ারসন এবং স্পিয়ারম্যানের পদ্ধতির মধ্যে নির্বাচন করতে বলছে asks এই উদ্বেগের মধ্যে সীমাবদ্ধ, আমি মনে করি যে নিম্নলিখিত কাগজটি কারও সিদ্ধান্তকে জানানো উচিত:

এটি বেশ সুন্দর এবং এই বিষয়টিতে কয়েক দশক ধরে বিস্তৃত যথেষ্ট সাহিত্যের সমীক্ষা সরবরাহ করে - পিয়ারসনের "বিকৃত এবং বিকৃত পৃষ্ঠসমূহ" থেকে শুরু করে এর বিতরণ করার দৃust়তা । "তথ্য" এর বিপরীতমুখী প্রকৃতির অন্তত অংশটি হ'ল এই কাজটির বেশিরভাগ অংশ কম্পিউটিং পাওয়ার আবিষ্কারের আগেই হয়েছিল - যা জটিল বিষয়গুলি কারণ অ-স্বাভাবিকতার ধরণটি বিবেচনা করতে হয়েছিল এবং সিমুলেশন ছাড়াই পরীক্ষা করা শক্ত ছিল।r

Kowalski এর বিশ্লেষণ বলে যে বিতরণের হয় না অ স্বাভাবিক উপস্থিতিতে শক্তসমর্থ এবং বিকল্প পদ্ধতি পরামর্শ দেওয়া হচ্ছে। পুরো কাগজটি বেশ তথ্যমূলক এবং প্রস্তাবিত পাঠযোগ্য, তবে সংক্ষিপ্তসারের জন্য কাগজের শেষে খুব সংক্ষিপ্ত উপসংহারে যান skr

যদি স্বাভাবিকতা লঙ্ঘিত হয় তবে স্পিয়ারম্যান এবং পিয়ারসনের মধ্যে একটির মধ্যে চয়ন করতে বলা হলে, বিতরণ মুক্ত বিকল্পের পক্ষে মূল্যবান অর্থাত্ স্পিয়ারম্যানের পদ্ধতির পক্ষে প্রয়োজন।


পূর্বে ..

স্পিয়ারম্যানের পারস্পরিক সম্পর্ক একটি র‌্যাঙ্ক ভিত্তিক সম্পর্ক সম্পর্কিত পরিমাপ; এটি প্যারাম্যাট্রিক নয় এবং এটি স্বাভাবিকতার অনুমানের উপর নির্ভর করে না।

পিয়ারসনের পারস্পরিক সম্পর্কের জন্য নমুনা বিতরণটি স্বাভাবিকতা ধরে নেয়; বিশেষত এর অর্থ হ'ল আপনি এটি গণনা করতে পারলেও তাৎপর্য পরীক্ষার উপর ভিত্তি করে সিদ্ধান্তগুলি যথাযথ হতে পারে না।

রব মন্তব্যগুলিতে যেমন উল্লেখ করেছেন, বড় নমুনা সহ এটি কোনও সমস্যা নয়। যদিও ছোট্ট নমুনাগুলি সহ, যেখানে স্বাভাবিকতা লঙ্ঘিত হয়, স্পিয়ারম্যানের পারস্পরিক সম্পর্ককে অগ্রাধিকার দেওয়া উচিত।

মন্তব্যগুলি এবং উত্তরগুলি সম্পর্কে হালনাগাদ করা আপডেটটি আমার কাছে মনে হচ্ছে এটি সাধারণ নন-প্যারাম্যাট্রিক বনাম প্যারাম্যাট্রিক পরীক্ষার বিতর্কে উত্সাহ দেয়। সাহিত্যের বেশিরভাগ অংশ যেমন বায়োস্ট্যাটাস্টিকস বড় আকারের নমুনাগুলি নিয়ে কাজ করে না। আমি সাধারণত অ্যাসিম্পটিকসের উপর নির্ভর করে অশ্বারোহী নই। সম্ভবত এটি এক্ষেত্রে ন্যায়সঙ্গত, তবে তা আমার কাছে সহজেই স্পষ্ট নয়।


1
না। পিয়ারসনের পারস্পরিক সম্পর্ক স্বাভাবিকতা ধরে নেয় না। এটি যে কোনও দুটি ধারাবাহিক এলোমেলো ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্কের একটি অনুমান এবং তুলনামূলকভাবে সাধারণ অবস্থার অধীনে একটি ধারাবাহিক অনুমানকারী। এমনকি পিয়ারসনের পারস্পরিক সম্পর্কের উপর ভিত্তি করে পরীক্ষাগুলি সিএলটি-র কারণে নমুনাগুলি যথেষ্ট বড় হলে স্বাভাবিকতার প্রয়োজন হয় না।
রব হ্যান্ডম্যান

2
আমি এই ধারণাটির আওতায় আছি যে যতক্ষণ অন্তর্নিহিত বিতরণগুলির সসীম বৈকল্পিক এবং সমবায়ু রয়েছে ততক্ষণ পিয়ারসন সংজ্ঞায়িত। সুতরাং, স্বাভাবিকতা প্রয়োজন হয় না । যদি অন্তর্নিহিত বিতরণগুলি সাধারণ না হয় তবে পরীক্ষার-পরিসংখ্যানগুলির আলাদা বিতরণ থাকতে পারে তবে এটি একটি গৌণ বিষয় এবং হাতে থাকা প্রশ্নের সাথে প্রাসঙ্গিক নয়। তা কি তাই না?

2
@ রব: হ্যাঁ, আমরা জিনিসগুলি প্রায় একইরকম করে তোলে তা কার্যকর করার জন্য আমরা সবসময় সামনে আসতে পারি। কেবল স্পিয়ারম্যানের পদ্ধতি এড়াতে - যা বেশিরভাগ অ-পরিসংখ্যানবিদরা একটি স্ট্যান্ডার্ড কমান্ড দিয়ে পরিচালনা করতে পারেন। আমার ধারণা অনুমান করা যায় যে স্পারম্যানের পদ্ধতিটি ছোট ছোট নমুনাগুলির জন্য ব্যবহার করা অবধি রয়েছে যেখানে স্বাভাবিকতা প্রশ্নবিদ্ধ। এটি এখানে বিতর্কিত কিনা তা নিশ্চিত নয়।
Ars

1
@ars। আমি লিনিয়ার অ্যাসোসিয়েশনের পরিবর্তে একঘেয়ে প্রতি আগ্রহী হলে বা যদি সেখানে বিদেশী বা উচ্চ মাত্রার স্নিগ্ধতা থাকত তবে আমি স্পিয়ারম্যানকে ব্যবহার করব। লিনিয়ার সম্পর্কের জন্য আমি পিয়ারসনকে ব্যবহার করব তবে শর্ত নেই যে এখানে কোনও বিদেশী নেই। আমি মনে করি না যে পছন্দটি করার ক্ষেত্রে নমুনার আকারটি প্রাসঙ্গিক।
রব হ্যান্ডম্যান

3
@ রব: ঠিক আছে, আলোচনার জন্য ধন্যবাদ। আমি প্রথম অংশের সাথে একমত হয়েছি, তবে শেষের দিকে সন্দেহ করি এবং এই আকারটি কেবলমাত্র ভূমিকা পালন করে কারণ সাধারণ অ্যাসিপটিকগুলি প্রয়োগ করে না। উদাহরণস্বরূপ, কোওলস্কি 1972 এর চারপাশে ইতিহাসের বেশ ভাল জরিপ রয়েছে, এবং এই সিদ্ধান্তে পৌঁছেছে যে পিয়ারসনের পারস্পরিক সম্পর্কটি চিন্তার মতো দৃ not় নয় is দেখুন: jstor.org/pss/2346598
Ars
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.