যখন কোনও ভেরিয়েবল শ্রেণিবদ্ধ হয় তখন কেন পারস্পরিক সম্পর্ক খুব কার্যকর হয় না?


14

এটি একটি অন্ত্র চেক এর সামান্য বিট, দয়া করে আমাকে এই ধারণাটি ভুল বোঝাবুঝি করছি কিনা এবং কোন উপায়ে তা আমাকে সহায়তা করুন।

পারস্পরিক সম্পর্কের সম্পর্কে আমার কার্যকরী বোধ আছে তবে কার্যকরী বোঝার পিছনে যে নীতিগুলি রয়েছে তা সত্যই আত্মবিশ্বাসের সাথে ব্যাখ্যা করার জন্য আমি কিছুটা আঁকড়ে ধরছি feeling

যেহেতু আমি এটি বুঝতে পারি, পরিসংখ্যানগত পারস্পরিক সম্পর্ক (শব্দটির আরও সাধারণ ব্যবহারের বিপরীতে) দুটি ক্রমাগত পরিবর্তনশীল বোঝার একটি উপায় এবং যেভাবে তারা একইভাবে উত্থিত বা পড়ার ঝোঁক রাখে না বা বোঝায় না।

আপনি যে কারণে পরস্পর সম্পর্কিত সম্পর্ক চালাতে পারবেন না, বলুন, একটি ধারাবাহিক এবং একটি স্বতন্ত্র ভেরিয়েবল কারণ এটি যে উভয়ের মধ্যে স্বীয়তা গণনা করা সম্ভব নয় , কারণ সংজ্ঞা অনুসারে শ্রেণিবদ্ধ পরিবর্তনশীল একটি গড় অর্জন করতে পারে না এবং এভাবে প্রথমটিতে প্রবেশ করতেও পারে না পরিসংখ্যান বিশ্লেষণের পদক্ষেপ।

এটা কি সঠিক?


2
এখানে আমি বেশিরভাগ জনসংখ্যার (নমুনা নয়) পারস্পরিক সম্পর্ক এবং সমবায়
টেলর

3
সাধারণ কারণ, কল্পনা করুন যে আপনি লোকদের জিজ্ঞাসা করেছেন "আপনার প্রিয় রঙটি কী?" এবং তারা উত্তর দেয় "লাল", "সবুজ", "নীল", "কমলা", "হলুদ", ..., আপনার ডেটাसेटে 1, 2, 3, হিসাবে কোডেড কি আছে ... পরবর্তী, আপনি এর মধ্যে পারস্পরিক সম্পর্ক সহকারীর গণনা করুন কাজের তৃপ্তির সাথে এই পরিবর্তনশীল এবং মান 0.21 পান। এর মানে কী? আপনি কোন অর্থবহ ব্যাখ্যা দিতে পারেন?
টিম

2
ঘনিষ্ঠভাবে সম্পর্কিত (সম্ভবত এমনকি একটি ডুপ্লিকেট?) - একটি নামমাত্র মধ্যে পারস্পরিক (চতুর্থ) এবং একটি একটানা (ডিভি) পরিবর্তনশীল
Silverfish

@ টেলর: যখন উভয় ভেরিয়েবল অবিচ্ছিন্ন / সংখ্যাগত হয় তবে তাদের মধ্যে একটি স্টোকাস্টিক এবং অন্যটি জিপিএ বনাম অধ্যয়নকৃত ঘন্টা হয় না তখন আমরা কী ব্যবহার করব?
এমএসআইএস

উত্তর:


16

কোরিলেশন প্রমিত সহভেদাংক, অর্থাত্ কোভ্যারিয়েন্স x এবং y স্ট্যান্ডার্ড ডেভিয়েশন দ্বারা বিভক্ত x এবং y । আমি এটি উদাহরণস্বরূপ।

স্বাচ্ছন্দ্যে বললে, পরিসংখ্যানগুলিকে উপাত্তগুলির জন্য উপযুক্ত মডেল হিসাবে সংক্ষিপ্ত করা যেতে পারে এবং মডেল সেই ডেটা পয়েন্টগুলিকে কত ভালভাবে বর্ণনা করে তা নির্ধারণ করে ( ফলাফল = মডেল + ত্রুটি )। এটি করার একটি উপায় হ'ল মডেল থেকে বিচ্যুতির পরিমাণ বা অবশিষ্টাংশ (পুনরায়) গণনা করা:

res=(xix¯)

অনেক পরিসংখ্যানের গণনাগুলি এর উপর ভিত্তি করে থাকে l পারস্পরিক সম্পর্ক সহগ (নীচে দেখুন)।

এখানে তৈরি করা ডেটাসেটের একটি উদাহরণ রয়েছে R(অবশিষ্টাংশগুলি লাল রেখা হিসাবে চিহ্নিত করা হয় এবং তাদের মানগুলি তাদের পাশে যুক্ত করা হয়):

X <- c(8,9,10,13,15)  
Y <- c(5,4,4,6,8)

এখানে চিত্র বর্ণনা লিখুন

প্রতিটি ডেটা পয়েন্ট পৃথকভাবে দেখে এবং মডেল থেকে এর মান বিয়োগ করে (উদাহরণস্বরূপ গড়; এই ক্ষেত্রে X=11এবং Y=5.4), কোনও কোনও মডেলের যথার্থতা নির্ধারণ করতে পারে। কেউ বলতে পারেন যে মডেলটি আসল মানকে বেশি / কম মূল্যায়ন করে। যাইহোক, মডেল থেকে সমস্ত বিচ্যুতি সংক্ষেপণের সময় , মোট ত্রুটি শূন্য হতে থাকে , মানগুলি একে অপরকে বাতিল করে দেয় কারণ ইতিবাচক মানগুলি (মডেলটি একটি নির্দিষ্ট ডেটার পয়েন্টকে অবমূল্যায়ন করে) এবং negativeণাত্মক মানগুলি (মডেল একটি নির্দিষ্ট ডেটাকে গুরুত্ব দিয়ে দেখায়) পয়েন্ট)। এই সমস্যার সমাধানের জন্য বিচ্যুতির পরিমাণগুলি স্কোয়ার করা হয় এবং এখন তাকে স্কোমের সমষ্টি ( SS ) বলা হয়:

SS=(xix¯)(xix¯)=(xix¯)2

n1s2 ) গড় এবং পর্যবেক্ষণগুলির মধ্যে "গড় ত্রুটি" হয়ে ওঠে এবং অতএব মডেলটি ডেটার সাথে কতটা ফিট করে (যেমন উপস্থাপন করে) তার একটি পরিমাপ:

s2=SSn1=(xix¯)(xix¯)n1=(xix¯)2n1

সুবিধার জন্য, নমুনার বৈকল্পিকের বর্গমূল নেওয়া যেতে পারে, যা নমুনা স্ট্যান্ডার্ড বিচ্যুতি হিসাবে পরিচিত:

s=s2=SSn1=(xix¯)2n1

এখন, কোভেরিয়েন্স দুটি ভেরিয়েবল একে অপরের সাথে সম্পর্কিত কিনা তা নির্ধারণ করে। একটি ধনাত্মক মান ইঙ্গিত দেয় যে একটি পরিবর্তনশীল গড় থেকে বিচ্যুত হয়, অন্য পরিবর্তনশীল একই দিকে বিচ্যুত হয়।

covx,y=(xix¯)(yiy¯)n1

r । এটি একে অপরের সাথে ভেরিয়েবলের তুলনা করতে দেয় যা বিভিন্ন ইউনিটে পরিমাপ করা হয়েছিল। পারস্পরিক সম্পর্ক সহগ -1 (একটি নিখুঁত নেতিবাচক সম্পর্ক) থেকে 0 (কোনও সম্পর্ক নেই) এবং +1 (একটি নিখুঁত ধনাত্মক সম্পর্ক) এর মধ্যকার সম্পর্কের শক্তির পরিমাপ।

r=covx,ysxsy=(x1x¯)(yiy¯)(n1)sxsy

r=0.87XY

এখানে চিত্র বর্ণনা লিখুন

এত দীর্ঘ গল্প সংক্ষিপ্ত, হ্যাঁ আপনার অনুভূতি ঠিক আছে তবে আমি আশা করি আমার উত্তরটি কিছু প্রসঙ্গ সরবরাহ করতে পারে।


1
এটি অত্যন্ত সহায়ক - নিজের বোঝাপড়া আরও গভীর করার প্রয়াসে, আমি পরিসংখ্যানের ব্যাকগ্রাউন্ড ব্যতীত কাউকে যদি পর্যাপ্ত পরিমাণে এটি ব্যাখ্যা করতে না পারি, তবে আমি এটি যেমন বুঝতে পারি ততই বুঝতে পারি না।
Toof

8

আপনি (প্রায়) ঠিক বলেছেন। কোভেরিয়েন্স (এবং তাই পারস্পরিক সম্পর্ক) শুধুমাত্র সংখ্যার ভেরিয়েবলের মধ্যেই গণনা করা যায়। এর মধ্যে অবিচ্ছিন্ন ভেরিয়েবলগুলি রয়েছে তবে পৃথক পৃথক ভেরিয়েবলও রয়েছে।

শ্রেণিবদ্ধ ভেরিয়েবলগুলি কেবল তাদের জন্য একটি দরকারী সংখ্যাসূচক কোড প্রদানে গণনা সম্পর্কিত ব্যবহার করা যেতে পারে, তবে এটি ব্যবহারিক সুবিধা পাওয়ার সম্ভাবনা নেই - সম্ভবত এটি দুটি স্তরের শ্রেণিবদ্ধ ভেরিয়েবলগুলির জন্য কার্যকর হতে পারে তবে অন্যান্য সরঞ্জামগুলি আরও উপযুক্ত হতে পারে।


পেরের পয়েন্টে যোগ করতে পিয়ারসন প্রোডাক্ট মুহুর্তের পারস্পরিক সম্পর্ক সহগ দুটি ভেরিয়েবলের মধ্যে লিনিয়ার সম্পর্কের ডিগ্রি উপস্থাপন করে। স্পিয়ারম্যানের rho বা কেন্ডালের তৌর মতো ননপ্যারমেট্রিক পদক্ষেপগুলি এক্স এবং ওয়াইয়ের একসাথে বৃদ্ধি বা হ্রাস করার জন্য কতটা প্রবণতা রয়েছে তা চিহ্নিত করে (একঘেয়ে সম্পর্কের মতো একটি ডিগ্রির সাথে আচরণ করুন যা লিনিয়ার হওয়ার প্রয়োজন হয় না
মাইকেল আর। চেরনিক

@ পিয়ার: যখন আমাদের দুটি ক্রমাগত পরিবর্তনশীল থাকে তবে আমরা কী ব্যবহার করব তবে তার মধ্যে একটি হ'ল স্টোকাস্টিক, যেমন, ঘন্টা বনাম ভার ওজনের?
এমএসআইএস

1
@ এমএমআইএস - এটি আলাদা প্রশ্ন হওয়া উচিত, তবে একটি ভেরিয়েবল এলোমেলো না হলেও পারস্পরিক সম্পর্ক ব্যবহার করা যেতে পারে।
পেরে

1
@ পেয়ার: আমি আপনাকে জিজ্ঞাসা করেছি, আপনি যদি আগ্রহী হন: stats.stackexchange.com/questions/435257/…
এমএসআইএস

3

কম্পিউটারের পারস্পরিক সম্পর্কগুলির সাথে একেবারেই কোনও ভুল নেই যেখানে ভেরিয়েবলগুলির মধ্যে একটি শ্রেণিবদ্ধ হয়। একটি দৃ positive় ইতিবাচক পারস্পরিক সম্পর্ক বলতে বোঝায় যে আপনার শ্রেণিবদ্ধ পরিবর্তনশীল (বা আপনার সম্মেলনের উপর নির্ভর করে) চালু করা প্রতিক্রিয়া বৃদ্ধির কারণ ঘটায়। উদাহরণস্বরূপ, লজিস্টিক রিগ্রেশন গণনা করার সময় এটি ঘটতে পারে যেখানে ভেরিয়েবলগুলি শ্রেণিবদ্ধ হয়: ডায়াবেটিস এবং বিএমআইয়ের মতো রোগীর কমরেবিডিতে হার্ট অ্যাটাকের সম্ভাবনা সম্পর্কে ভবিষ্যদ্বাণী করা। এই ক্ষেত্রে বিএমআইয়ের হার্ট অ্যাটাকের সাথে খুব দৃ corre় সম্পর্ক ছিল corre আপনি উপসংহারে আসতে পারেন যে দরকারী না?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.