পারস্পরিক সম্পর্ক এবং সমবায়তার মধ্যে পার্থক্যটি কীভাবে ব্যাখ্যা করবেন?


109

এই প্রশ্নটি অনুসরণ করে, আপনি কেবল যার অর্থ বোঝেন এমন ব্যক্তির সাথে আপনি কীভাবে অসঙ্গতিটি ব্যাখ্যা করবেন? , যা কোনও সাধারণ ব্যক্তির সাথে সমবায় ব্যাখ্যা করার বিষয়টি সম্বোধন করে, তা আমার মনে একই রকম প্রশ্ন উত্থাপন করেছে।

কেউ কীভাবে কোনও পরিসংখ্যানকে বোঝাবেন যেহেতু সমবায় এবং পারস্পরিক সম্পর্কের মধ্যে পার্থক্য রয়েছে ? দেখে মনে হচ্ছে যে উভয়ই একটি পরিবর্তনশীলকে অন্য ভেরিয়েবলের সাথে সংযুক্ত করে পরিবর্তিত করে।

রেফার-টু প্রশ্নের অনুরূপ, সূত্রের অভাব বাঞ্ছনীয়।

উত্তর:


109

সমবায়ুদের সাথে সমস্যাটি এগুলি তুলনা করা শক্ত: আপনি যখন উচ্চতা এবং ওজনের একটি সেটকে যথাক্রমে (যথাক্রমে) মিটার এবং কিলোগুলিতে প্রকাশিত হিসাবে গণনা করেন, আপনি অন্যান্য ইউনিটগুলিতে এটি করার সময় থেকে একটি আলাদা সমবায় পেতে পারেন ( যা ইতিমধ্যে মেট্রিক সিস্টেমের সাথে বা না ছাড়াই একই কাজ করার জন্য লোকেদের একটি সমস্যা দেয়!) তবে এটিও বলা শক্ত হবে যে (যেমন) উচ্চতা এবং ওজন 'কোভারি বেশি' এর চেয়ে আপনার পায়ের আঙ্গুলের দৈর্ঘ্য এবং বলার অপেক্ষা রাখে না? , কেবলমাত্র কারণ হিসাবে 'স্কেল' কোভেরিয়েন্স গণনা করা হয় ভিন্ন।

এর সমাধান বিষয়টিকে normalক্যবদ্ধকরণকে 'সাধারণকরণ': আপনি কোভেরিয়েন্সকে এমন কিছু দ্বারা বিভক্ত করেন যা উভয় সমবায়ুগুলির মধ্যে বৈচিত্র্য এবং স্কেলকে উপস্থাপন করে এবং এমন মান দিয়ে শেষ করেন যা -1 এবং 1 এর মধ্যে আশ্বাস দেওয়া হয়: পারস্পরিক সম্পর্ক। আপনার আসল ভেরিয়েবলগুলি যে ইউনিটে ছিল, আপনি সর্বদা একই ফল পাবেন এবং এটিও নিশ্চিত করবে যে আপনি একটি নির্দিষ্ট ডিগ্রিতে দুটি ভেরিয়েবলের সাথে তুলনামূলকভাবে দু'জনের চেয়ে 'তুলনামূলক' কিনা তা তুলনা করতে পারেন।

দ্রষ্টব্য: উপরোক্ত অনুমান যে পাঠক ইতিমধ্যে সমবায় ধারণাটি বুঝতে পেরেছেন।


2
+1 আপনার কি শেষ বাক্যে "সমবায়" পরিবর্তে "পারস্পরিক সম্পর্ক" লেখার অর্থ ছিল?
whuber

আপনি কি নিশ্চিত যে আপনি বিভিন্ন ইউনিটের সাথে সমবায় তুলনা করতে পারবেন না? ইউনিটগুলি বহুগুণে পেরিয়ে যায় - যদি আপনার এক্স থাকে cmএবং আপনার Y থাকে sতবে আপনার । এবং তারপরে আপনি কেবল ইউনিট রূপান্তর ফ্যাক্টর দ্বারা ফলাফল দ্বারা গুণ করতে পারেন। আর এ চেষ্টা করুন:cov(X,Y)=z cmscov(cars$speed,cars$dist) == cov(cars$speed/5,cars$dist/7)*(7*5)
nnot101

3
@ naught101 আমি বিন্দুটি সন্দেহ করি এটি হ'ল, যদি আমি আপনাকে এবং অন্য কিছু না বলে থাকি তবে এক্স এর ওয়াই সম্পর্কে অত্যন্ত ভবিষ্যদ্বাণীপূর্ণ কিনা তা আপনার কোনও ধারণা নেই , অন্যদিকে আমি যদি আপনাকে বলেছিলাম যে আপনি কর ( এক্স , ওয়াই ) = .9 আপনার কাছে আরও কিছুটা ব্যাখ্যাযোগ্য। Cov(X,Y)=1010XYCor(X,Y)=.9
লোক

@ গুই: এটি ইউনিট ব্যতীত সমবায় হতে পারে : পিআই মনে করেন যে গুরুত্বপূর্ণ বিষয়টি হ'ল আপনি সহজেই দুটি ডেটা সেট থেকে ভিন্ন ভিন্ন রূপগুলির সহকারীদের তুলনা করতে পারবেন না have উদাহরণস্বরূপ, আপনার যদি B = 2 * A, এবং দুটি ডেটাসেট, {A1, B1} এবং {A2, B2 the সম্পর্ক থাকে তবে A1 এর 0.5 এর বৈকল্পিক রয়েছে এবং A2 এর 2 এর ভেরিয়েন্স রয়েছে, তবে সি ভি ( 1 , বি 1 ) এর তুলনায় অনেক বড় হবে , যদিও সম্পর্কটি একই রকম। cov(A2,B2)cov(A1,B1)
nnot101

3
সুতরাং সরল পদে কোরেলিশন> covariance
কার্ল মরিসন

58

এই ধরণের প্রশ্নের প্রয়োজনীয়তা আমাকে কিছুটা উদ্ভট বলে মনে করে। এখানে একটি গাণিতিক ধারণা / সূত্র রয়েছে, তবুও আমি গাণিতিক চিহ্নগুলি সম্পূর্ণরূপে বিহীন কিছু প্রসঙ্গে এটি সম্পর্কে কথা বলতে চাই। আমি আরও মনে করি যে সূত্রগুলি বোঝার জন্য আসল বীজগণিতটি উচ্চারণের আগে বেশিরভাগ ব্যক্তিকে শেখানো উচিত (ম্যাট্রিক্স বীজগণিত সম্পর্কে কোনও বোঝার প্রয়োজন নেই, কেবল সরল বীজগণিতই যথেষ্ট হবে) বলে আমি মনে করি।

সুতরাং, প্রথমে সূত্রটিকে সম্পূর্ণ উপেক্ষা করার পরিবর্তে এবং কিছু যাদুকর এবং হিউরিস্টিক ধরণের উপমাগুলিতে এটির কথা বলার পরিবর্তে সূত্রটি দেখি এবং স্বতন্ত্র উপাদানগুলিকে ছোট পদক্ষেপগুলিতে ব্যাখ্যা করার চেষ্টা করি। সূত্রগুলির দিকে তাকানোর সময়, সমবায় এবং পারস্পরিক সম্পর্কের ক্ষেত্রে পার্থক্য স্পষ্ট হওয়া উচিত। যদিও আমার সন্দেহ হয় যে উপমা এবং হিউরিস্টিক্সের ভাষায় কথা বলা দু'টি তুলনামূলক সহজ ধারণা এবং বিভিন্ন পরিস্থিতিতে তাদের পার্থক্যকে অস্পষ্ট করে।

সুতরাং আসুন নমুনা কোভেরিয়েন্সের একটি সূত্র দিয়ে শুরু করা যাক (এগুলি আমি উইকিপিডিয়া থেকে সবেমাত্র গ্রহণ করেছি এবং গ্রহণ করেছি);

1n1i=1n(xix¯)(yiy¯)

সবাইকে দ্রুত গতিতে পেতে সূত্রে সমস্ত উপাদান এবং ক্রিয়াকলাপ স্পষ্টভাবে সংজ্ঞায়িত করা যাক।

  • এবং y আমি একই পর্যবেক্ষণের দুটি পৃথক বৈশিষ্ট্যের প্রতিটি পরিমাপxiyi
  • এবং ˉ y প্রতিটি বৈশিষ্ট্যের মাধ্যম (বা গড়)x¯y¯
  • জন্য , কেবল এটির বলতে পারি এর অর্থ আমরা চূড়ান্ত ফলাফলটিকেn-1দিয়ে ভাগ করব।1n1n1
  • কাছে বিদেশী প্রতীক হতে পারে, তাই সম্ভবত এই ক্রিয়াকলাপটি ব্যাখ্যা করা কার্যকর হবে useful এটি কেবলমাত্র আমি পৃথকসমস্তপর্যবেক্ষণেরযোগফলএবং n টি পর্যবেক্ষণের মোট সংখ্যার প্রতিনিধিত্ব করে।i=1nin

এই মুহুর্তে, আমি একটি সাধারণ উদাহরণ উপস্থাপন করতে পারি, যাতে কথা বলার জন্য উপাদানগুলি এবং ক্রিয়াকলাপগুলিতে একটি মুখ দেওয়া। সুতরাং উদাহরণস্বরূপ, কেবল একটি টেবিল তৈরি করা যাক, যেখানে প্রতিটি সারি পর্যবেক্ষণের সাথে মিলে যায় (এবং এবং y যথাযথভাবে লেবেলযুক্ত)। কেউ সম্ভবত এই উদাহরণগুলিকে আরও সুনির্দিষ্ট করে তুলবেন (যেমন ধরুন x বয়সের প্রতিনিধিত্ব করে এবং y ওজনকে উপস্থাপন করে) তবে আমাদের আলোচনার জন্য এটি বিবেচনা করা উচিত নয়।xyxy

x y
---
2 5
4 8
9 3
5 6
0 8

i=1n(xi)

  x
 --
  2
  4
  9
  5
+ 0
 --
 20

(xix¯)(yiy¯)x¯y¯(xix¯)x

x x_bar (x - x_bar)
2 4     -2
4 4      0
9 4      5
5 4      1
0 4     -4

y

y y_bar (y - y_bar)
5  6     -1
8  6      2
3  6     -3
6  6      0
8  6      2

(xix¯)(yiy¯)(xix¯)(yiy¯)

গুণ করার সময় কী ঘটে থাকে তা দ্রষ্টব্য, দুটি পর্যবেক্ষণ যদি উভয় গড়ের চেয়ে বড় দূরত্ব হয় তবে ফলত পর্যবেক্ষণটির আরও বড় ধনাত্মক মান থাকবে (উভয় পর্যবেক্ষণ যদি গড়ের নীচে একটি বৃহত দূরত্ব হয় তবে দুটি negativeণাত্মককে গুণ করলে ধনাত্মক সমান)) আরও মনে রাখবেন যে যদি একটি পর্যবেক্ষণ গড়ের চেয়ে বেশি হয় এবং অন্যটি গড়ের নীচে থাকে তবে ফলাফলটির মানটি বৃহত্তর (পরম পদে) হবে এবং নেতিবাচক হবে (ইতিবাচক সময় হিসাবে aণাত্মক একটি নেতিবাচক সংখ্যার সমান হবে)। পরিশেষে নোট করুন যে কোনও মান পর্যবেক্ষণের জন্য যখন মানটির খুব কাছাকাছি থাকে, দুটি মানকে গুণিত করার ফলে অল্প সংখ্যক হয়। আবার আমরা এই অপারেশনটি কেবল একটি টেবিলে উপস্থাপন করতে পারি।

(x - x_bar) (y - y_bar)  (x - x_bar)*(y - y_bar)
-2             -1                2
 0              2                0  
 5             -3              -15 
 1              0                0
-4              2               -8

n1

(x - x_bar)*(y - y_bar)
-----------------------
   2
   0
 -15
   0
+ -8
-----
 -21

-21/(5-1) = -5.25

এই মুহুর্তে আপনি 5 টি যেখান থেকে আসছে তা আরও শক্তিশালী করতে চাইতে পারেন, তবে এটি টেবিলে ফিরে উল্লেখ করা এবং পর্যবেক্ষণের সংখ্যা গণনা করার মতোই সহজ হওয়া উচিত (নমুনা এবং জনসংখ্যার মধ্যে পার্থক্যকে অন্য সময়ে ছেড়ে দেওয়া যাক)।

ρ

ρ=Cov(x,y)Var(x)Var(y)

Cov(x,x)=Var(x))। এবং আপনি কোভরিয়েন্সের সাথে প্রবর্তিত সমস্ত একই ধারণাগুলি প্রয়োগ হয় (উদাহরণস্বরূপ যদি কোনও সিরিজটির অর্থ থেকে অনেক দূরের কিছু মান থাকে তবে এর উচ্চতর বৈকল্পিকতা থাকবে)। সম্ভবত এখানে নোট করুন যে কোনও সিরিজের পাশাপাশি নেতিবাচক বৈকল্পিকতাও থাকতে পারে না (যা যৌক্তিকভাবে আগে উপস্থাপিত গণিত থেকে অনুসরণ করা উচিত)।

Var(x)Var(y)Var(x)Var(y)

আমি বুঝতে পারি কিছু পরিস্থিতিতে চিকিত্সার এই স্তরটি উপযুক্ত হবে না। সিনেটের নির্বাহী সংক্ষিপ্তসার প্রয়োজন । সেক্ষেত্রে, আপনি সহজেই অন্যান্য সাধারণ উদাহরণগুলিকে আবার উল্লেখ করতে পারেন যা লোকে অন্য উদাহরণগুলিতে ব্যবহার করে আসছে, তবে রোম কোনও দিনেই নির্মিত হয়নি। এবং সিনেটের কাছে যিনি কার্যনির্বাহী সংক্ষিপ্তসার চেয়েছেন, আপনার কাছে যদি খুব অল্প সময় থাকে তবে আপনার কেবল আমার কথাটি নেওয়া উচিত এবং উপমা এবং বুলেট-পয়েন্টগুলির আনুষ্ঠানিকতা দিয়ে দিন।


4
cov(X,Y)=E[(XE[X])(YE[Y])]
শি'য়ান

14
+1, এটি বেশ ভাল। আমি তবে ধারণাগত সূচনার জন্য এত সমালোচনা করব না। আমি ডাব্লু / লোক ডাব্লু / পর্যাপ্ত গণিত উদ্বেগ নিয়ে কাজ করেছি যে কোনও সূত্র দেখানো তাদের হারাতে পারে। আমি সাধারণত তাদের ডাব্লু / ইনটিউশনটি 1 ম গতিতে পৌঁছে দেই এবং তারপরে গণিতের মধ্য দিয়ে সহজ এবং পুঙ্খানুপুঙ্খভাবে চলি (যতটা আপনি এখানে করেন) পরে । এইভাবে, তারা কেবল শিখছে যে কীভাবে গণিত তারা ইতিমধ্যে জানে তার প্রতিনিধিত্ব করে, এবং যদি তারা মানসিকভাবে বাদ দেয় তবে তারা এখনও বড় ধারণাগুলি শিখেছে। স্পর্শকাতর পয়েন্ট হিসাবে, আমি এক্সেলে গণিত সত্ত্বেও কাজ করি, যা এর জন্য আমি খুব ভাল পাই।
গাং

2
NN1(xix¯)(yiy¯)ρr , নয়, নয়, দেখুনএখানে , যেমন।
গাং

ধন্যবাদ @ গুং, আমি প্রথম সূত্রে টাইপো পরিবর্তন করেছি এবং তারপরে পারস্পরিক সম্পর্কের জন্য আমি বহুগুণিত রূপগুলির বর্গমূল গ্রহণ করেছি (মানক বিচ্যুতি সংজ্ঞায়নের পরিবর্তে)। আরহো বনাম অন্য প্রতীক ব্যবহার করার সময়, আমি উভয় দিক দিয়ে খুব বেশি দৃ strongly়তা অনুভব করি না। যদি আমি পড়াতাম এবং একটি পাঠ্য বই থাকি, আমি সম্ভবত পাঠ্যের সাথে সামঞ্জস্য করতে চাই। আশা করি আরও একটি গ্রীক প্রতীক বিশৃঙ্খলা সৃষ্টি করে না!
অ্যান্ডি ডাব্লু

1
আমি যদি আপনার উত্তরটি 100 বার উচ্চ করে দিতে পারি। কী ভয়াবহভাবে সুস্পষ্ট ব্যাখ্যা!
জুলিয়ান এ 18

10

Var[x]Var[y]

এটি হ'ল পারস্পরিক সম্পর্ক কেবলমাত্র কোভারিয়েন্সের প্রতিনিধিত্ব তাই ফলাফলটি অবশ্যই -1 (পুরোপুরি বিপরীতভাবে সম্পর্কিত) একটি +1 (পুরোপুরি ইতিবাচকভাবে সম্পর্কযুক্ত) হওয়া আবশ্যক, উল্লেখ করে যে শূন্যের কাছাকাছি একটি মান এর অর্থ দুটি ভেরিয়েবল অসংরক্ষিত।

অন্যান্য সমবায়িকদের সাথে তুলনা করার সময় কোভারিয়েন্স সীমাহীন এবং কোনও প্রসঙ্গের অভাব রয়েছে। সহযোজনকে পারস্পরিক সম্পর্কের ক্ষেত্রে সাধারণকরণ / সমন্বয় / মানককরণের মাধ্যমে ডেটা সেটগুলি আরও সহজেই তুলনা করা যায়।

আপনি কল্পনা করতে পারেন, একটি পরিসংখ্যান (যেমন covariance হিসাবে) সাধারণীকরণ / মানক হতে পারে বিভিন্ন উপায় আছে। পারস্পরিক সম্পর্ক এবং কোভেরিয়েন্সের মধ্যে সম্পর্কের গাণিতিক সূত্রটি কেবল কনভেনশন পরিসংখ্যানবিদদের ব্যবহারকে প্রতিফলিত করে (যথা, তাদের আদর্শ বিচ্যুতির সাথে সামঞ্জস্য করে):

r=cov(x,y)Var[x]Var[y]

5

আপনি যদি কেন্দ্রীকরণ এবং মানককরণের ধারণাটির সাথে পরিচিত হন তবে এক্স-এক্সবারটি হ'ল তার কেন্দ্রস্থলকে কেন্দ্র করে। একই ক্ষেত্রে y। সুতরাং covariance সহজভাবে তথ্য কেন্দ্র করে। আপেক্ষিকতা, কেবলমাত্র ডেটা কেন্দ্র করে না কিন্তু স্ট্যান্ডার্ড বিচ্যুতি (মানক) ব্যবহার করে স্কেল করে। গুণ এবং সংক্ষেপণটি দুটি ভেক্টরের বিন্দু-উত্পাদন এবং এটি বলে যে এই দুটি ভেক্টর একে অপরের সাথে তুলনা করে কতটা সমান্তরাল (অন্যটিতে একটি ভেক্টরের অভিক্ষেপ)। (এন -১) এর বিভাজন বা প্রত্যাশিত মান গ্রহণ পর্যবেক্ষণের সংখ্যার জন্য স্কেল করা। থটস?


3

আমি যতদূর বুঝতে পেরেছি। সম্পর্ক সম্পর্কিত বিষয়বস্তুর একটি "নর্মালাইজড" সংস্করণ।


2
অনেকগুলি পোস্ট প্রমাণিত হিসাবে , "নরমালাইজড" এর বিভিন্ন অর্থ রয়েছে। আপনি কোনটি ব্যবহার করছেন?
শুক্র

-3

ইতিবাচক বা নেতিবাচক পারস্পরিক সম্পর্ক আছে কিনা তার উপর নির্ভর করে সম্পর্ককে -1 এবং +1 এর মধ্যে আকার দেওয়া হয়, এবং মাত্রাবিহীন। কোভরিয়েন্স তবে শূন্য থেকে শুরু করে দুটি স্বতন্ত্র ভেরিয়েবলের ক্ষেত্রে ভার (এক্স) পর্যন্ত, যেখানে ডাটা দুটি সেট সমান হয়। সিওভি (এক্স, ওয়াই) এর এককগুলি Y এর এককের X গুনের একক are


6
সমবায়টি নেতিবাচক হতে পারে, সুতরাং এটি 0 তে আবদ্ধ হয় না এটিও আপনার কাছে পরিষ্কার নয় যে আপনি আপনার শেষ বাক্যটি কী বোঝাতে চেয়েছেন The units of COV(X,Y) are the units of X times the units of Y., বিস্তৃতভাবে যত্ন নেবেন?
অ্যান্ডি ডব্লু

Cov(X,Y)=E[(XE[X])(YE[Y])]

1
@ naught101, ইউনিটগুলি দিয়ে যায়? নাগরাজের প্রতি আমার প্রাথমিক মন্তব্যটি আরও স্পষ্টতা জানাতে হয়েছিল, যেহেতু আমি যে বক্তব্য দাবী করব তার মতো অস্পষ্ট বিবৃতি কারও পক্ষে সহায়ক নয়। সুতরাং, কেন আমরা সমবায়তাকে "y এর একক দ্বারা গুণিত x এর একক" হিসাবে ব্যাখ্যা করতে পারি না, কারণ এটি তা নয়। একটি সম্ভাব্য আরও সঠিক বিবৃতি (নমুনা covariance জন্য) হতে পারে এটি " গড় বিচ্যুতির পণ্য গড় "। নিয়ম ...
অ্যান্ডি ডব্লিউ

1
এখন, গড় বিচ্যুতি অবশ্যই মূল ইউনিটগুলির মতো নয়, এবং সমবায়িকতার জন্য পরিসংখ্যান পরিসংখ্যানগুলি কেবল মূল বৈশিষ্ট্যের গড় এবং তারতম্যের উপর নির্ভর করে না। সমবায়ু, এবং নিজে থেকেই, আপনাকে মূল বৈশিষ্ট্যের ভিন্নতা না জেনে কিছুই বলে না।
অ্যান্ডি ডব্লিউ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.