অনুপাতের ডেটাতে পিয়ারসন পারস্পরিক সম্পর্ক করা কেন ঠিক হবে না?


10

আমি যে অনলাইন মডিউলটি অধ্যয়ন করছি তার মধ্যে বলা হয়েছে যে অনুপাতের ডেটা সহ পিয়ারসন পারস্পরিক সম্পর্ক কখনও ব্যবহার করা উচিত নয় । কেন না?

বা, যদি এটি কখনও কখনও ঠিক থাকে বা সর্বদা ঠিক থাকে তবে কেন?


3
এটি কী বলে এবং কোন প্রসঙ্গে? তারা কখনও খুব সীমিত পরিস্থিতির বিষয়ে কথা না বললে "কখনই" এটিকে খুব শক্তিশালী বলে মনে হয় না। এটি হতে পারে যে যারাই এটি লিখেছেন তা কেবল ভুল, তবে প্রসঙ্গ ছাড়াই আমরা কীভাবে অনুমান করব?
গ্লেন_বি -রিনস্টেট মনিকা

2
অনলাইন মডিউলটি মালিকানাধীন এবং আমি এটি লিঙ্ক করতে পারি না। তবে, আমি একটি ভিডিও পেয়েছি যা একই জিনিসটি জানিয়েছে: অস্ট্রেলিয়ানবায়োইনফরম্যাটিক্স . net/ the- piplines / 2013/3/19/… । আমি যে মডিউলটি দেখেছি এবং এই ভিডিওটি উভয়ই এমন ইঙ্গিত দেয় যে কোনও প্রসঙ্গ নেই যার সাথে সম্পর্কিত অনুপাত গ্রহণযোগ্য।
ব্যবহারকারী1205901 - মনিকা

4
"কখনই" খুব শক্তিশালী না। অনুপাতের সাথে জড়িত পারস্পরিক সম্পর্কের গুণাগুণগুলি ব্যাখ্যা করার বিষয়ে সতর্ক হওয়ার কারণ রয়েছে, বিশেষত যারা ছোট গুনের উপর ভিত্তি করে। তবে সেই কারণগুলিকে সমর্থন করে একই বিশ্লেষণগুলি এও দেখায় যে যখন অনুপাতগুলি বড় সংখ্যার উপর ভিত্তি করে হয় এবং অনুপাতগুলি বা 1 থেকে "যথেষ্ট দূরে" থাকে , তখন পারস্পরিক সম্পর্ক সহগ সমস্যাযুক্ত নয়। তদ্ব্যতীত, এক করতে সবসময় যুক্ত করা তথ্য (যেখানে উভয় উপাদান প্রদর্শন প্রকরণ) একটি হিসাবে কোন সেট এর জন্য পারস্পরিক সম্পর্কের সহগের প্রতিবেদন সারসংক্ষেপ (বর্ণনামূলক) পরিসংখ্যাত। 01
whuber

উত্তর:


6

এটি এমন এক ক্ষেত্রে হয় যখন প্রতিটি পর্যবেক্ষণে বেশ কয়েকটি ভেরিয়েবলের যোগফল 1 হয়। আমার উত্তর অন্তর্দৃষ্টি স্তর হবে; এটি ইচ্ছাকৃত (এবং এছাড়াও, আমি কম্পোজিশনাল ডেটাগুলির বিশেষজ্ঞ নই)।

আসুন আমরা আইড (তাই শূন্য-সম্পর্কিত) ভেরিয়েবলের ধনাত্মক-মানযুক্ত ভেরিয়েবলগুলি যা আমরা এর পরে যোগ করি এবং সেই পরিমাণের অনুপাত হিসাবে পুনরায় সংযোজন করি। তারপর,

  • দুটি ভেরিয়েবল ভি 1 ভি 2 এর ক্ষেত্রে , যদি ভি 1 অবাধে পরিবর্তিত হয় তবে ভি 2 এর স্বাধীনতার কোনও স্থান নেই (যেহেতু ভি 1 + ভি 2 = ধ্রুবক) এবং সম্পূর্ণভাবে স্থির; বৃহত্তর ভি 1 কম ভি 2, কম ভি 1 টি বৃহত্তর ভি 2 হয়। তাদের পারস্পরিক সম্পর্ক কিন্তু 1 এবং সর্বদা তাই।
  • 3 ভেরিয়েবল ভি 1 ভি 2 ভি 3 এর ক্ষেত্রে , যদি ভি 1 অবাধে পরিবর্তিত হয় তবে ভি 2 + ভি 3 স্থির থাকে; তারা গড়ে আছেন: বলতে চাই যে ভিতরে (থেকে V2 + + V3) দুটি ভেরিয়েবল প্রতিটি এখনও আংশিকভাবে মুক্ত যা বার প্রতিটি সংশোধন, পূর্ণ মোট স্থির করেছি। সুতরাং, যদি তিন ভেরিয়েবল যে কোনো একটি (যেমন আমরা V1 থেকে গ্রহণ) বিনামূল্যে হিসাবে নেওয়া হয়, বাকি দুটি কোন আশা করা হচ্ছে 1 / 2 স্থির করেছি। যাতে তাদের মধ্যে পারস্পরিক সম্পর্ক হয় - 0.5 । এটি প্রত্যাশিত পারস্পরিক সম্পর্ক; এটি নমুনা থেকে নমুনায় পরিবর্তিত হতে পারে।1/21/20.5
  • 4 ভেরিয়েবল যদি V1 থেকে V2 V3 V4 একই যুক্তি আমরা যে আছে, দ্বারা আমরা মুক্ত হিসাবে চার তারপর অবশিষ্ট যে কোনো একটি হওয়া উচিত যে কোনো একটি গ্রহণ যদি সংশোধন করা হয়েছে; তাই হয়, প্রত্যাশিত চার কোনো জুড়ি মধ্যে পারস্পরিক - বিনামূল্যে হিসাবে অন্যান্য হিসাবে 1 / 3 সংশোধন করা হয়েছে - হয় - 0,3331/31/30.333
  • (প্রাথমিকভাবে আইআইডি) ভেরিয়েবলের সংখ্যা বাড়ার সাথে সাথে প্রত্যাশিত জোড়াওয়ালা পারস্পরিক সম্পর্কটি দিকে নেতিবাচক থেকে বেড়ে যায় এবং নমুনা থেকে নমুনায় পরিবর্তিত হয়ে এর আকার আরও বড় হয়।0

ঠিক আছে, তবে আমি অনুমান করি যে আগ্রহটি ভি 1, ভি 2, প্রতিটি ভিতে 1 (100%) এর সমষ্টি, তবে প্রতিটি ভগ্নাংশ ছাড়া পৃথক ভিতে কোনও বাধা নেই।
নিক কক্স

each V summing to 1 ( 100%)মাফ করবেন? আমি আপনাকে বুঝতে পারি না। আমি পৃথক ভিয়ের কোনও বাধা রাখি না, কেবল ভগ্নাংশ। তবে প্রাথমিক সীমাবদ্ধতাটি ছিল আমার উদাহরণটি ভেসকে ভগ্নাংশে পরিণত করার আগে শূন্য সহাবস্থানকে ধরে নিয়েছে।
ttnphns

আপনি কি বোঝাতে চেয়েছেন যে প্রতিটি ভি এর মান 1 ("উল্লম্ব") এর সমষ্টি? না, আমি ভেরিয়েবলগুলি জুড়ে "হরাইজনিতভাবে" বোঝাতে চাইছিলাম। তবে দুর্ভাগ্যক্রমে ওপি তাদের প্রশ্নের মূল বিষয়টি ব্যাখ্যা করতে পারেনি। সুতরাং আমি এটি গ্রহণ হিসাবে এটি গ্রহণ।
ttnphns

হ্যাঁ; এটাই আমি মনে করি এখানে সাধারণত যা বোঝানো হয়, তবে প্রশ্নটি বিশেষভাবে পরিষ্কার হয় না।
নিক কক্স

1
@ttnphns আমি একটি বিবৃতি দেখেছি যে অনুপাত হিসাবে পরিমাপ করা দুটি পিয়ারসন পারস্পরিক সম্পর্ক কখনও করা উচিত নয়। 'কখনই নয়' শব্দটি হাইলাইট করার জন্য আমি ওপি সম্পাদনা করে এই পরিষ্কার করার চেষ্টা করেছি। ভিডিওটি তার শিরোনামে একই বিবৃতি দেয় ("অনুপাতের সাথে সম্পর্ক তুলবেন না!"), যদিও তারা কেবল এটি রচনা সংক্রান্ত তথ্যের প্রসঙ্গেই আলোচনা করেন। আমি ইচ্ছাকৃতভাবে প্রসঙ্গটি অপরিবর্তিত রেখেছি কারণ আমার উত্স বলেছে যে পিয়ারসন সম্পর্কিত সম্পর্ক কোনও প্রসঙ্গে অনুপাতের ডেটা ব্যবহার করা উচিত নয়। তবে মনে হচ্ছে আমার প্রশ্নের উত্তরটি হ'ল: "কিছু অনুমান বাদে অনুপাতের সংশোধন করা ভাল" "
ব্যবহারকারী1205901 - মনিকা

10

আপনার মন্তব্যের ভিডিও লিঙ্কটি রচনাগুলির প্রসঙ্গটি সেট করে , যা মিশ্রণও বলা যেতে পারে এই ক্ষেত্রে, প্রতিটি উপাদানগুলির অনুপাতের যোগফল 1 যোগ করে For উদাহরণস্বরূপ, বায়ু 78% নাইট্রোজেন, 21% অক্সিজেন এবং 1% অন্যান্য (মোট 100%)। প্রদত্ত যে কোনও একটি উপাদানের পরিমাণ অন্যদের দ্বারা সম্পূর্ণ নির্ধারণ করা হয়, যে কোনও দুটি উপাদানগুলির একটি নিখুঁত বহু-লিনিয়ার সম্পর্ক থাকবে। বায়ু উদাহরণ হিসাবে, আমাদের আছে:

x1+x2+x3=1

সুতরাং তারপর:

x1=1x2x3

x2=1x1x3

x3=1x1x2

সুতরাং আপনি যদি কোনও দুটি উপাদান জানেন তবে তৃতীয়টি অবিলম্বে জানা যাবে।

সাধারণভাবে, মিশ্রণের ক্ষেত্রে সীমাবদ্ধতা

i=1qxi=1

xi

আপনি দুটি উপাদানগুলির মধ্যে একটি পারস্পরিক সম্পর্ক গণনা করতে পারেন , তবে তথ্যবহুল নয় , কারণ এগুলি সর্বদা সম্পর্কযুক্ত। আনুপাতিক রচনা হিসাবে পরিমাপ করা ডেটা বিশ্লেষণে আপনি রচনা বিশ্লেষণ সম্পর্কে আরও পড়তে পারেন ।

অনুপাতের ডেটা যখন বিভিন্ন ডোমেন থেকে আসে তখন আপনি পারস্পরিক সম্পর্ক ব্যবহার করতে পারেন। আপনার প্রতিক্রিয়াটি এলসিডি স্ক্রিনে মৃত পিক্সেলের ভগ্নাংশ বলে। আপনি এটিটির সাথে পারস্পরিক সম্পর্ক স্থাপনের চেষ্টা করতে পারেন, পর্দার রাসায়নিক প্রক্রিয়াকরণ পদক্ষেপে ব্যবহৃত হিলিয়ামের ভগ্নাংশ।


আমি দেখছি - আমি ভুল করে ভেবেছিলাম যে রচনাগুলি কেবল একটি উদাহরণ। এইভাবে কি এটুকু বলা যায় যে সংশ্লেষ অনুপাত সাধারণত অপ্রয়োজনীয় হয় যদি না আপনি এমন পরিস্থিতি পান যা রচনাগুলির 'বল' এর সাথে একটি সম্পর্ককে বিদ্যমান?
ব্যবহারকারী1205901 - মনিকা

Given that the amount of one component is completely determined by the others, any two components will have a perfect co-linear relationshipপরিষ্কার না. আপনি এটি প্রসারিত করতে পারেন?
ttnphns

আমিও এই উত্তরটি বুঝতে পারি না। আপনার 3-ভেরিয়েবল উদাহরণে, প্রত্যেকে TWO অন্যদের দ্বারা "নির্ধারিত" হয় তবে পিয়ারসন পারস্পরিক সম্পর্ক কেবল অন্য একজনের সাথে সম্পর্কিত একটি পরিবর্তনশীল বিশ্লেষণ করে। সুতরাং, উদাহরণস্বরূপ, যদি নাইট্রোজেন বনাম অক্সিজেনের দিকে তাকানো থাকে তবে আপনি একটি (নাইট্রোজেন, অক্সিজেন) ডেটা সেট করতে পারেন [(0.78, 0.21), (0.20, 0.41), (0.44, 0.44)], এবং আপনি একটি বৈধ সংযোগ সহগ করতে পারেন সেই ডেটা গণনা (এবং এটি অবশ্যই সহ-রৈখিক নয়)। পিয়ারসন পারস্পরিক সম্পর্ক সহগ সেখানে "অন্য" সম্পর্কে জানেন না বা তাদের সম্পর্কে চিন্তা করেন না ...
জেসন সি

3
এক ধরণের মেটা-মন্তব্য হিসাবে, আপনি কোনও পরিসংখ্যানগত পয়েন্টের জন্য কর্তৃত্ব হিসাবে উদ্ধৃত দুর্গম উপাদানটি দেখতে পাবে না, আপনি এটি করার প্রস্তাব দিচ্ছেন না। সুতরাং, এটি এক পর্যায়েই সহজ: কম্পোজিশনাল ডেটা বিশ্লেষণে একটি সাহিত্য রয়েছে, যেখানে এটি দেখতে হবে; আমি কোনও বিশেষজ্ঞ নই, তাই পারস্পরিক সম্পর্কের ক্ষেত্রে সর্বাধিক কর্তৃত্বমূলক কোনটি আমি বলতে পারি না, তবে আমার প্রবৃত্তিটি হ'ল সতর্কতাটি অতিরঞ্জিত। সম্পর্কের বর্ণনামূলক ব্যবহার সহায়ক হতে পারে। মোটামুটি সীমাবদ্ধতার দ্বারা সূচনাগুলি জটিল just
নিক কক্স

আমি মনে করি যদি আমরা এলসিডি স্ক্রিনগুলি থেকে একই পরিমাণ পিক্সেলযুক্ত পরিমাপ সংগ্রহ করি এবং প্রক্রিয়াতে গ্যাসের চাপটি স্থির থাকে তবে "মৃত পিক্সেলের ভগ্নাংশ" ঠিক থাকবে। তবে একবার আপনি এই অনুপাতের ডিনোনিটারদের পরিবর্তন করার অনুমতি দেওয়া শুরু করলে হিলিয়ামের প্রভাব কী বলতে পারে?
ডেভিড লাভল

5

এটি একটি গভীর প্রশ্ন এবং কিছু সূক্ষ্মতার সাথে একটি যা বিবৃত করা দরকার। আমি যথাসাধ্য চেষ্টা করব, তবে যদিও আমি এই বিষয়টিতে প্রকাশ করেছি ( প্রপোরিটিলিটি: রিলেটিভ ডেটা ফর রিলেশনারি টু রিরলেটিভ টু রিলেটিভ টু রিলেশন ) আমি সবসময় কেবলমাত্র আপেক্ষিক তথ্যযুক্ত ডেটা বিশ্লেষণে নতুন অন্তর্দৃষ্টি দ্বারা অবাক হওয়ার জন্য প্রস্তুত আছি।

এই থ্রেডের অবদানকারীরা যেমন উল্লেখ করেছেন, সংশ্লেষমূলক ডেটা প্রয়োগ করার সময় পরস্পর সম্পর্কহীন কুখ্যাতিযুক্ত (কিছু চেনাশোনাগুলিতে) যা যখন উপাদানগুলির সেটগুলি ধ্রুবক পর্যন্ত যোগ করতে বাধ্য হয় (যেমন আমরা অনুপাত, শতাংশ, অংশ-প্রতি-মিলিয়ন, ইত্যাদি)।

কার্ল পিয়ারসন এই বিষয়টি মাথায় রেখেই স্পুরিয়াস পারস্পরিক সম্পর্কের শব্দটি তৈরি করেছিলেন । (দ্রষ্টব্য: টাইলার ভিগেনের জনপ্রিয় স্পিউরিয়াস কোরিলেশন সাইটটি " পারস্পরিক সম্পর্ককে কার্যকারণ " ত্রুটিযুক্ত করে বলে স্পিউরিয়াস পারস্পরিক সম্পর্ক সম্পর্কিত এতটা কিছু নয় ))

আইচিসনের (২০০৩) বিভাগ 1.7 এর সংশ্লেষমূলক ডেটা অ্যানালাইসিসের একটি সংক্ষিপ্ত গাইডটি সংশ্লেষিত তথ্যের জন্য সংযোগের অনুপযুক্ত মাপকাঠি কেন (সুবিধার্থে, এই পরিপূরক তথ্যে উদ্ধৃত হয়েছে ) এর একটি ক্লাসিক চিত্র সরবরাহ করে ।

কাঠামোগত ডেটা কেবল তখনই উদ্ভূত হয় না যখন অ-নেতিবাচক উপাদানগুলির একটি সেট একটি ধ্রুবকের যোগফল হয়; যখনই তারা কেবল আপেক্ষিক তথ্য বহন করে তখন ডেটা গঠনগত বলে মনে হয়।

আমি মনে করি যে কেবলমাত্র আপেক্ষিক তথ্য বহন করে এমন ডেটার সম্পর্ক সম্পর্কিত মূল সমস্যাটি ফলাফলটির ব্যাখ্যায় । এটি এমন একটি বিষয় যা আমরা একক ভেরিয়েবলের সাথে চিত্রিত করতে পারি; আসুন বিশ্বের বিভিন্ন দেশগুলিতে "জিডিপির প্রতি ডলোন উত্পাদিত" বলি। যদি একটি জাতির মূল্য অন্যের চেয়ে বেশি হয়, কারণ এটি

  • তাদের ডোনাট উত্পাদন বেশি?
  • তাদের জিডিপি কম?

...কে বলতে পারে?

অবশ্যই, লোকেরা এই থ্রেডে মন্তব্য করার সাথে সাথে কেউ বর্ণনামূলক পরিবর্তনশীল হিসাবে এই ধরণের ভেরিয়েবলের পারস্পরিক সম্পর্ক গণনা করতে পারেন । কিন্তু এই ধরনের পারস্পরিক সম্পর্ক বলতে কী বোঝায়?


3

আমিও একই প্রশ্ন করেছিলাম. আমি এই তথ্যসূত্রটি বাইরেসিভে দরকারী বলে মনে করেছি:

লাভল ডি।, ভি। পাভলোস্কি-গ্লাহন, জে এগোজকি, এস। মারোগ্র্যাট, জে বোহলার (২০১৪),
"আনুপাতিকতা: আপেক্ষিক তথ্যের জন্য পারস্পরিক সম্পর্কের একটি বৈধ বিকল্প"

এই কাগজটির সহায়ক তথ্যগুলিতে (লাভল, ডেভিড, ইত্যাদি। ডয়াই: dx.doi.org/10.1101/008417) লেখকরা উল্লেখ করেছেন যে আপেক্ষিক প্রাচুর্যের মধ্যে সম্পর্ক কিছু ক্ষেত্রে কোনও তথ্য সরবরাহ করে না। তারা দুটি এমআরএনএ অভিব্যক্তিগুলির তুলনামূলক প্রাচুর্যের উদাহরণ দেয়। চিত্র এস 2-তে, দুটি পৃথক এমআরএনএর তুলনামূলক প্রাচুর্যগুলি পুরোপুরি নেতিবাচকভাবে সংযুক্ত হয়েছে, যদিও পরম মানগুলিতে এই দুটি এমআরএনএ-এর সম্পর্কটি নেতিবাচকভাবে সম্পর্কিত নয় (সবুজ পয়েন্ট এবং বেগুনি পয়েন্ট)।

হতে পারে এটি আপনাকে সাহায্য করতে পারে।


2
আপনার পরামর্শের জন্য ধন্যবাদ। আমি এটা পরিষ্কার করিনি। এই কাগজের সহায়তার তথ্যগুলিতে ( লাভল , ডেভিড, ইত্যাদি। ডুই : dx.doi.org/10.1101/008417 ) লেখকরা উল্লেখ করেছেন যে আপেক্ষিক প্রাচুর্যের মধ্যে সম্পর্ক কিছু ক্ষেত্রে কোনও তথ্য সরবরাহ করে না। তারা দুটি এমআরএনএ অভিব্যক্তিগুলির তুলনামূলক প্রাচুর্যের উদাহরণ দেয়। চিত্র এস 2-তে, দুটি ডিআরেন্ট এমআরএনএগুলির আপেক্ষিক প্রাচুর্যগুলি পুরোপুরি নেতিবাচকভাবে সংযুক্ত হয়েছে, যদিও পরম মানগুলিতে এই দুটি এমআরএনএ-এর পারস্পরিক সম্পর্ক নেতিবাচক নয় (সবুজ পয়েন্ট এবং বেগুনি পয়েন্ট)।
মামলা করুন

@ শু আপনি হয়ত বলতে পারেন এই নিবন্ধটি কেন আপনাকে একই রকম সমস্যার সাথে সংক্ষিপ্তসারে সহায়তা করেছে ..? লিঙ্কটি আটকে দেওয়ার হয় না উত্তর, তাই অনুগ্রহ করে একটি সামান্য বিট আরো সম্প্রসারিত। এর কারণ হ'ল লিঙ্কগুলি মারা যায় এবং যদি আপনি চান আপনার উত্তর ভবিষ্যতের কারও জন্য সহায়ক হতে পারে তবে আপনার উচিত এটি স্ব-সামঞ্জস্যপূর্ণ। অবশ্যই রেফারেন্স প্রদান অতিরিক্ত আপনার উত্তর করার জন্য একটি ভাল অভ্যাস।
টিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.