আমরা কখন সহবাসের কথা বলতে পারি?


16

লিনিয়ার মডেলগুলিতে আমাদের ব্যাখ্যামূলক ভেরিয়েবলগুলির মধ্যে কোনও সম্পর্ক বিদ্যমান কিনা তা পরীক্ষা করা দরকার need যদি তারা খুব বেশি সম্পর্ক স্থাপন করে তবে কোলাইনারিটি আছে (অর্থাত্ ভেরিয়েবলগুলি একে অপরকে আংশিকভাবে ব্যাখ্যা করে)। আমি বর্তমানে প্রতিটি ব্যাখ্যামূলক ভেরিয়েবলের মধ্যে জুটিওয়ালা পারস্পরিক সম্পর্ক দেখছি।

প্রশ্ন 1: খুব বেশি পারস্পরিক সম্পর্ক হিসাবে শ্রেণিবদ্ধ করা হয়? উদাহরণস্বরূপ, পিয়ারসন পারস্পরিক সম্পর্ক 0.5 এর খুব বেশি?

প্রশ্ন 2: আমরা সম্পূর্ণরূপে নির্ধারণ করতে পারি পারস্পরিক সম্পর্ক সহগের উপর ভিত্তি করে দুটি ভেরিয়েবলের মধ্যে কোলাইনারিটি আছে কি না এটি অন্যান্য কারণের উপর নির্ভর করে?

প্রশ্ন 3: দুটি ভেরিয়েবলের স্ক্যাটারপ্ল্লটের একটি গ্রাফিকাল চেক কি পারস্পরিক সম্পর্কের সহগ নির্দেশ করে?


2
3+ ভেরিয়েবলের মধ্যে কোলাইনারিটি (একাকীত্ব) কেবলমাত্র উচ্চ জোড়াযুক্ত পারস্পরিক সম্পর্কের ক্ষেত্রে হ্রাস হয় না। "মাল্টিকোলাইনারিটি" ট্যাগ হওয়া প্রশ্নের জন্য সাইটটি অনুসন্ধান করুন। এছাড়াও, আমি আপনাকে এই আমার উত্তরটি পড়ার পরামর্শ দিচ্ছি: stats.stackexchange.com/a/70910/3277
ttnphns

উত্তর:


15
  1. অত্যধিক কোলাইনারিটি এবং অত্যধিক কোলিনারিটির মধ্যে কোনও 'উজ্জ্বল রেখা' নেই (তুচ্ছ অর্থে ব্যতীত যে অবশ্যই খুব বেশি)। বিশ্লেষকরা সাধারণত দুটি ভেরিয়েবলের মধ্যে খুব বেশি পরিমাণে রৈখিক হিসাবে ভাবেন না । বহুবিধ লাইন সম্পর্কিত আঙ্গুলের একটি নিয়ম হ'ল ভিআইএফ 10 টির চেয়ে বেশি হয় (আপনার সম্ভবত 10 টি আঙ্গুল রয়েছে তাই এটির মূল্য কি তার জন্য থাম্বের এই জাতীয় নিয়মগুলি গ্রহণ করুন) you এর অর্থ এই হবে যে হলে দুটি ভেরিয়েবলের মধ্যে আপনার খুব বেশি মিল রয়েছে । আপনি আমার উত্তরে ভিআইএফ এবং মাল্টিকোলাইনারিটি সম্পর্কে আরও পড়তে পারেন: একাধিক রিগ্রেশন মডেলটিতে পারস্পরিক সম্পর্কযুক্ত ভবিষ্যদ্বাণীকারীদের প্রভাব কী?R=1.0R=.50R.95

  2. এটি "সম্পূর্ণ নির্ধারণ" দ্বারা আপনি কী বোঝাতে চান তার উপর নির্ভর করে on যদি দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক ছিল were , তবে বেশিরভাগ ডেটা বিশ্লেষকরা বলতেন যে আপনার সমস্যাযুক্ত কোলাইনারিটি ছিল। তবে, আপনার একাধিক ভেরিয়েবল থাকতে পারে যেখানে কোনও দুটি ভেরিয়েবলের জুটিযুক্ত পারস্পরিক সম্পর্ক রয়েছে যা উচ্চতর এবং এখনও ভেরিয়েবলের পুরো সেটটির মধ্যে সমস্যাযুক্ত কোলাইনারিটি লুকানো রয়েছে। এখানেই অন্যান্য মেট্রিকগুলি যেমন ভিআইএফ এবং শর্ত নম্বর কার্যকর হয়। আপনি এখানে আমার প্রশ্নে এই বিষয়টিতে আরও পড়তে পারেন: মাল্টিকোলাইনারিটির নির্দিষ্ট পরিমাপ পছন্দ করার কোনও কারণ আছে কি?R.95

  3. আপনার ডেটা দেখার জন্য এটি সর্বদা স্মার্ট, এবং কেবল সংখ্যার সারসংক্ষেপ / পরীক্ষার ফলাফল নয় not এখানে আধ্যাত্মিক রেফারেন্স হ'ল আনসকম্বের চৌকোটি


3

তিনটি প্রশ্ন আমার গ্রহণ

প্রশ্ন 1 কি খুব বেশি পারস্পরিক সম্পর্ক হিসাবে শ্রেণিবদ্ধ করে? উদাহরণস্বরূপ: ০.৫ এর পার্সন পারস্পরিক সম্পর্ক কি খুব বেশি?

অনেক লেখক যুক্তি দিয়েছিলেন যে (বহু) কোলাইনারিটি কোনও সমস্যা নয়। বিষয়টি সম্পর্কে বরং একটি অ্যাসিড মতামতের জন্য এখানে এবং এখানে একবার দেখুন । তল লাইনটি হ'ল মাল্টিকোলাইনারিটির নিম্ন (কার্যকর) নমুনার আকার ছাড়া অন্য অনুমানের পরীক্ষায় কোনও প্রভাব নেই। উদাহরণস্বরূপ, আপনি যদি কোনও রিগ্রেশন করেন তবে রিগ্রেশন সহগের ব্যাখ্যা করা আপনার পক্ষে শক্ত হবে তবে আপনি যদি এটি করতে চান তবে কোনও মৌলিক অনুমান লঙ্ঘন করবেন না।

প্রশ্ন 2 আমরা সম্পূর্ণরূপে নির্ধারণ করতে পারি পারস্পরিক সম্পর্ক সহগের উপর ভিত্তি করে দুটি ভেরিয়েবলের মধ্যে সমান্তরালতা আছে কি না এটি অন্যান্য কারণের উপর নির্ভর করে?

আমি মনে করি পিয়ারসনের পারস্পরিক সম্পর্কের গুণাগুণ গণনা করা (যদি আপনি লৈখিক্য ধরে নেন, এবং স্পষ্টত আপনি এটি করেছিলেন), স্পিয়ারম্যানের পদমর্যাদ , দূরত্বের সম্পর্ক এবং এমনকি আপনার ডেটাসেটে পিসিএ করার জন্য দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক পরিমাপের বিভিন্ন উপায় রয়েছে বলে আমি মনে করি । তবে আমি এই প্রশ্নের উত্তর আমার চেয়ে আরও ভাল জ্ঞাত ব্যক্তিদের কাছে রেখে দেব।

প্রশ্ন 3 দুটি ভেরিয়েবলের বিক্ষিপ্ত প্লটের একটি গ্রাফিকাল চেক কি পারস্পরিক সম্পর্কের সহগ নির্দেশ করে?

আইএমও, উত্তরটি হ'ল নং।


3
আইএমএইচও, (3) এর উত্তর বিপরীতে খুব শক্তিশালী হ্যাঁ: পারস্পরিক সম্পর্কের সহগটি সম্পর্কের লাইনারিটির একক সংখ্যাসমূহের মূল্যায়ন দিতে পারে, তবে স্ক্যাটারপ্লোতে একটি তাত্ক্ষণিক দৃষ্টি আকর্ষণ করে সে সম্পর্কে অতিরিক্ত তথ্যের সংস্থান দেবে whereas সম্পর্ক, এমন আচরণগুলি সহ যা পূর্বে প্রত্যাশিত ছিল না। যাইহোক, এই সেট প্রশ্নগুলির আসল আগ্রহটি কিভাবে তিন বা ততোধিক ভেরিয়েবলের মধ্যে সম্পর্কের মূল্যায়ন করা যায় (যদিও (3) কীভাবে প্রকৃতভাবে বর্ণিত হয়েছিল), এবং সেই ক্ষেত্রে এমনকি একটি বিচ্ছুরিত ম্যাট্রিক্স সমস্ত কিছু প্রকাশ করে না, যেমন @ttnphns নোট।
শুক্র

1
(১) যতদূর যায়, আমি আপনার রেফারেন্সটি (ডেভ গিলের ব্লগে) অন্যভাবে পড়েছি: তিনি যুক্তি দেখিয়েছেন যে বহুবিধরনের আনুষ্ঠানিক পরীক্ষাটি বিপথগামী। আমি তাকে দাবি করে দেখছি না যে বহুবিধ লাইন সমস্যাটি নয়।
হোবার

ডেভ গিলের জবাব সম্পর্কে আমার উপলব্ধি হ'ল একচেটিয়া বহুবিধ লাইনটি ফলাফলগুলিকে প্রভাবিত করে এটি একটি সমতুল্য ছোট নমুনার আকারের মাধ্যমে হবে। সুতরাং এটি যেমন ছোট নমুনার আকারের জন্য পরীক্ষা করার কোনও ধারণা রাখে না, তেমনি বহুবিধ প্রভাবের পরীক্ষার জন্য এটি কোনও অর্থবোধ করে না। তবে আমি এটি সম্পর্কে আপনার মতামত শুনে খুশি হব, সম্ভবত আমি এটি ভুল বুঝেছি।
pedrofigueira

বেশিরভাগ অধ্যয়নের জন্য আরও বড় আকারের নমুনা আকারের প্রয়োজন হতে পারে! কাছাকাছি-সমরৈখিকতা উদ্বেগ মডেল ভবন এবং পরিবর্তনশীল নির্বাচন, আলোচনা (যেমন একটি subtler প্রভাব ইন্টার আলিয়া ) যেমন থ্রেডের মধ্যে stats.stackexchange.com/questions/50537 এবং stats.stackexchange.com/a/28476/919 । তবে আসুন আমরা নিশ্চিত হলাম যে আমরা একই জিনিসগুলির বিষয়ে কথা বলছি: গিলস বহুবিধ লাইনচয়ের আনুষ্ঠানিক পরীক্ষাগুলি নিয়ে আলোচনা করছে, যেন স্বাধীন ভেরিয়েবলগুলি এলোমেলোভাবে নমুনা পেয়েছিল। এখানে উদ্বেগটি কোনও মডেলের দক্ষতা এবং সীমাবদ্ধতাগুলি বোঝার জন্য মাল্টিক্ললাইনারিটি ডায়াগনস্টিকগুলি ব্যবহার করে বলে মনে হচ্ছে ।
হোবার

1

কলিনারিটি মূল্যায়ন করার একটি সাধারণ উপায় হ'ল ভেরিয়েন্স মুদ্রাস্ফীতি কারণগুলির (ভিআইএফ) সাথে। এটি 'গাড়ী' প্যাকেজের মধ্যে 'ভিআইএফ' ফাংশনটি ব্যবহার করে আর এ অর্জন করা যেতে পারে। এটি দুটি ভেরিয়েবলের মধ্যে কেবল পারস্পরিক সম্পর্ককে দেখার জন্য একটি সুবিধা রয়েছে কারণ এটি একই সাথে একটি ভেরিয়েবল এবং মডেলের অন্যান্য ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ককে মূল্যায়ন করে। এরপরে এটি আপনাকে মডেলের প্রতিটি পূর্বাভাসীর জন্য একটি একক স্কোর দেয়।

উপরে উল্লিখিত হিসাবে কোনও শক্ত এবং দ্রুত কাটঅফ নেই, তবে ভিআইএফ স্কোরগুলি প্রায়শই 5-10-এর মধ্যে হলে সমস্যাযুক্ত হওয়ার সিদ্ধান্ত নেওয়া হয়। আমি এর জন্য থাম্বের ক্ষেত্র নির্দিষ্ট নিয়ম ব্যবহার করি। এছাড়াও- পারস্পরিক সম্পর্কের পূর্বাভাসকারীদের ব্যবহার সম্পর্কে অবৈধভাবে কিছু নেই (যতক্ষণ না তারা নিখুঁতভাবে সম্পর্কযুক্ত নয়)। পৃথক প্রভাবগুলির জন্য আপনার আরও বেশি ডেটা লাগবে। যখন আপনার কাছে পর্যাপ্ত ডেটা নেই তখন সম্পর্কের পূর্বাভাসকারীগুলির প্যারামিটার অনুমানগুলিতে বড় অনিশ্চয়তা থাকবে এবং এই অনুমানগুলি পুনরায় নমুনা দেওয়ার ক্ষেত্রে সংবেদনশীল হবে।

আপনার প্রশ্নের উত্তর বিশেষভাবে দিতে:

  1. পারস্পরিক সম্পর্ক সহগ ব্যবহার করবেন না। সমস্ত ভবিষ্যদ্বাণীকারী এবং কোনও ইন্টারঅ্যাকশন সহ মডেলের ভিআইএফ ব্যবহার করুন। 5-10-এর ভিআইএফগুলি খুব বেশি পারস্পরিক সম্পর্কের ইঙ্গিত দিচ্ছে, আপনার নির্দিষ্ট কাটঅফটি আপনাকে মডেলের সাথে কী করতে হবে তার উপর নির্ভর করে।

  2. এটি মডেলের অন্যান্য ভবিষ্যদ্বাণীদের উপর নির্ভর করে, এজন্য ভিআইএফ ব্যবহার করা সুবিধাজনক।

  3. নাঃ! পরিসংখ্যানগুলি আপনি কীভাবে স্ক্যাটার প্লটের সাথে চোখ বুলিয়ে যাচ্ছেন তা আরও ভালভাবে মাপবে। একে অপরের বিরুদ্ধে আপনার ভবিষ্যদ্বাণীকারীদের প্রতিরোধ করার সময় ওএলএসের অনুমানের চূড়ান্ত লঙ্ঘন না হলে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.