অন্যান্য ভবিষ্যদ্বাণীকারীদের অন্তর্ভুক্ত করার পরে রিগ্রেশন সহগগুলি যা সাইন উল্টে দেয়


31

কল্পনা করা

  • আপনি চারটি সংখ্যক ভবিষ্যদ্বাণী (আইভি 1, ..., আইভি 4) দিয়ে লিনিয়ার রিগ্রেশন চালান
  • যখন কেবলমাত্র IV1 ভবিষ্যদ্বাণী হিসাবে অন্তর্ভুক্ত হয় মানক বিটা হয় +.20
  • আপনি যখন আইভি 2-কে আইভি 4 অন্তর্ভুক্ত করেন তখন আইভি 1 এর মানক রেগ্রেশন সহগের চিহ্নটি উল্টে যায় -.25(অর্থাত্ এটি নেতিবাচক হয়ে যায়)।

এটি কয়েকটি প্রশ্নের জন্ম দেয়:

  • পরিভাষার ক্ষেত্রে আপনি কি এটিকে "দমনকারী প্রভাব" বলছেন?
  • আপনি এই কৌশলটি ব্যাখ্যা এবং বুঝতে কী কৌশল ব্যবহার করবেন?
  • অনুশীলনে এই জাতীয় প্রভাবগুলির কোনও উদাহরণ রয়েছে এবং কীভাবে আপনি এই প্রভাবগুলি ব্যাখ্যা এবং বুঝতে পেরেছিলেন?

ভবিষ্যদ্বাণীকারীদের অন্তর্ভুক্ত করার সময় সহগগুলি লক্ষণগুলি পরিবর্তন করে এমন পরিস্থিতিটি কীভাবে ব্যাখ্যা করবেন তবে নিশ্চিতভাবে কোনও মাল্টিকোলাইনারিটি জড়িত নেই (কম ভিআইএফ মানগুলি প্রস্তাব করবে)? মজার বিষয় হল, যদিও, ভবিষ্যদ্বাণীকারীদের অন্তর্ভুক্ত করার সময়, সাইনটি পরিবর্তিত হয়ে আমি প্রাথমিকভাবে এটি ইতিবাচক (ইতিবাচক) বলে প্রত্যাশা করেছিলাম to এটি একটি সাধারণ একটি স্বতন্ত্র ভেরিয়েবল রিগ্রেশন নেতিবাচক ছিল (পারস্পরিক সম্পর্ক ম্যাট্রিক্স নির্ভরশীল ভেরিয়েবলের সাথে একটি ন্যূনতম নেতিবাচক সম্পর্ক দেখিয়েছিল) তবে তত্ক্ষণাত অন্তর্ভুক্ত অন্যান্য ভবিষ্যদ্বাণীকারীদের সাথে ইতিবাচক হয়ে ওঠে।

@ জন আপনি কীভাবে আপনার মন্তব্য মুছে ফেলতে এবং এই প্রশ্নটি আপনার সাইটটিকে আলাদা প্রশ্ন হিসাবে পোস্ট করতে পারেন (অর্থাত, "উপরে উপরে প্রশ্ন জিজ্ঞাসা করুন" ব্যবহার করে you যদি আপনি মনে করেন যে আপনার প্রশ্নটি এই প্রশ্নের সাথে সম্পর্কিত, তবে এই প্রশ্নের একটি লিঙ্ক যুক্ত করুন আপনার নতুন প্রশ্ন
জেরোমি অ্যাংলিম

2
শেঠ ডুটারের সাথে আমি লিখেছিলাম একটি কাগজ বিষয়গুলি স্পষ্ট করতে সহায়তা করতে পারে। এটি মূলত জ্যামিতিক দৃষ্টিকোণ থেকে রচিত। এখানে লিঙ্কটি দেওয়া হয়েছে: arxiv.org/abs/1503.02722 । -ব্রায়ান কেনেবল, বি।, এবং ডটার, এস (2015)। স্বল্প-স্কোয়ার অনুমানের বিপরীতগুলি এবং অনন্য প্রভাবের দিকনির্দেশের জন্য মডেল-স্বতন্ত্র অনুমান। আরএক্সিভ প্রিপ্রিন্ট আরএক্সিভ: 1503.02722।

উত্তর:


26

মাল্টিকলাইনারিটি হ'ল জওআফ্রহ্ল্ড উল্লেখ করেছেন এমন সাধারণ সন্দেহ। মূলত, যদি আপনার ভেরিয়েবলগুলি ইতিবাচকভাবে সম্পর্কিত হয়, তবে সহগগুলি নেতিবাচকভাবে সম্পর্কিত হবে, যা সহগের একটিতে ভুল চিহ্ন হতে পারে।

একটি চেক একটি প্রধান উপাদান রিগ্রেশন বা রিজ রিগ্রেশন সঞ্চালন করা হবে। এটি বহুবিধ লাইন পরিচালনা করে, রিগ্রেশন স্পেসের মাত্রিকতা হ্রাস করে। আপনি পক্ষপাতদুষ্ট অনুমানগুলি শেষ করেছেন তবে সম্ভবত এমএসই কম এবং সংশোধিত লক্ষণগুলি। আপনি এই নির্দিষ্ট ফলাফলগুলি নিয়ে যান বা না করুন, এটি একটি ভাল ডায়াগনস্টিক চেক। আপনি যদি এখনও সাইন পরিবর্তনগুলি পান তবে এটি তাত্ত্বিকভাবে আকর্ষণীয় হতে পারে।

হালনাগাদ

জন ক্রিস্টির উত্তরের মন্তব্য অনুসরণ করে, এটি আকর্ষণীয় হতে পারে। সংঘের বিপরীতে (পরিধি বা দিক) সিম্পসনের প্যারাডক্স, লর্ডসের প্যারাডক্স এবং দমন প্রভাবগুলির উদাহরণ Effects পার্থক্যগুলি মূলত ভেরিয়েবলের ধরণের সাথে সম্পর্কিত। নির্দিষ্ট "প্যারাডক্স" বা প্রভাবের বিবেচনার চেয়ে অন্তর্নিহিত ঘটনাটি বোঝার জন্য এটি আরও কার্যকর। কার্যকারণ দৃষ্টিকোণের জন্য, নীচের কাগজটি কেন তা ব্যাখ্যা করার জন্য ভাল কাজ করে এবং আমি আপনার ক্ষুধা ঘটাতে তাদের ভূমিকা এবং উপসংহারের দৈর্ঘ্যে উল্লেখ করব।

তু এট তিনটি প্যারাডক্সের সমতুল্যের বিশ্লেষণ উপস্থাপন করেন এবং উপসংহারে পৌঁছান যে তৃতীয় ভেরিয়েবলের জন্য পরিসংখ্যানগতভাবে নিয়ন্ত্রিত হলে তিনটিই কেবল দুটি দুটি ভেরিয়েবলের সংশ্লেষে উদ্ভূত পরিবর্তনের পুনরাবৃত্তি করে। আমি এটিকে অবাক করে বলি কারণ শর্তাধীন বিশ্লেষণে বিপরীত পরিবর্তন বা মাত্রার পরিবর্তন সাধারণ change উভয় এড়াতে, আমাদের অবশ্যই শর্তসাপেক্ষ বিশ্লেষণ সম্পূর্ণ এড়ানো উচিত। এগুলি সিম্পসন এবং লর্ডসের প্যারাডক্স বা দমন প্রভাব সম্পর্কে কী, তাদের স্পষ্টতাকে নির্দেশ করে তোলার বাইরে, যা সাহিত্যে দেখা যায় মাঝেমধ্যে মাঝে মাঝে এবং কখনও কখনও অ্যালার্মিস্টের আগ্রহকে আকর্ষণ করে?

[...]

উপসংহারে, এটি অতিমাত্রায় বোঝানো যায় না যে যদিও সিম্পসনের এবং সম্পর্কিত প্যারাডোক্সগুলি কার্যকারণ বিশ্লেষণকে পরিচালিত করার জন্য পরিসংখ্যানের মানদণ্ড ব্যবহার করার বিপদগুলি প্রকাশ করে তবে তারা যে ঘটনাকে চিত্রিত করার জন্য পূর্বাপরভাবে বর্ণনা করে না বা কীভাবে এড়ানো যায় সে সম্পর্কে বিন্দুগুলিও ধারণ করে না। ব্যাখ্যা এবং সমাধানগুলি কার্যকরী যুক্তিতে থাকে যা পরিসংখ্যানের মাপদণ্ড নয়, পটভূমির জ্ঞানের উপর নির্ভর করে। এখন সময় এসেছে যে আমরা ভুল ব্যাখ্যা করা লক্ষণ এবং লক্ষণগুলি ('প্যারাডোক্সেস') চিকিত্সা বন্ধ করে দিয়েছিলাম এবং রোগ ('কার্যকারিতা') পরিচালনার ব্যবসায় শুরু করি। অ-পরীক্ষামূলক ডেটা ব্যবহার করে কার্যকারণ বিশ্লেষণের জন্য কোভারিয়েট নির্বাচনের বহুবর্ষজীবী সমস্যার দিকে আমাদের সঠিকভাবে মনোযোগ দেওয়া উচিত।


1
রিজ বা পিসিএ রিগ্রেশন অন্বেষণ করার পরামর্শের জন্য ধন্যবাদ। আপনার মন্তব্য সম্পর্কিত একটি পার্শ্ব পয়েন্ট "যদি আপনার ভেরিয়েবলগুলি ইতিবাচকভাবে সম্পর্কিত হয়, তবে গুণাগুণগুলি নেতিবাচকভাবে সম্পর্কিত হবে যা সাইন বিপরীতের দিকে পরিচালিত করে।": ইতিবাচকভাবে সম্পর্কযুক্ত ভবিষ্যদ্বাণীগুলি সাধারণত সাইন-বিপরীত দিকে পরিচালিত করে না।
জেরোমি অ্যাংলিম

দুঃখিত, তাড়াহুড়ো করে লেখা একটি বদ্ধ একটি রেখার ব্যাখ্যা। এখনই স্থির, ধন্যবাদ।
Ars

কার্যকারিতা প্রক্রিয়া গুরুত্ব সম্পর্কে দুর্দান্ত পয়েন্ট।
জেরোমি অ্যাংলিম

14

আমি বিশ্বাস করি এর মতো প্রভাবগুলি প্রায়শই কোলাইনারিটির কারণে ঘটে ( এই প্রশ্নটি দেখুন )। আমি মনে করি গেলম্যান অ্যান্ড হিলের মাল্টিলেভেল মডেলিং সম্পর্কিত বইটি এটি সম্পর্কে আলোচনা করেছে। সমস্যা হল যেIV1 এক বা একাধিক অন্যান্য ভবিষ্যদ্বাণীকের সাথে সম্পর্কিত এবং যখন তারা সমস্ত মডেলটিতে অন্তর্ভুক্ত থাকে, তখন তাদের অনুমানটি ত্রুটিযুক্ত হয়ে যায়।

যদি সহগামী উল্টানো কলিনারিটির কারণে হয়, তবে এটি রিপোর্ট করা সত্যই আকর্ষণীয় নয় কারণ এটি আপনার ভবিষ্যদ্বাণীকারীদের পরিণতির সাথে সম্পর্কের কারণে নয়, তবে ভবিষ্যদ্বাণীকারীদের মধ্যে সম্পর্কের কারণে।

এই সমস্যার সমাধানের জন্য আমি যা দেখেছি তা হ'ল অবশিষ্টাংশ। প্রথমে আপনি কোনও মডেল ফিট করেন IV2 ~ IV1, তারপরে সেই মডেলের অবশিষ্টাংশগুলি গ্রহণ করুন rIV2। যদি আপনার সমস্ত ভেরিয়েবলগুলি পারস্পরিক সম্পর্কযুক্ত হয় তবে আপনার সত্যিকার অর্থে সমস্তটি পুনরায় আকার দেওয়া উচিত। আপনি এটি করতে পছন্দ করতে পারেন

rIV2 <- resid(IV2 ~ IV1)
rIV3 <- resid(IV3 ~ IV1 + rIV2)
rIV4 <- resid(IV4 ~ IV1 + rIV2 + rIV3)

এখন, সঙ্গে চূড়ান্ত মডেল ফিট

DV ~ IV1 + rIV2 + rIV3 + rIV4

এখন, এর সহগ তার সাথে সম্পর্কিত rIV2হওয়ার স্বাধীন প্রভাবটি উপস্থাপন করে । আমি শুনেছি আপনি যদি অন্য কোনও ক্রমে পুনর্নির্মাণ করেন তবে আপনি একই ফলাফল পাবেন না এবং অবশিষ্টাংশের আদেশটি বেছে নেওয়া আপনার গবেষণার মধ্যে রায় দেওয়ার আহ্বান।IV2IV1


উত্তর করার জন্য ধন্যবাদ. আমি এই চিন্তা ছিল। (ক) মাল্টিকোলাইনারিটি: আমি সম্মত এটি সহ, সহগের পরিবর্তন করা উচিত নয়। (খ) এটা কি আকর্ষণীয়? আমি প্রকৃতপক্ষে মনে করি যে সাইন ফ্লিপিংয়ের কিছু ক্ষেত্রে আকর্ষণীয় তাত্ত্বিক ব্যাখ্যা থাকতে পারে; তবে সম্ভবত খাঁটি পূর্বাভাসের দৃষ্টিকোণ থেকে নয়। (গ) অবশিষ্টাংশ: এই পদ্ধতির বিষয়ে অন্যান্য ব্যক্তিরা কী ভাবছেন তা শুনতে আমি আগ্রহী।
জেরোমি অ্যাংলিম

আমি নিশ্চিত নই যে বহুজাতিকরেখা আকর্ষণীয় হতে পারে। বলুন আপনার কিছু ফলাফল হয়েছিল Oএবং আপনার ভবিষ্যদ্বাণীকারীরা হলেন Incomeএবং Father's Income। যে বিষয়টির Incomeসাথে সম্পর্কযুক্ত Father's Incomeতা অন্তর্নিহিত আকর্ষণীয় তবে সেই মূল্যটি যতই মূল্যবান হোক না কেন সত্য হবে O। এটি হ'ল, আপনি প্রতিষ্ঠিত করতে পারেন যে Oভবিষ্যদ্বাণীকারীরা আপনার ফলাফলের ডেটা সংগ্রহ না করে বা ফলাফল কী তা জেনেও না all আপনি যখন Oসত্যিই সত্য জানবেন তখন সেই তথ্যগুলি আরও আকর্ষণীয় হওয়া উচিত নয় Education
জোফ্রহ্ল্ড

আমি প্রস্তাব দিচ্ছি যে দমনকারী প্রভাব তাত্ত্বিকভাবে আকর্ষণীয় হতে পারে, যার মধ্যে সম্ভবত বহুবিধ লাইনারিটি ব্যাখ্যাটির জন্য একটি সূচনা পয়েন্ট সরবরাহ করে।
জেরোমি অ্যাংলিম

5

দেখুন সিম্পসন এর প্যারাডক্স । সংক্ষেপে প্রধানত প্রভাব লক্ষ্য করা যায় যখন কোনও মডেলটিতে একটি ইন্টারঅ্যাকশন যুক্ত হয় তখন বিপরীত হতে পারে। সংযুক্ত পৃষ্ঠায় বেশিরভাগ উদাহরণগুলি শ্রেণিবদ্ধ হয় তবে পৃষ্ঠার শীর্ষে এমন একটি চিত্র রয়েছে যা অবিরত কল্পনা করতে পারে। উদাহরণস্বরূপ, আপনার যদি একটি শ্রেণিবদ্ধ এবং অবিচ্ছিন্ন ভবিষ্যদ্বাণী থাকে তবে ধারাবাহিকভাবে ভবিষ্যদ্বাণীকারী স্বাক্ষরটি সহজেই উল্টাতে পারে যদি শ্রেণীবদ্ধটি যুক্ত করা হয় এবং প্রতিটি বিভাগের মধ্যে চিহ্নটি সামগ্রিক স্কোরের চেয়ে আলাদা হয়।


ভাল যুক্তি. সিম্পসনের প্যারাডক্সের সমস্ত উদাহরণ শ্রেণিবদ্ধ ভেরিয়েবলের ক্ষেত্রে প্রযোজ্য। একটি সুপারপ্রেসার ভেরিয়েবল কি সংখ্যার সমতুল্য?
জেরোমি অ্যাংলিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.