একাধিক রিগ্রেশন মধ্যে ভবিষ্যদ্বাণীকারীদের মধ্যে উচ্চ সম্পর্কের সাথে কীভাবে মোকাবিলা করবেন?


18

আমি এমন একটি নিবন্ধে একটি রেফারেন্স পেয়েছি যা এরকম হয়:

তাবাচনিক অ্যান্ড ফিডেল (১৯৯ to) এর মতে .70 এর চেয়ে বেশি দ্বিখণ্ডিত পারস্পরিক সম্পর্কযুক্ত স্বতন্ত্র ভেরিয়েবলগুলি একাধিক রিগ্রেশন বিশ্লেষণে অন্তর্ভুক্ত করা উচিত নয়।

সমস্যা: আমি একাধিক রিগ্রেশন ডিজাইন 3 ভেরিয়েবলের সাথে সম্পর্কিত>> .80, ভিএফ এর প্রায় .2 - .3, সহনশীলতা ~ 4- 5 এ ব্যবহার করেছি 5. আমি তাদের কোনওটি বাদ দিতে পারি না (গুরুত্বপূর্ণ ভবিষ্যদ্বাণীকারী এবং ফলাফল)। .80 এর সাথে সম্পর্কযুক্ত 2 ভবিষ্যদ্বাণীকের উপর আমি ফলাফলটি পুনরায় চাপিয়ে দিলে, তারা উভয়ই তাত্পর্যপূর্ণ থেকে যায়, প্রতিটি পূর্বাভাসে গুরুত্বপূর্ণ ভেরিয়েন্স থাকে এবং এই একই দুটি ভেরিয়েবলের সমস্ত 10 ভেরিয়েবলের মধ্যে (5 নিয়ন্ত্রণ) অন্তর্ভুক্ত বৃহত্তম অংশ এবং অর্ধিক পারস্পরিক সম্পর্কের সহগ রয়েছে।

প্রশ্ন: উচ্চ সম্পর্কের পরেও কি আমার মডেলটি বৈধ? কোন রেফারেন্স ব্যাপকভাবে স্বাগত!


উত্তরের জন্য আপনাকে ধন্যবাদ!

আমি একটি গাইডলাইন হিসাবে তাবচনিক এবং ফিদেলকে ব্যবহার করি নি, ভবিষ্যদ্বাণীকারীদের মধ্যে উচ্চ প্রান্তিকতা নিয়ে কাজ করা একটি নিবন্ধে আমি এই রেফারেন্সটি পেয়েছি।

সুতরাং, মূলত, আমার কাছে মডেলটিতে ভবিষ্যদ্বাণীকারীদের সংখ্যার জন্য খুব কম কেস রয়েছে (অনেকগুলি শ্রেণিবদ্ধ, ডামি কোডেড নিয়ন্ত্রণ ভেরিয়েবল- বয়স, মেয়াদ, লিঙ্গ ইত্যাদি) - 72 টির ক্ষেত্রে 13 ভেরিয়েবল। কন্ডিশনের সূচকটি সমস্ত নিয়ন্ত্রণের সাথে 29 ডলার এবং সেগুলি ছাড়াই 23 ডলার (5 ভেরিয়েবল)।

এগুলি একত্রিত করার জন্য আমি কোনও পরিবর্তনশীল বাদ দিতে পারি না বা কল্পিত বিশ্লেষণ ব্যবহার করতে পারি না কারণ তাত্ত্বিকভাবে তাদের নিজস্ব ধারণা রয়েছে। আরও ডেটা পেতে দেরি হয়ে গেছে। যেহেতু আমি এসপিএসএসে বিশ্লেষণ পরিচালনা করছি সম্ভবত রিজ রিগ্রেশনটির জন্য একটি সিনট্যাক্স সন্ধান করা ভাল (যদিও আমি এটি আগে করিনি এবং ফলাফলগুলি ব্যাখ্যা করা আমার কাছে নতুন হবে)।

যদি এটি গুরুত্বপূর্ণ হয়ে থাকে, যখন আমি ধাপে ধাপে রিগ্রেশন পরিচালনা করতাম, একই 2 টি অত্যন্ত সংযুক্ত ভেরিয়েবলগুলি ফলাফলটির একক উল্লেখযোগ্য ভবিষ্যদ্বাণী ছিল।

এবং আমি এখনও বুঝতে পারি না যে আমি এই মডেলটিতে কেন এগুলি রেখেছি (যদি রিজ রিগ্রেশন সম্পাদন করা যায় না) তবে এই প্রতিটি পরিবর্তকের জন্য আংশিক সম্পর্কগুলি যে ব্যাখ্যাগুলির পক্ষে উচ্চতর তা বিবেচনা করে।

আপনি কি বলবেন যে "রিগ্রেশন ডায়াগোনস্টিক: প্রভাবশালী ডেটা এবং কোলিনারিটির উত্সগুলি সনাক্ত করা / ডেভিড এ। বেলস্লি, এডউইন কুহ এবং রায় ই। ওয়েলশ, ১৯৮০" বহুবিধ লাইন বোঝার ক্ষেত্রে সহায়ক হবে? অথবা অন্যান্য উল্লেখগুলি কার্যকর হতে পারে?


2
এই পরিস্থিতির সুস্পষ্ট উদাহরণের জন্য, stats.stackexchange.com/a/14528 এ 10 আইভি'র বিশ্লেষণ দেখুন । এখানে, সমস্ত আইভিগুলি দৃ strongly়ভাবে সম্পর্কিত হয় (প্রায় 60%)। তবে আপনি যদি এই সমস্তগুলি বাদ দেন তবে আপনার কিছুই অবশিষ্ট থাকবে না! প্রায়শই এটা আপনি ফেলে দিও পারে কোনো এই ভেরিয়েবল। এটি টিএন্ডএফ সুপারিশটিকে অযোগ্য করে তোলে।
হোবার

প্রকৃতপক্ষে, তাবাচনিক এবং ফিডেলে বেশ কিছু বাক্য রয়েছে যা আমি কমপক্ষে কিছুটা সন্দেহজনক হিসাবে বিবেচনা করব ... কারণ কোনও বইতে কিছু ছাপা হয়েছে তার অর্থ এই নয় যে এটি সর্বদা বোধগম্য হয়।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


20

মূল সমস্যাটি পারস্পরিক সম্পর্ক নয় বরং কোলাইনারিটি (উদাহরণস্বরূপ বেলসলির কাজগুলি দেখুন)। এটি সর্বোত্তম শর্ত ইনডেক্স (উপলব্ধ ব্যবহার পরীক্ষা করা হয় R, SASএবং সম্ভবত অন্যান্য প্রোগ্রামের হিসাবে ভাল। সংশ্লেষন তন্ন তন্ন একটি প্রয়োজনীয় কিংবা সমরৈখিকতা জন্য যথেষ্ট অবস্থা কি 10 (Belsley প্রতি) উপর ইঙ্গিত মধ্যপন্থী সমরৈখিকতা, 30 কঠোর করেছে। অবস্থা ইনডেক্স, কিন্তু এটি নির্ভর করে যার উপর ভেরিয়েবল সমান্তরালে জড়িত।

আপনি যদি উচ্চ কোলাইনারিটি খুঁজে পান তবে এর অর্থ হল আপনার পরামিতি অনুমানগুলি অস্থির। এটি হ'ল, আপনার ডেটাতে ছোট পরিবর্তনগুলি (কখনও কখনও চতুর্থ তাত্পর্যপূর্ণ চিত্রে) আপনার প্যারামিটারের অনুমানগুলিতে বড় পরিবর্তন আনতে পারে (কখনও কখনও এমনকি তাদের চিহ্নটিও বিপরীত করে)। এই একটি খারাপ জিনিস।

প্রতিকারগুলি হ'ল 1) আরও ডেটা পাওয়া 2) একটি পরিবর্তনশীল বাদ দেওয়া 3) ভেরিয়েবলগুলির সংমিশ্রণ (উদাহরণস্বরূপ আংশিক ন্যূনতম স্কোয়ার সহ) এবং 4) রিজ রিগ্রেশন সম্পাদন, যা পক্ষপাতদুষ্ট ফলাফল দেয় তবে অনুমানের উপর নির্ভরশীলতা হ্রাস করে।


তাবাচনিক এবং ফিদেল সামাজিক বিজ্ঞানের জন্য একটি দুর্দান্ত মাল্টিভাটার বই লিখেছিলেন। তারা পরিসংখ্যানবিদ নয় তবে তাদের মাল্টিভারিয়েট সম্পর্কে জ্ঞান পূর্বের ভাল। তবে আমি মনে করি তারা সহজ করার জন্য থাম্বের নিয়ম তৈরি করতে পারে এবং পরিসংখ্যানের সূক্ষ্মতা মিস করতে পারে। সুতরাং পিটার তার উত্তরগুলিতে তার কাগজের চেয়ে বেশি যা বলে তার উপর আমি বেশি নির্ভর করতে চাই।
মাইকেল আর চেরনিক

ধন্যবাদ @ মিশেল চের্নিক আমি প্রকৃতপক্ষে একাধিক প্রতিরোধের জন্য আমার গবেষণামূলক প্রবন্ধ লিখেছি col
পিটার ফ্লুম - মনিকা পুনরায়

আমি ধরে নিয়েছি যে আপনি আমার মতোই বৃদ্ধ এবং তাই আপনার কাজটি বেলসলে, কুহ এবং ওয়েলশ এবং কুকের কাজ পরে এসেছিল। আমি জানি কুকের কাজটি বেশিরভাগ ক্ষেত্রে অন্যান্য ডায়াগনস্টিক ইস্যুতে ছিল (লিভারেজ এবং নন-নরমালটি), তবে তিনি কি বহুবিধ লাইন নিয়ে কিছু করেছিলেন? অবশ্যই রিজ রিগ্রেশন ধারণাটি আমার সময়ের আগে ফিরে যায়
মাইকেল আর চেরনিক

1
@ পিটার ফ্লুম: পারস্পরিক সম্পর্ক কেন প্রয়োজনীয় নয় বা তাত্পর্যপূর্ণ পর্যাপ্ত শর্ত নয়? আপনি কি অ-রৈখিক সম্পর্কের কথা উল্লেখ করছেন?
জুলিয়ান

5
এটি প্রয়োজনীয় নয় কারণ, যদি প্রচুর পরিমাণে ভেরিয়েবল থাকে তবে সমস্ত জুটি কেবল কিছুটা সংযুক্ত হতে পারে তবুও তাদের যোগফল পুরোপুরি কোলিয়নার। এটি পর্যাপ্ত নয় কারণ এমন অনেকগুলি ক্ষেত্রে রয়েছে যে ক্ষেত্রে শর্ত সূচকগুলি সম্পর্কে মোটামুটি উচ্চ সম্পর্কের ক্ষেত্রে সমস্যাজনক কোলিনারিটি পাওয়া যায় না
পিটার ফ্লুম - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.