একাধিক রিগ্রেশনে ব্যাখ্যামূলক ভেরিয়েবলের মধ্যে লিনিয়ার সম্পর্ক


10

আমি ডেটা বিশ্লেষণ এবং গ্রাফিক্সের একাধিক রিগ্রেশন অধ্যায়টি আর এর সাহায্যে পড়ছিলাম : একটি উদাহরণ-ভিত্তিক পদ্ধতির এবং এটি জানতে বিভ্রান্ত হয়ে পড়েছিলাম যে এটি ব্যাখ্যামূলক ভেরিয়েবলগুলির মধ্যে লিনিয়ার সম্পর্কগুলি পরীক্ষা করার পরামর্শ দেয় (স্ক্রেটারপ্লট ব্যবহার করে) এবং যদি সেখানে কিছু না থাকে তবে ' কোন টি, তাদের রূপান্তর তাই তারা না হয়ে আরো সুসংগত সাথে সম্পর্কিত। এখানে এর কিছু অংশ রয়েছে:

6.3 একাধিক রিগ্রেশন মডেল ফিট করার জন্য একটি কৌশল

(...)

সমস্ত ব্যাখ্যামূলক ভেরিয়েবল জড়িত স্ক্রেটারপ্লট ম্যাট্রিক্স পরীক্ষা করুন। (নির্ভরশীল ভেরিয়েবল সহ এই মুহুর্তে optionচ্ছিক ) একে অপরের বিপরীতে ব্যাখ্যামূলক ভেরিয়েবলের প্লটগুলিতে অ-লৈখিকতার প্রমাণের জন্য প্রথমে দেখুন।

(...)

এই পয়েন্টটি একটি মডেল অনুসন্ধান কৌশল চিহ্নিত করে - এমন মডেলগুলি সন্ধান করুন যেখানে ব্যাখ্যাযোগ্য ভেরিয়েবলগুলির মধ্যে রিগ্রেশন সম্পর্কগুলি "সাধারণ" রৈখিক ফর্ম অনুসরণ করে । সুতরাং, যদি কিছু জুটিওয়ালা প্লটগুলি অ-লিনিয়ারিটির প্রমাণ দেখায় তবে আরও লিনিয়ার সম্পর্ক দেওয়ার জন্য রূপান্তর (গুলি) ব্যবহারের বিষয়টি বিবেচনা করুন । যদিও এই কৌশলটি অনুসরণ করে যথাযথভাবে রিগ্রেশন সম্পর্কের মডেল করার পক্ষে এটি সম্ভব না হওয়া সম্ভব, তবুও অনুসন্ধান শুরু করার জন্য নীচে প্রদত্ত কারণগুলির জন্য এটি একটি ভাল কৌশল।

(...)

যদি ব্যাখ্যামূলক ভেরিয়েবলের মধ্যে সম্পর্কগুলি প্রায় লিনিয়ার হয়, সম্ভবত রূপান্তরের পরে, তখন আত্মবিশ্বাসের সাথে প্রতিক্রিয়ার ভেরিয়েবলের বিপরীতে প্রেডিক্টর ভেরিয়েবলের প্লটগুলি ব্যাখ্যা করা সম্ভব।

(...)

এক বা একাধিক ব্যাখ্যামূলক ভেরিয়েবলের রূপান্তরগুলি খুঁজে পাওয়া সম্ভব না যা প্যানেলগুলিতে প্রদর্শিত (জোড়যুক্ত) সম্পর্কগুলি লিনিয়ার প্রদর্শিত হবে তা নিশ্চিত করে। এটি কোনও লাগানো রিগ্রেশন সমীকরণের জন্য ডায়াগনস্টিক প্লটগুলির ব্যাখ্যার জন্য এবং লাগানো সমীকরণের সহগগুলির ব্যাখ্যা করার জন্য উভয়ই সমস্যা তৈরি করতে পারে । কুক এবং ওয়েজবার্গ (1999) দেখুন।

সক্রিয়ভাবে অনুসরণ করার পরিবর্তে নির্ভরশীল ভেরিয়েবলগুলির (বহুবিশেষের ঝুঁকির কারণে) মধ্যে রৈখিক সম্পর্কের বিষয়ে আমি কি উদ্বিগ্ন হওয়া উচিত নয়? প্রায় রৈখিকভাবে সম্পর্কিত ভেরিয়েবল থাকার সুবিধা কী কী?

লেখকরা পরবর্তী অধ্যায়ে মাল্টিকোল্লাইনারিটির বিষয়টি নিয়ে আলোচনা করেছেন, তবে এই সুপারিশগুলি বহুবিধ রক্ষা এড়ানোর সাথে মতবিরোধ বলে মনে হচ্ছে।

উত্তর:


8

এখানে দুটি পয়েন্ট রয়েছে:

  1. অনুচ্ছেদটি কেবলমাত্র অনৈখিকতার প্রমাণ থাকলে আইভিগুলিকে রৈখিকতায় রূপান্তরিত করার পরামর্শ দেয়। IVs এর মধ্যে অরেখান্তরীয় সম্পর্কগুলিও প্রান্তিকতা তৈরি করতে পারে এবং আরও কেন্দ্রীয়ভাবে অন্যান্য সম্পর্কগুলিকে জটিল করে তুলতে পারে। আমি নিশ্চিত নই যে আমি বইয়ের পরামর্শের সাথে একমত, তবে এটি নির্বোধ নয়।

  2. অবশ্যই খুব শক্তিশালী রৈখিক সম্পর্কগুলি প্রান্তিকতার কারণ হতে পারে, তবে উচ্চতর পারস্পরিক সম্পর্কের কারণে সমস্যাযুক্ত প্রবন্ধের জন্য প্রয়োজনীয় বা যথেষ্ট নয় sufficient কলিনারিটি নির্ণয়ের একটি ভাল পদ্ধতি হ'ল শর্ত সূচক।

মন্তব্যের জবাবে এডিটি

শর্ত সূচীগুলি এখানে সংক্ষিপ্তভাবে বর্ণিত হয়েছে "সর্বনিম্ন ইগন্যালু দ্বারা সর্বনিম্ন ইগন্যালু দ্বারা বিভক্ত" বর্গমূল। সিভিতে এখানে বেশ কয়েকটি পোস্ট রয়েছে যা সেগুলি এবং তাদের যোগ্যতা নিয়ে আলোচনা করে। সেগুলির উপর সেমিনাল পাঠগুলি হ'ল ডেভিড বেলসির দুটি বই: কন্ডিশনিং ডায়াগনস্টিকস এবং রিগ্রেশন ডায়াগনস্টিকস (যার একটি নতুন সংস্করণ, ২০০৫ও রয়েছে)।


1
+1 - ভাল উত্তর তবে আপনি শর্ত সূচকে প্রসারিত করতে পারেন? প্রার্থীর ব্যাখ্যামূলক ভেরিয়েবলগুলিতে কোলাইনারিটি নিয়ে কাজ করার একটি সন্তোষজনক উপায় আমি এখনও পাইনি।
বিগ্রিন

তথ্যপূর্ণ উত্তরের জন্য আপনাকে ধন্যবাদ। এক্সপ্লোরের মধ্যে অ-রৈখিকতার দ্বারা অন্যান্য সম্পর্কগুলি কী জটিল তা ব্যাখ্যা করতে পারেন? ভেরিয়েবল? লেখকরা যখন বলছেন যে অনূষণীয় সম্পর্ক এক্সপ্লোরের মধ্যে রয়েছে তখন আপনি কি এখন লেখকরা যা বলছেন? চলকগুলি সহগ এবং ডায়াগনস্টিক প্লটের ব্যাখ্যা দিয়ে সমস্যা তৈরি করতে পারে?
রিকার্ডোসি

আমি এখনই উদাহরণ দিয়ে আসতে পারি না, তবে এটি ঘটতে দেখেছি। দেখে মনে হতে পারে যে ওয়াই এবং এক্স-এর মধ্যে অ-লাইন সম্পর্ক রয়েছে
পিটার ফ্লুম

3

প্রতিটি ব্যাখ্যামূলক ভেরিয়েবল এবং নির্ভরশীল ভেরিয়েবলের মধ্যে রৈখিক সম্পর্কগুলিও ব্যাখ্যামূলক ভেরিয়েবলের মধ্যে লিনিয়ার সম্পর্ককে নিশ্চিত করবে। বিপরীতটি অবশ্যই সত্য নয়।

এটি সত্য যে আনুমানিক লাইনারিটি দেওয়ার জন্য ডিজাইন করা ট্রান্সফর্মেশন (গুলি) প্রান্তিকতা বাড়িয়ে তুলবে। এই ধরনের রূপান্তর (গুলি) এর অভাবে, তবে, প্রান্তিকতা লুকানো আছে। কোলাইনারিটিটি এইভাবে লুকিয়ে রাখার উপর জোর দেওয়ার ফলে জটিল এবং অনর্থনযোগ্য রিগ্রেশন সমীকরণ হতে পারে, যেখানে একটি সাধারণ আকারের সমীকরণ পাওয়া যায়।

ধরা যাক এটি yলিনিয়ার ফাংশনের কাছাকাছি log(x1), এমন একটি ক্ষেত্রে যেখানে x10 বা ততোধিক সংখ্যক গুণকের দ্বারা পৃথক মানের মূল্য রয়েছে। তারপরে যদি xরেজিস্ট্রার হিসাবে ব্যবহার করা হয়, তবে অন্যান্য ব্যাখ্যামূলক ভেরিয়েবলগুলি যদি সম্ভব হয় তবে এক্স 1 এর সাথে সম্পর্কের ক্ষেত্রে অনৈক্যবদ্ধতার জন্য অ্যাকাউন্টে প্রার্থনা করা হবে। ফলাফলটি একটি জটিল জটিল সংবেদনশীল সম্পর্ক হতে পারে, ব্যাখ্যা ছাড়াই সহগের সাথে, একটি সহজ আকারের রিগ্রেশন সমীকরণের জায়গায় যা সমস্ত উপলব্ধ ব্যাখ্যামূলক শক্তি ক্যাপচার করে।

রৈখিক সম্পর্কিত ভেরিয়েবলগুলি খুঁজে পেতে এবং কাজ করতে ব্যর্থতার ফলে উদ্ভট পরিণতিগুলি সাম্প্রতিক গবেষণাপত্রে খুব ভালভাবে ফুটিয়ে তোলা হয়েছে যে ১৯৯০-২০১২-এর বেশি মার্কিন যুক্তরাষ্ট্রে ভূমিকম্পের কারণে ৯৯ টি আটলান্টিক হারিকেনের মৃত্যুর তথ্য সম্পর্কিত হারিকেন নাম প্রভাবের একটি মহিলাত্ব দাবি করেছে। Http://www.pnas.org/content/111/24/8782.abstract দেখুন । পরিপূরক তথ্যের অংশ হিসাবে ডেটা উপলব্ধ। নোট করুন যে log(deaths)একটি আদর্শ তত্ত্ব লিনিয়ার মডেল (আর এর ফাংশন lm()) এর সাথে কাজ করা এবং ব্যবহার করা মোটামুটি जंग এট আল এর একটি নেতিবাচক দ্বিপদী রিগ্রেশন মডেলের ব্যবহারের সমান।

এক regresses তাহলে log(E[deaths])উপর log(NDAM), কিছুই ন্যূনতম চাপ পরিবর্তনশীল, femaleness পরিবর্তনশীল, এবং পারস্পরিক ক্রিয়ার জন্য বাকি আছে, ব্যাখ্যা করার জন্য। পরিবর্তনশীল log(NDAM), না NDAM, একটি ন্যূনতম চাপ পরিবর্তনশীলের সাথে রৈখিকভাবে সম্পর্কিত হিসাবে একটি স্ক্যাটারপ্ল্লট ম্যাট্রিক্সে উপস্থিত হয়। এর বিতরণটিও কম স্কিউ, অনেকটা প্রতিসমের কাছাকাছি।

জং এট regressed log(E[deaths])উপর NDAM(স্বাভাবিক ক্ষতি), প্লাস যারা অন্যান্য ভেরিয়েবল এবং পারস্পরিক ক্রিয়ার। তারপরে যে সমীকরণটি আবির্ভূত হয়েছিল তা একটি গল্প বলতে ব্যবহৃত হয়েছিল যাতে নামের সাথে মিলিত হওয়ার সঙ্গে সঙ্গে মহিলার এক বিশাল প্রভাব পড়ে।

কিভাবে উদ্ভট এটি ব্যবহার করতে হয় তা দেখার জন্য NDAMএকটি রিগ্রেশন যেখানে ফলাফল পরিবর্তনশীল একটি ব্যাখ্যামূলক পরিবর্তনশীল যেমন log(E[deaths]), প্লট log(deaths+0.5)বা log(deaths+1)বিরুদ্ধে NDAM। তারপর চক্রান্ত পুনরাবৃত্তি log(NDAM)স্থানে NDAM। এর বিপরীতে আরও মারাত্মক আকর্ষণীয় যদি ক্যাটরিনা এবং অড্রে, যা জং এট-কে বাদ দেওয়া হিসাবে বাদ দেওয়া হয়েছে, এই প্লটে অন্তর্ভুক্ত হয়। NDAMপরিবর্তে ব্যাখ্যামূলক পরিবর্তনশীল হিসাবে জোর দিয়ে log(NDAM)জং এট আল রিগ্রেশন সম্পর্কের একটি খুব সাধারণ রূপ আবিষ্কার করার সুযোগটি সরিয়ে নিয়ে গেলেন।

E[deaths]মডেল দ্বারা ভবিষ্যদ্বাণী করা মৃত্যুর সংখ্যা এটিই এনবি ।

জং এট আল ডেটাতে, প্রয়োজনীয় রূপান্তরগুলি সমস্ত ভেরিয়েবলের একটি স্ক্যাটারপ্ল্লট ম্যাট্রিক্স থেকে সনাক্ত করা যায়। সম্ভবত আর ফাংশন ব্যবহার করে দেখুন spm()আর জন্য গাড়ী প্যাকেজের সর্বশেষ রিলিজের মধ্যে, সঙ্গে transform=TRUEএবং (সঙ্গে deathsএকটি পরিবর্তনশীল হিসাবে) family="yjPower"। বা একটি প্রাথমিক স্ক্রেটারপ্লট ম্যাট্রিক্স দ্বারা প্রস্তাবিত রূপান্তরগুলি নিয়ে পরীক্ষা করুন। সাধারণভাবে, পছন্দসই পরামর্শটি হতে পারে বর্ণনামূলক পরিবর্তনশীলগুলির জন্য প্রথমে সন্ধান করা যা লিনিয়ার ভবিষ্যদ্বাণীকারীদের প্রয়োজনীয়তা পূরণ করে, তারপরে ফলাফলের পরিবর্তনশীলটিতে উপস্থিত হতে পারে, সম্ভবত গাড়ী ফাংশন ব্যবহার করে invTranPlot()

প্রশ্নকারীর দ্বারা উল্লেখ করা "ডেটা বিশ্লেষণ এবং গ্রাফিক্স ব্যবহার করে আর" এর পাশাপাশি দেখুন:

  • ওয়েজবার্গ: ফলিত লিনিয়ার রিগ্রেশন। চতুর্থ এডএন, উইলি ২০১৪, পিপি। ১85৮৫-২০১।।
  • ফক্স এবং ওয়েজবার্গ: অ্যাপ্লাইড রিগ্রেশন এর একটি আর কমপেনিয়ান। ২ য় এডএন, সেজ, ২০১১, পিপি .2727-148।

1

আমি পুরো উত্তরণটি বরং রহস্যজনক বলে মনে করি যদি সরাসরি প্রশ্নবিদ্ধ না হয়। আদর্শভাবে, আপনি চান আপনার স্বতন্ত্র ভেরিয়েবলগুলি একে অপরের কাছ থেকে যথাসম্ভব অসম্পর্কিত হোক যাতে নির্ভরশীল ভেরিয়েবলটি নির্ধারণের ক্ষেত্রে মডেলকে বর্ধিত এবং অতিরিক্ত তথ্য সরবরাহ করা যায়। আপনি স্বাধীন ভেরিয়েবলের মধ্যে উচ্চ সম্পর্কের মাধ্যমে বহুবিশ্বের বিষয়টি উত্থাপন করেন এবং এই পরিস্থিতিতে এই সমস্যাটি উত্থাপন করার ক্ষেত্রে আপনি ঠিকই সঠিক।

বিচ্ছিন্ন প্লট এবং স্বতন্ত্র ভেরিয়েবলগুলির মধ্যে নির্ভরশীল প্রতিটি এবং নির্ভরশীল ভেরিয়েবলের মধ্যে সম্পর্কিত লিনিয়ার সম্পর্ক পরীক্ষা করা আরও সমালোচিত। যখন এ জাতীয় স্কেটার প্লটগুলি (এক্স-অক্ষের উপর স্বতন্ত্র এবং ওয়াই-অক্ষের উপর নির্ভরশীল) তাকানো থাকে তখন লগ, এক্সপোজন বা বহুবর্ষীয় ফর্মের মধ্য দিয়ে কিনা তা আরও ভাল ফিট করার জন্য স্বাধীন ভেরিয়েবলকে রূপান্তর করার সুযোগ থাকতে পারে।


1
আপনার ২ য় বাক্যে: যদি স্বতন্ত্র ভেরিয়েবলগুলি সম্পূর্ণরূপে অসম্পৃক্ত থাকে তবে রিগ্রেশন সম্পর্কিত অনেক কারণ যুক্তিযুক্ত হয়ে উঠত। ওয়াইয়ের সাথে ভবিষ্যদ্বাণীকারীর প্রতিটি দ্বিবিভক্ত সম্পর্ক অন্য সমস্ত ভবিষ্যদ্বাণীকারীকে নিয়ন্ত্রণ করা হলে সেই সম্পর্কের মতোই প্রদর্শিত হবে। সেক্ষেত্রে নিয়ন্ত্রণ কেন?
Rolando2
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.