লিনিয়ার রিগ্রেশন ডায়াগনস্টিকগুলি আপনাকে কোন ক্রম অনুসারে করা উচিত?


24

লিনিয়ার রিগ্রেশন বিশ্লেষণে, আমরা বহিরাগতদের বিশ্লেষণ করি, বহুবিশ্লেষ পরীক্ষা করি, পরীক্ষা বৈধতা পরীক্ষা করি astic

প্রশ্নটি হল: এগুলি প্রয়োগ করার কোনও আদেশ আছে কি? আমি বলতে চাইছি, আমাদের কি প্রথমে আউটলিয়ারদের বিশ্লেষণ করতে হবে, এবং তারপরে মাল্টিকোলাইনারিটি পরীক্ষা করতে হবে? নাকি বিপরীত?

এ নিয়ে কি কোনও নিয়ম আছে?


2
থাম্বের কয়েকটি খুব রুক্ষ নিয়ম: আপনার কোনও ফিটনেস করার আগে আপনার অবশ্যই অনুলিপিটি অনুসন্ধান করা উচিত । যদি আপনি এটি উপস্থিত দেখেন তবে আপনার (ক) কোলাইনারিটি পরিচালনা করে এমন একটি পদ্ধতি ব্যবহার করা উচিত, (খ) কলিনারি বৈশিষ্ট্যগুলি মুছে ফেলা, বা (গ) আপনার বৈশিষ্ট্যগুলিকে রূপান্তর করা (যেমন পিসিএ ব্যবহার করে)। একবার আপনি কোনও মডেল লাগিয়ে দিলে, আপনি অবশিষ্টাংশগুলিতে ভিন্ন ভিন্ন বৈশিষ্ট্যের সন্ধান করতে পারেন। সাধারণভাবে, আপনি যদি ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করে থাকেন তবে আপনার বহিরাগতদের অপসারণ করা উচিত নয়। পরিবর্তে, এমন একটি পদ্ধতি ব্যবহার করুন যা বিদেশীদের উপস্থিতিতে মজবুত।
ক্রিস টেলর

1
কেউ কীভাবে সর্বোত্তমভাবে তদন্ত করতে পারে? ভবিষ্যদ্বাণীকারীদের পারস্পরিক সম্পর্ক ম্যাট্রিক্সের অফ-ডায়াগোনাল উপাদানগুলির দিকে তাকিয়ে আছেন?
মিউরা

1
কোলিনারিটি তদন্তের সর্বোত্তম উপায় হ'ল শর্ত সূচক এবং তাদের দ্বারা ব্যাখ্যা করা বৈকল্পিকতার অনুপাত। উচ্চ সম্পর্কের জন্য তাত্পর্যপূর্ণতার জন্য প্রয়োজনীয় বা তাত্পর্যপূর্ণ শর্ত নয়।
পিটার ফ্লুম - মনিকা পুনরায়

উত্তর:


28

প্রক্রিয়াটি পুনরাবৃত্ত, তবে একটি প্রাকৃতিক ক্রম রয়েছে:

  1. আপনাকে প্রথমে এমন শর্তগুলির বিষয়ে চিন্তা করতে হবে যেগুলি সম্পূর্ণ সংখ্যাগত ত্রুটি ঘটাচ্ছে । মাল্টিকোলাইনারিটি তার মধ্যে একটি, কারণ এটি সমীকরণের অস্থির সিস্টেম তৈরি করতে পারে যার ফলস্বরূপ একেবারে ভুল উত্তর (16 দশমিক স্থানে ...) এখানের যে কোনও সমস্যা সাধারণত এর অর্থ এটি স্থির না হওয়া পর্যন্ত আপনি অগ্রসর হতে পারবেন না। মাল্টিকোলাইনারিটি সাধারণত ভেরিয়েন্স ইনফ্লেশন ফ্যাক্টর এবং "টুপি ম্যাট্রিক্স" এর অনুরূপ পরীক্ষা ব্যবহার করে নির্ণয় করা হয়। এই পর্যায়ে অতিরিক্ত চেকগুলির মধ্যে ডেটাসেটের কোনও অনুপস্থিত মানগুলির প্রভাব মূল্যায়ন করা এবং গুরুত্বপূর্ণ পরামিতিগুলির সনাক্তকরণযোগ্যতা যাচাই করা অন্তর্ভুক্ত থাকতে পারে। (পৃথক পৃথক ভেরিয়েবলগুলির সংমিশ্রণগুলি এখানে কখনও কখনও সমস্যার কারণ হতে পারে))

  2. এরপরে আপনাকে উদ্বিগ্ন হওয়া দরকার যে আউটপুটটি বেশিরভাগ ডেটা প্রতিফলিত করে বা একটি ছোট উপসেটের প্রতি সংবেদনশীল। পরবর্তী ক্ষেত্রে, পরবর্তী সময়ে আপনি যা কিছু করেন তা বিভ্রান্তিমূলক হতে পারে, তাই এড়ানো উচিত। পদ্ধতিগুলির মধ্যে বহিরাগতদের পরীক্ষা এবং লিভারেজ অন্তর্ভুক্ত । (একটি উচ্চ-লিভারেজ ডাটাম আউটলেটর নাও হতে পারে তবে এটি সমস্ত ফলাফলকে অকার্যকরভাবে প্রভাবিত করতে পারে reg) যদি রিগ্রেশন পদ্ধতির কোনও দৃ alternative় বিকল্প বিদ্যমান থাকে তবে এটি প্রয়োগ করার জন্য এটি ভাল সময়: এটি পরীক্ষা করে একই ফলাফল তৈরি করছে এবং দেখুন বহির্মুখী মানগুলি সনাক্ত করতে এটি ব্যবহার করুন।

  3. পরিশেষে, এমন একটি পরিস্থিতি অর্জন করে যা সংখ্যাগতভাবে স্থিতিশীল (যাতে আপনি গণনাগুলিতে বিশ্বাস করতে পারেন) এবং যা সম্পূর্ণ ডেটাসেটকে প্রতিফলিত করে, আপনি আউটপুটটির সঠিক ব্যাখ্যা করার জন্য প্রয়োজনীয় পরিসংখ্যানগত অনুমানের একটি পরীক্ষার দিকে ঝুঁকছেন । প্রাথমিকভাবে এই উদ্বেগগুলি ফোকাস - গুরুত্বের দিক থেকে - অবশিষ্টাংশের বিতরণে (হেটেরোসেসটাস্টিকালিটি সহ, তবে প্রতিসাম্য, বিতরণ আকার, ভবিষ্যদ্বাণীযুক্ত মান বা অন্যান্য ভেরিয়েবলগুলির সাথে সম্ভাব্য পারস্পরিক সম্পর্ক, এবং স্বতঃসংশোধন), ফিটনের ভালতা (সহ পারস্পরিক মিথস্ক্রিয়া শর্তগুলির জন্য প্রয়োজনীয় প্রয়োজনীয়তা), নির্ভরশীল ভেরিয়েবলটি পুনরায় প্রকাশ করা হবে কিনা এবং স্বতন্ত্র ভেরিয়েবলগুলি পুনরায় প্রকাশ করতে হবে কিনা

যে কোনও পর্যায়ে, যদি কোনও কিছু সংশোধন করা দরকার তবে প্রথমে ফিরে আসাটাই বুদ্ধিমানের কাজ। যতবার প্রয়োজন ততবার পুনরাবৃত্তি করুন।


2
আমি আসলে ভিআইএফ-র পরিবর্তে শর্ত সূচকগুলি ব্যবহার করতে পছন্দ করি। আমি এগুলিতে আমার গবেষণামূলক কাজটি করেছি, কিছুক্ষণ আগে।
পিটার ফ্লুম - মনিকা পুনরায়

1
@ পিটার ভাল পয়েন্ট আমি কন্ডিশনের সূচকেও পছন্দ করি তবে আমার কাছে মনে হয় ভিআইএফ এখন খুব জনপ্রিয়।
whuber

হুঁশি, আমি আজ আপনার মন্তব্য থেকে এখানে অনুসরণ। বহু পোস্টের ক্ষেত্রে কিছু উদ্বেগ সম্পর্কে আমার পোস্টডকের সময় আমি একবারে একজন পরিসংখ্যানবিদদের সাথে পরামর্শ করেছিলাম। তিনি এমন একটি মতামত পেশ করেছিলেন যে, একটি প্রতিরোধের আইভির প্রকৃতির উপর নির্ভর করে, প্রান্তিকতা কাঠামোগতভাবে ঘটনাকে মডেল করার অংশ হিসাবে বিবেচনা করা যেতে পারে। আমি সম্ভবত তার যথাযথ ভাষায় মঙ্গোল করছি, এবং আবারও তার নামটি খুঁজতে আমাকে খনন করতে হবে, তবে আপনি কি এমন কোনও গ্রন্থ জানেন যা এই রেখাগুলি জুড়ে বহুবিধরনের বিষয়ে একটি যুক্তিযুক্ত যুক্তি প্রেরণা জোগাবে? শুধু একটি সুযোগ চান। :)
অ্যালেক্সিস

@ অ্যালেক্সিস দেখে মনে হচ্ছে যে পরিসংখ্যানবিদদের বহুবিধরনের একটি সংক্ষিপ্ত এবং পরিশীলিত ধারণা রয়েছে। আমি স্পষ্টভাবে প্রকাশ করে এমন কোনও পাঠ্যপুস্তক সম্পর্কে ভাবতে অক্ষম।
শুক্র

আমি কেবল তাকে অনুসরণ করতে এবং এটি সম্পর্কে তাকে জিজ্ঞাসা করতে হবে। :)
অ্যালেক্সিস

3

আমি মনে করি এটি পরিস্থিতির উপর নির্ভর করে। আপনি যদি কোনও বিশেষ সমস্যা প্রত্যাশা না করেন তবে সম্ভবত কোনও ক্রমে এগুলি পরীক্ষা করতে পারেন। যদি আপনি অপ্রত্যাশিতদের আশা করেন এবং তাদের সনাক্ত করার পরে তাদের অপসারণের কোনও কারণ থাকতে পারে তবে প্রথমে আউটলিয়ারদের জন্য চেক করুন। মডেলটি সহ অন্যান্য সমস্যাগুলি পর্যবেক্ষণগুলি সরানোর পরে পরিবর্তিত হতে পারে। এরপরে মাল্টিকোলিনারিটি এবং হিটারোসেসেস্টাস্টিটির মধ্যে ক্রমটি কোনও ব্যাপার নয়। আমি ক্রিসের সাথে একমত যে আউটিলারদের যথেচ্ছভাবে অপসারণ করা উচিত নয়। পর্যবেক্ষণগুলি ভুল বলে মনে করার জন্য আপনার কোনও কারণ থাকতে হবে।

অবশ্যই যদি আপনি বহুবিধ প্রতিবন্ধকতা বা ভিন্ন ভিন্নতা পালন করেন তবে আপনাকে আপনার দৃষ্টিভঙ্গি পরিবর্তন করতে হবে। বহুভিত্তিক সমস্যাটি কোভেরিয়েন্স ম্যাট্রিক্সে লক্ষ্য করা যায় তবে বহুবিধরূপ সনাক্তকরণের জন্য নির্দিষ্ট ডায়াগনস্টিক পরীক্ষা রয়েছে এবং অন্যান্য সমস্যা যেমন লিভারেজ পয়েন্টগুলি বেলসলে, কুহ এবং ওয়েলশের রেগ্রেশন ডায়াগনস্টিকস বইটিতে বা ডেনিস কুকের একটি রিগ্রেশন বইয়ের দিকে নজর দেয়


9
মাইকেল, ভবিষ্যতে, আপনি কি বিন্যাস বিকল্পগুলি ব্যবহার করতে পারেন? (লিঙ্কগুলি সন্নিবেশ করানোর সঠিক কীটি সিটিআরএল-এল, সিটিআরএল-সি নয়)।
ব্যবহারকারী 60
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.