সাধারণীকরণীয় রৈখিক মডেল ধরে নেওয়া


14

আমি একটি একক প্রতিক্রিয়া ভেরিয়েবল (অবিচ্ছিন্ন / সাধারণত বিতরণ করা) এবং 4 ব্যাখ্যামূলক ভেরিয়েবল (যার মধ্যে 3 টি উপাদান এবং চতুর্থটি পূর্ণসংখ্যা) দিয়ে জেনারাইজড লিনিয়ার মডেল তৈরি করেছি। আমি একটি পরিচয় লিঙ্ক ফাংশন সহ গাউসীয় ত্রুটি বিতরণ ব্যবহার করেছি। আমি বর্তমানে যাচাই করছি যে মডেলটি সাধারণ রৈখিক মডেলের অনুমানগুলি সন্তুষ্ট করে, যা হ'ল:

  1. ওয়াই এর স্বাধীনতা
  2. সঠিক লিঙ্ক ফাংশন
  3. ব্যাখ্যামূলক ভেরিয়েবলগুলি পরিমাপের সঠিক স্কেল
  4. কোন প্রভাবশালী পর্যবেক্ষণ

আমার প্রশ্নটি: আমি কীভাবে পরীক্ষা করতে পারি যে মডেল এই অনুমানগুলি সন্তুষ্ট করে? সেরা প্রারম্ভিক বিন্দুটি প্রতিটি ব্যাখ্যামূলক ভেরিয়েবলের বিপরীতে প্রতিক্রিয়ার পরিবর্তনশীলটিকে প্লট করে বলে মনে হচ্ছে। যাইহোক, ব্যাখ্যামূলক ভেরিয়েবলগুলির মধ্যে 3টি শ্রেণিবদ্ধ (1-4 স্তরের সহ), তাই প্লটগুলিতে আমার কী সন্ধান করা উচিত?

এছাড়াও, ব্যাখ্যামূলক ভেরিয়েবলগুলির মধ্যে আমার বহুবিধ লাইনারি এবং ইন্টারঅ্যাকশন পরীক্ষা করা উচিত? যদি হ্যাঁ, আমি কীভাবে শ্রেণিবদ্ধ ব্যাখ্যামূলক ভেরিয়েবলগুলি দিয়ে এটি করব?

উত্তর:


20

আমি মনে করি এটি সাধারণীকৃত লিনিয়ার মডেল হিসাবে ওভারকিল হিসাবে ভাবার চেষ্টা করা হয়েছে । আপনার কাছে যা আছে তা হ'ল একটি পুরানো রিগ্রেশন মডেল। আরও সুনির্দিষ্টভাবে, কারণ আপনার কিছু স্পষ্টিকর ব্যাখ্যাযোগ্য ভেরিয়েবল এবং একটি অবিচ্ছিন্ন ইভি রয়েছে তবে তাদের মধ্যে কোনও ইন্টারঅ্যাকশন নেই, এটিকে ক্লাসিক এএনসিওএও বলা যেতে পারে।

আমি বলব যে # 3 সত্যিই এখানে এমন একটি অনুমান নয় যে সম্পর্কে আপনার চিন্তা করা দরকার। না, এই বিষয়টির জন্য, আপনার কি # 2 নিয়ে সত্যই চিন্তা করার দরকার নেই। পরিবর্তে, আমি দুটি পৃথক অনুমান দিয়ে এগুলি দমন করব:

2 '। বৈকল্পিক
3 'এর একজাতীয়তা । অবশিষ্টাংশের স্বাভাবিকতা

তদ্ব্যতীত, # 4 এটি যাচাই করা গুরুত্বপূর্ণ বিষয়, তবে আমি এটিকে সত্যিকার অর্থে অনুমান হিসাবে ভাবি না । অনুমানগুলি কীভাবে চেক করা যায় সে সম্পর্কে ভাবা যাক।

ডেটা কীভাবে দাঁড়ায় এবং কীভাবে সেগুলি সংগ্রহ করা হয়েছিল তা ভেবে স্বাধীনতার প্রায়শই প্রথমে 'পরীক্ষা করা' হয় । উপরন্তু, এটি একটি ভালো জিনিস ব্যবহার চেক করা যাবে রানে পরীক্ষা , ডার্বিন-ওয়াটসন পরীক্ষা বা প্যাটার্ন পরীক্ষা autocorrelations --you এছাড়াও সন্ধান করতে পারেন আংশিক autocorrelations । (মনে রাখবেন যে এগুলি কেবল আপনার অবিচ্ছিন্ন কোভারিয়ারের তুলনায় মূল্যায়ন করা যেতে পারে))

প্রাথমিকভাবে শ্রেণীবদ্ধমূলক ব্যাখ্যাযোগ্য ভেরিয়েবলগুলির সাথে, আপনার উপাদানগুলির প্রতিটি স্তরে ভেরিয়েন্স গণনা করে বৈকল্পিকের একজাতীয়তা পরীক্ষা করা যেতে পারে। এগুলি গণনা করার পরে, বেশ কয়েকটি টেস্ট ব্যবহার করা হয় যা তারা প্রাথমিকভাবে লেভেনের পরীক্ষা , তবে ব্রাউন-ফোর্সেইথ পরীক্ষা সম্পর্কে একই কিনা তা পরীক্ষা করার জন্য ব্যবহৃত হয় । পরীক্ষা, এছাড়াও হার্টলি টেস্ট বলা হয় না বাঞ্ছনীয়; আপনি যদি এটির বিষয়ে আরও কিছু তথ্য চান তবে আমি এটি এখানে আলোচনা করবFmax। (নোট করুন যে এই পরীক্ষাগুলি উপরে বর্ণিত আপনার শ্রেণীবদ্ধ কোভেরিয়াতগুলিতে প্রয়োগ করা যেতে পারে)) একটি অবিচ্ছিন্ন ইভিয়ের জন্য, আমি কেবল আমার অবশিষ্টাংশগুলিকে অবিচ্ছিন্ন কোভারিয়েটের বিরুদ্ধে চক্রান্ত করতে এবং সেগুলি আরও একদিকে বা অন্যদিকে ছড়িয়ে পড়ে কিনা তা দেখার জন্য তাদের দৃষ্টি নিবদ্ধ করে পরীক্ষা করতে চাই।

অবশিষ্টাংশ সেই স্বাভাবিকত্বের কারণটি কিছু পরীক্ষার মাধ্যমে মূল্যায়ন করা যেতে পারে, মত শাপিরো-Wilk , অথবা Kolmogorov-Smirnov পরীক্ষা , কিন্তু প্রায়ই সেরা একটি মাধ্যমে চাক্ষুষরূপে পরিমাপ করা হয় QQ-চক্রান্ত । (নোট করুন যে এই অনুমানটি সাধারণত সেটটির মধ্যে সবচেয়ে কম গুরুত্বপূর্ণ; যদি এটি পূরণ না করা হয় তবে আপনার বিটা অনুমানটি এখনও পক্ষপাতহীন থাকবে , তবে আপনার পি-মানগুলি সঠিক হবে না))

আপনার পৃথক পর্যবেক্ষণের প্রভাব মূল্যায়ন করার বিভিন্ন উপায় রয়েছে । এটি সূচকযুক্ত এমন সংখ্যাসূচক মানগুলি পাওয়া সম্ভব, তবে আমার প্রিয় উপায়টি যদি আপনি এটি করতে পারেন তবে তা হ'ল আপনার ডেটা জ্যাকনিফ করা। এটি হ'ল, আপনি প্রতিটি ডেটা পয়েন্ট ঘুরে ফেলে আপনার মডেলটিকে আবার ফিট করে। তারপরে আপনি পর্যালোচনা করতে পারেন যে যদি আপনার বেটাস চারদিকে কতটা বাউন্স হয় যদি সেই পর্যবেক্ষণটি আপনার ডেটাসেটের অংশ না হয়। এই পরিমাপকে ডফবেটা বলা হয় । এর জন্য কিছুটা প্রোগ্রামিং দরকার, তবে এমন কিছু মানক উপায় রয়েছে যা সফ্টওয়্যার প্রায়শই স্বয়ংক্রিয়ভাবে আপনার জন্য গণনা করতে পারে। এর মধ্যে রয়েছে লিভারেজ এবং কুকের দূরত্ব

আপনার প্রশ্নের বিষয়ে যেমনটি বলা হয়েছে, আপনি যদি লিঙ্ক ফাংশন এবং সাধারণীকরণীয় রৈখিক মডেল সম্পর্কে আরও জানতে চান তবে আমি এখানে মোটামুটি বিস্তারিত আলোচনা করেছি । মূলত, একটি উপযুক্ত লিঙ্ক ফাংশন নির্বাচন করার জন্য বিবেচনা করা সবচেয়ে গুরুত্বপূর্ণ বিষয়টি আপনার প্রতিক্রিয়া বিতরণের প্রকৃতি; যেহেতু আপনি বিশ্বাস করেন যে গাউসিয়ান, তাই পরিচয় লিঙ্কটি উপযুক্ত এবং আপনি রিগ্রেশন মডেল সম্পর্কে স্ট্যান্ডার্ড ধারণা ব্যবহার করে এই পরিস্থিতি সম্পর্কে ভাবতে পারেন। Y

"ব্যাখ্যামূলক ভেরিয়েবলগুলির পরিমাপের সঠিক স্কেল" সম্পর্কিত, আমি আপনাকে স্টিভেনের পরিমাপের স্তরের (যেমন, শ্রেণিবদ্ধ, নিয়মিত, অন্তর এবং অনুপাত) উল্লেখ করছি। উপলব্ধি করা প্রথম জিনিস (ক্ষীণ আলো এর সহ) যে রিগ্রেশন পদ্ধতি না হয় না ব্যাখ্যামূলক ভেরিয়েবল সম্পর্কে অনুমানের করা, পরিবর্তে, যা পদ্ধতিতে আপনি আপনার মডেল আপনার ব্যাখ্যামূলক বিকল্পগুলি ব্যবহার আপনার প্রতিফলিত বিশ্বাসের তাদের সম্পর্কে। তদুপরি, আমি মনে করি স্টিভেনের স্তরগুলি ওভারপ্লেড হয়েছে; এই বিষয়ের আরও তাত্ত্বিক চিকিত্সার জন্য, এখানে দেখুন


1
যেহেতু ওপিতে একটি লিঙ্ক ফাংশন অন্তর্ভুক্ত ছিল আমি মনে করি তিনি সত্যই একটি সাধারণীকরণিত রৈখিক মডেল বোঝাতে চেয়েছিলেন যেখানে একটি লিঙ্ক ফাংশন ওয়াইয়ের সাথে প্রয়োগ করা হয় Also এছাড়াও আমি অনুমান হিসাবে Y এর স্বাধীনতা বলব। আমার ধারণা অনুমান করা আরও সঠিকভাবে হয় যে মডেলের ত্রুটি উপাদানগুলি স্বাধীন। প্রদত্ত যে আমি মনে করি গুং যা লিখেছেন তার বাকীটি সঠিক।
মাইকেল আর চেরনিক

@ মিশেল চের্নিক, আমি আপনার সাথে একমত এই সমস্যাগুলি সমাধান করার জন্য আমি আমার উত্তরটি সম্পাদনা করেছি। আপনার যদি মনে হয় এটি আরও কাজের প্রয়োজন পরে আমাকে জানান know
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.