আমি এই প্রশ্নটি দুটি অংশে বলতে চাই। উভয়ই জেনারেলাইজড লিনিয়ার মডেলের সাথে লেনদেন করে তবে প্রথমটি মডেল নির্বাচনের সাথে এবং অন্যান্যগুলি নিয়মিতকরণের সাথে ডিল করে।
পটভূমি: আমি পূর্বাভাস এবং বর্ণনা উভয় জন্য GLMs (লিনিয়ার, লজিস্টিক, গামা রিগ্রেশন) মডেল ব্যবহার করি। যখন আমি " সাধারণ জিনিসগুলি একটি প্রতিরোধের সাথে করায়" উল্লেখ করি তখন আমি মূলত (i) সহগের আশেপাশের আত্মবিশ্বাসের সাথে বর্ণনাকে বোঝাতে চাইছি, (ii) পূর্বাভাসের চারপাশে আত্মবিশ্বাসের বিরতি এবং (iii) সহগের রৈখিক সংমিশ্রণ সম্পর্কিত অনুমানের পরীক্ষা যেমন " চিকিত্সা এ এবং চিকিত্সা বি মধ্যে পার্থক্য আছে? "।
আপনি কি নীচের প্রতিটিের অধীনে সাধারণ তত্ত্ব ব্যবহার করে বৈধভাবে এই জিনিসগুলি করার ক্ষমতা হারাবেন? এবং যদি তা হয় তবে খাঁটি ভবিষ্যদ্বাণী করার জন্য ব্যবহৃত মডেলগুলির জন্য কি এই জিনিসগুলি সত্যই ভাল?
I. যখন কোনও জিএলএম কিছু মডেল বাছাই প্রক্রিয়াটির মাধ্যমে ফিট করে থাকে (এককভাবে এটি এআইসি ভিত্তিক ধাপে ধাপে ধাপে ধাপে ধাপে বলে)।
২। যখন কোনও জিএলএম নিয়মিতকরণ পদ্ধতির মাধ্যমে ফিট হয়ে থাকে (তখন আর-তে গ্ল্যামনেট ব্যবহার করে বলুন)।
আমার ইন্দ্রিয় যে আই জন্য উত্তর টেকনিক্যালি যে আপনি "এর জন্য একটি বুটস্ট্র্যাপ ব্যবহার করা উচিত নয় স্বাভাবিক জিনিষ এক একটি রিগ্রেশন কিছু করে ", কিন্তু কোন এক সত্যিই যে মেনে চলে।
যোগ করুন:
কয়েকটি প্রতিক্রিয়া পাওয়ার পরে এবং অন্য কোথাও পড়ার পরে, আমার এটি গ্রহণ করা (অন্য কারও উপকারের পাশাপাশি সংশোধন পাওয়ার জন্য)।
I.
A) RE: ত্রুটি সাধারণকরণ। নতুন ডেটাতে ত্রুটি হারগুলি সাধারণ করতে, যখন কোনও হোল্ড আউট সেট নেই, ক্রস বৈধকরণ কাজ করতে পারে তবে নেস্ট লুপগুলি ব্যবহার করে - প্রতিটি ফোল্ডের জন্য আপনাকে প্রক্রিয়াটি সম্পূর্ণরূপে পুনরাবৃত্তি করতে হবে - সুতরাং কোনও বৈশিষ্ট্য নির্বাচন, প্যারামিটারের টিউনিং ইত্যাদি হওয়া আবশ্যক প্রতিটি সময় স্বাধীনভাবে সম্পন্ন। এই ধারণাটি কোনও মডেলিং প্রচেষ্টা (দণ্ডিত পদ্ধতি সহ) ধরে রাখা উচিত।
খ) আরই: হাইপোথিসিস টেস্টিং এবং জিএলএমের আত্মবিশ্বাসের অন্তরগুলি।জেনারালাইজড রৈখিক মডেলের জন্য মডেল নির্বাচন (বৈশিষ্ট্য নির্বাচন, প্যারামিটার টিউনিং, ভেরিয়েবল নির্বাচন) এবং হোল্ড আউট সেট বিদ্যমান থাকাকালীন কোনও পার্টিশনে মডেলটিকে প্রশিক্ষণ দেওয়া এবং তারপরে বাকী ডেটা বা পুরো ডেটা সেটে মডেলটি ফিট করা অনুমোদিত এবং হাইপোথিসিস টেস্টগুলি সম্পাদন করতে সেই মডেল / ডেটা ব্যবহার করুন ইত্যাদি a যদি কোনও হোল্ড আউট সেট বিদ্যমান না থাকে তবে যতক্ষণ না প্রতিটি বুটস্ট্র্যাপ নমুনার জন্য সম্পূর্ণ প্রক্রিয়া পুনরাবৃত্তি হয় ততক্ষণ একটি বুটস্ট্র্যাপ ব্যবহার করা যেতে পারে। এটি হাইপোথিসিস পরীক্ষাগুলি সীমাবদ্ধ করে যেগুলি করা যেতে পারে যদিও সম্ভবত একটি পরিবর্তনশীল সর্বদা উদাহরণ হিসাবে নির্বাচিত হবে না।
গ) আরআর: ভবিষ্যতের ডেটা সেটগুলিতে পূর্বাভাসের বিষয়ে নয়, তারপরে তত্ত্ব দ্বারা পরিচালিত একটি উদ্দেশ্যমূলক মডেল এবং কয়েকটি হাইপোথিসিস পরীক্ষাগুলি ফিট করুন এবং এমনকি মডেলটিতে সমস্ত পরিবর্তনশীল রেখে যাওয়ার বিষয়টি বিবেচনা করুন (তা উল্লেখযোগ্য বা না) (হোসমার এবং লেমশোর লাইনে)। এটি ছোট পরিবর্তনশীল সেট ধ্রুপদী ধরণের রিগ্রেশন মডেলিং এবং তারপরে সিআই এবং হাইপোথিসিস পরীক্ষার ব্যবহারের অনুমতি দেয়।
ডি) আরই: দণ্ডিত রিগ্রেশন। কোনও পরামর্শ নেই, সম্ভবত এটি কেবল পূর্বাভাসের জন্য উপযুক্ত বিবেচনা করুন (বা উপরের বি হিসাবে অন্য ডেটা সেট সেট করার জন্য বৈশিষ্ট্য নির্বাচনের একধরণের হিসাবে) যেহেতু প্রবর্তিত পক্ষপাতটি সিআই এবং হাইপোথিসিস পরীক্ষাকে বোকামি করে তোলে - এমনকি বুটস্ট্র্যাপের সাথেও।