আমি একটি বড় ওএলএস রিগ্রেশন চালাচ্ছি যেখানে সমস্ত স্বতন্ত্র ভেরিয়েবল (প্রায় 400) ডামি ভেরিয়েবল। যদি সমস্তগুলি অন্তর্ভুক্ত থাকে, তবে নিখুঁত বহুবিধ লাইনারিটি (ডামি ভেরিয়েবল ট্র্যাপ) রয়েছে, তাই রিগ্রেশন চালানোর আগে আমাকে একটি ভেরিয়েবল বাদ দিতে হবে।
আমার প্রথম প্রশ্নটি হল, কোন পরিবর্তনশীল বাদ দেওয়া উচিত? আমি পড়েছি যে কেবলমাত্র কয়েকটিতে উপস্থিত উপস্থিতির তুলনায় অনেকগুলি পর্যবেক্ষণে উপস্থিত একটি পরিবর্তনশীল বাদ দেওয়া ভাল (উদাহরণস্বরূপ যদি প্রায় সমস্ত পর্যবেক্ষণগুলি "পুরুষ" বা "মহিলা" এবং কেবল কয়েকটি অজানা থাকে তবে "," পুরুষ "বা" মহিলা ") বাদ দিন it এটা কি ন্যায়সঙ্গত?
একটি পরিবর্তনশীল বাদ দেওয়া দিয়ে রিগ্রেশন চালানোর পরে, আমি বাদ দেওয়া ভেরিয়েবলের সহগ মানটি অনুমান করতে সক্ষম হয়েছি কারণ আমি জানি যে আমার সমস্ত স্বতন্ত্র ভেরিয়েবলের সামগ্রিক গড়টি 0 হওয়া উচিত So সুতরাং আমি এই সত্যটি ব্যবহার করে সকলের জন্য সহগের মানগুলি স্থানান্তর করতে পারি use ভেরিয়েবল অন্তর্ভুক্ত করুন এবং বাদ দেওয়া ভেরিয়েবলের জন্য একটি অনুমান পান। আমার পরের প্রশ্নটি হ'ল এখানে কিছু অনুরূপ প্রযুক্তি রয়েছে যা বাদ দেওয়া ভেরিয়েবলের সহগ মানের জন্য মান ত্রুটিটি অনুমান করতে ব্যবহার করা যেতে পারে। এটি হ'ল মূলত বাদ দেওয়া ভেরিয়েবলের সহগের জন্য একটি স্ট্যান্ডার্ড ত্রুটি প্রাক্কলন অর্জন করার জন্য আমাকে আলাদা আলাদা ভেরিয়েবল (এবং প্রথমটি রিগ্রেশনটিতে যে পরিবর্তনশীলটি আমি বাদ দিয়েছিলাম) সহ বাদ দিয়ে আবার চালাতে হবে।
পরিশেষে, আমি লক্ষ্য করেছি যে আমি প্রাপ্ত গুণাগুলি অনুমানগুলি (শূন্যের কাছাকাছি পুনরায় কেন্দ্রের পরে) কোন পরিবর্তনশীল বাদ যায় তার উপর নির্ভর করে কিছুটা পৃথক হয়। তত্ত্ব অনুসারে, একাধিক রিগ্রেশন চালানো ভাল, প্রতিটি আলাদা আলাদা চলক বাদ দিয়ে, এবং তারপরে সমস্ত নিবন্ধগুলি থেকে গুণফলের প্রাক্কলন গড় করা ভাল?