আমি একটি সীমাবদ্ধ জনসংখ্যার মধ্যে বিরল ঘটনা অধ্যয়ন করতে চাই। যেহেতু আমি কোন কৌশলটি সর্বোত্তমভাবে উপযুক্ত সে সম্পর্কে আমি অনিশ্চিত, তাই আমি এই বিষয়ে সম্পর্কিত টিপস এবং রেফারেন্সগুলির প্রশংসা করব, যদিও আমি এটি ভালভাবে জানি যে এটি মূলত কভার করা হয়েছে। আমি ঠিক জানি না কোথা থেকে শুরু করব।
আমার সমস্যাটি একটি রাজনৈতিক বিজ্ঞান এবং আমার সীমাবদ্ধ জনসংখ্যা রয়েছে ৫১৫,৮৪৩ রেকর্ডস নিয়ে। তারা 513,334 "0" গুলি এবং 2,509 "1" s এর সাথে বাইনারি নির্ভরশীল চলকটির সাথে সম্পর্কিত। আমি আমার "1" গুলি বিরল ইভেন্ট হিসাবে মুদ্রণ করতে পারি যেহেতু তারা জনসংখ্যার কেবল 0.49%।
আমার প্রায় 10 টি স্বতন্ত্র ভেরিয়েবলের একটি সেট রয়েছে আমি "1" এর উপস্থিতি ব্যাখ্যা করার জন্য একটি মডেল তৈরি করতে চাই। আমাদের অনেকের মত, আমি কিং ও জেং এর 2001 এর বিরল ঘটনা সংশোধন সম্পর্কিত নিবন্ধটি পড়েছি । তাদের পদ্ধতির ক্ষেত্রে "0" এর সংখ্যা হ্রাস করতে কেস-নিয়ন্ত্রণ নকশা ব্যবহার করা হয়েছিল, তারপরে ইন্টারসেপ্টে সংশোধন প্রয়োগ করুন।
তবে এই পোস্টে বলা হয়েছে যে আমি ইতিমধ্যে পুরো জনসংখ্যার উপরে আমার ডেটা সংগ্রহ করে নিলে কিং ও জেংয়ের যুক্তি প্রয়োজন ছিল না, এটি আমার ক্ষেত্রে case অতএব, আমাকে ক্লাসিকাল লগিট মডেলটি ব্যবহার করতে হবে। দুর্ভাগ্যক্রমে আমার জন্য, যদিও আমি ভাল উল্লেখযোগ্য সহগ অর্জন করি, আমার মডেলটি পূর্বাভাসের দিক থেকে সম্পূর্ণ অকেজো (আমার "1" s এর 99.48% পূর্বাভাস দিতে ব্যর্থ হয়)।
কিং ও জেংয়ের নিবন্ধটি পড়ার পরে, আমি কেস-নিয়ন্ত্রণ নকশা চেষ্টা করতে চেয়েছিলাম এবং সমস্ত "1" এর সাথে "0" এর মাত্র 10% নির্বাচন করেছি। প্রায় একই সহগ সহ, মডেল সম্পূর্ণ জনসংখ্যার জন্য প্রয়োগ করা হলে "1" এর প্রায় এক তৃতীয়াংশ পূর্বাভাস দিতে সক্ষম হয়েছিল। অবশ্যই, অনেকগুলি মিথ্যা-পজিটিভ রয়েছে।
আমি আপনাকে তিনটি প্রশ্ন জিজ্ঞাসা করতে চাই:
1) আপনার জনসংখ্যার সম্পূর্ণ জ্ঞান থাকা অবস্থায় যদি কিং এবং জেং এর দৃষ্টিভঙ্গি পূর্বঘটিত হয়, তবে তারা কেন এমন পরিস্থিতি ব্যবহার করবেন যেখানে তারা তাদের নিবন্ধে জনসংখ্যাকে জানেন তাদের বক্তব্য প্রমাণ করার জন্য?
2) যদি আমার কোনও লজিট রিগ্রেশনটিতে ভাল এবং তাত্পর্যপূর্ণ সহগ থাকে তবে খুব দুর্বল ভবিষ্যদ্বাণীমূলক শক্তি থাকে, তার মানে কি এই ভেরিয়েবল দ্বারা ব্যাখ্যা করা বৈকল্পিক অর্থহীন?
3) বিরল ঘটনা মোকাবেলার জন্য সর্বোত্তম পন্থা কোনটি? আমি কিংয়ের রিলজিট মডেল, ফर्थের অ্যাপ্রোচ, সঠিক লজিট ইত্যাদি সম্পর্কে পড়েছি, আমাকে অবশ্যই স্বীকার করতে হবে যে আমি এই সমস্ত সমাধানগুলির মধ্যে একটি হারিয়েছি।