সর্বশেষ জাতীয় হাসপাতালের স্রাব জরিপের তথ্য বিশ্লেষণ করার সময় আমি ঠিক একই প্রশ্নটি নিয়ে ভাবছিলাম । বেশ কয়েকটি ভেরিয়েবলের বৈবাহিক অবস্থা এবং পদ্ধতির ধরণের মতো যথেষ্ট পরিমাণে অনুপস্থিত মান রয়েছে। এই বিষয়টি আমার নজরে আসে কারণ এই বিভাগগুলি আমি চালিয়ে যাচ্ছিলাম বেশিরভাগ লজিস্টিক রিগ্রেশন বিশ্লেষণে শক্তিশালী (এবং উল্লেখযোগ্য) প্রভাব সহ প্রদর্শিত হয়েছিল showed
কেউ কেন অবাক হওয়ার দিকে ঝুঁকছেএকটি অনুপস্থিত কোড দেওয়া হয়েছে বৈবাহিক স্থিতির ক্ষেত্রে, উদাহরণস্বরূপ, এটি প্রশংসনীয় যে এই তথ্য সরবরাহ করতে ব্যর্থতা আর্থ-সামাজিক অবস্থান বা রোগের ধরণের মতো গুরুত্বপূর্ণ কারণগুলির সাথে যুক্ত হতে পারে। আপনার উচ্চ রক্তচাপের ক্ষেত্রে, আমাদের জিজ্ঞাসা করা উচিত কেন মানটি জানা বা প্রত্যাখ্যান করা হবে না? এটি প্রতিষ্ঠানের অনুশীলনের সাথে সম্পর্কিত হতে পারে (সম্ভবত শিথিল পদ্ধতিগুলি প্রতিফলিত করে) বা এমনকি ব্যক্তিদের সাথে (যেমন ধর্মীয় বিশ্বাস)। সেই বৈশিষ্ট্যগুলি ডায়াবেটিসের সাথে যুক্ত হতে পারে be অতএব, এই মূল্যবোধগুলি অনুপস্থিত হিসাবে কোডিং না করে (এর ফলে তাদের পুরোপুরি বিশ্লেষণ থেকে বাদ দেওয়া) বা মানগুলি (যেগুলি তারা প্রদত্ত তথ্যকে কার্যকরভাবে মাস্ক করে এবং ফলাফলকে পক্ষপাতিত্ব করতে পারে) চিহ্নিত করার চেষ্টা করার পরিবর্তে আপনার যেমন আছে তেমন বুদ্ধিমান বলে মনে হচ্ছে। আসলে এটি করা আর কোনও কঠিন নয়: আপনাকে কেবল এটি নিশ্চিত করতে হবে যে এই পরিবর্তনশীলটিকে শ্রেণিবদ্ধ হিসাবে বিবেচনা করা হয় এবং আপনি রিগ্রেশন আউটপুটটিতে আরও একটি গুণফল পাবেন। তদুপরি, আমি সন্দেহ করি বিআরএফএসএস ডেটাসেটগুলি এত বড় যে আপনাকে পাওয়ার সম্পর্কে চিন্তা করতে হবে না।