টিবি, এইডস ইত্যাদির মতো বিপর্যয়কর অসুস্থতাগুলি হাসপাতালে ভর্তির ব্যয়কে কতটা প্রভাবিত করে তা অনুমান করার জন্য আমি একটি মডেল চালানোর চেষ্টা করছি। আমার নির্ভরশীল পরিবর্তনশীল হিসাবে "প্রতি হাসপাতালে ভর্তি ব্যয়" এবং স্বতন্ত্র ভেরিয়েবল হিসাবে বিভিন্ন পৃথক চিহ্নিতকারী রয়েছে যার প্রায় সবগুলিই জেন্ডারের মতো ডামি, পরিবারের অবস্থানের প্রধান, দারিদ্র্যের স্থিতি এবং অবশ্যই আপনার অসুস্থতা আছে কিনা তার ডামি রয়েছে (বয়স আরও বেশি) এবং বয়স স্কোয়ার) এবং ইন্টারঅ্যাকশন শর্তাদির একটি গোছা।
যেমনটি আশা করা যায়, সেখানে একটি উল্লেখযোগ্য পরিমাণ রয়েছে - এবং আমার অর্থ প্রচুর পরিমাণে - শূন্যের পাইলড (যেমন, 12 মাসের রেফারেন্স পিরিয়ডে হাসপাতালে ভর্তির জন্য কোনও ব্যয় নয়)। এই জাতীয় ডেটা ব্যবহার করার সর্বোত্তম উপায় কী হবে?
এখন পর্যন্ত আমি ln(1+cost)
সমস্ত পর্যবেক্ষণকে অন্তর্ভুক্ত করতে এবং তারপরে একটি রৈখিক মডেল চালানোর জন্য ব্যয়টিকে রূপান্তর করার সিদ্ধান্ত নিয়েছি । আমি কি সঠিক পথে রয়েছি?