আমার কাছে বড় জরিপের ডেটা, একটি বাইনারি ফলাফল পরিবর্তনশীল এবং বাইনারি এবং অবিচ্ছিন্ন সহ অনেক ব্যাখ্যামূলক ভেরিয়েবল রয়েছে। আমি মডেল সেটগুলি তৈরি করছি (উভয়টি জিএলএম এবং মিশ্রিত জিএলএমের সাথে পরীক্ষামূলক) এবং শীর্ষ মডেলটি নির্বাচন করতে তথ্য তাত্ত্বিক পদ্ধতির ব্যবহার করছি। আমি সংশ্লেষের জন্য ব্যাখ্যাগুলি (ধারাবাহিক এবং শ্রেণিবদ্ধ উভয়) সাবধানতার সাথে পরীক্ষা করেছি এবং আমি কেবল একই মডেলটিতে তাদের ব্যবহার করছি যা পিয়ারসন বা ফিকরর কোফ ০.৩ এর কম। আমি আমার সমস্ত ধ্রুবক ভেরিয়েবলকে শীর্ষ মডেলের পক্ষে প্রতিযোগিতায় ন্যায্য সুযোগ দিতে চাই। আমার অভিজ্ঞতায়, স্কু-এর উপর ভিত্তি করে যাদের এটির প্রয়োজন তাদেরকে রূপান্তর করা তাদের অংশীদারদের (নিম্নতর এআইসির) উন্নতি করে।
আমার প্রথম প্রশ্ন হ'ল: এই উন্নতি হ'ল কারণ রূপান্তরটি লজিটের সাথে রৈখিকতার উন্নতি করে? অথবা স্কু সংশোধন করে ডেটাটিকে আরও বেশি প্রতিসাম্য তৈরি করে ব্যাখ্যামূলক ভেরিয়েবলের ভারসাম্যকে কোনওভাবে উন্নত করা হয়? আমি আশা করি আমি এর পিছনে গাণিতিক কারণগুলি বুঝতে পেরেছি তবে আপাতত, কেউ যদি সহজ শর্তে এটি ব্যাখ্যা করতে পারে তবে তা দুর্দান্ত। আপনার যদি আমি ব্যবহার করতে পারি এমন কোনও রেফারেন্স থাকে তবে আমি সত্যিই এটির প্রশংসা করব।
অনেক ইন্টারনেট সাইট বলে যে বাইনারি লজিস্টিক রিগ্রেশনটিতে স্বাভাবিকতা অনুমান নয়, ভেরিয়েবলগুলি রূপান্তর করবেন না। তবে আমি অনুভব করি যে আমার ভেরিয়েবলগুলি রূপান্তর না করে আমি অন্যের তুলনায় কিছুটা অসুবিধে রেখেছি এবং এটি শীর্ষ মডেলটি কী তা প্রভাবিত করতে পারে এবং অনুমিতিকে পরিবর্তন করে (ভাল, এটি সাধারণত হয় না তবে কিছু ডেটাসেটে এটি করে)। আমার কিছু ভেরিয়েবলগুলি লগের রূপান্তরিত হওয়ার সময় আরও ভাল সম্পাদন করে, কিছু যখন স্কোয়ার (স্কিউয়ের বিভিন্ন দিক) এবং কিছু অপরিবর্তিত থাকে।
লজিস্টিক রিগ্রেশনের জন্য ব্যাখ্যামূলক ভেরিয়েবলগুলি রুপান্তরিত করার সময় কি সাবধানতা অবলম্বন করা উচিত এবং যদি তা না করে তবে কেউ কেন আমাকে একটি গাইডলাইন দিতে সক্ষম হবেন?