আমার কাছে এখান থেকে ওয়াইন ডেটা রয়েছে যার মধ্যে 0 টি 10 এবং 10 এর মধ্যে মানগুলির সাথে প্রতিটি এন্ট্রির সাথে সম্পর্কিত একটি নির্ভরযোগ্য রেটিং সহ 11 সংখ্যাগত স্বতন্ত্র ভেরিয়েবলগুলি থাকে এটি ভেরিয়েবল এবং এর সাথে সম্পর্কিত তদন্ত করার জন্য একটি রিগ্রেশন মডেল ব্যবহার করে একটি দুর্দান্ত ডেটাসেট তৈরি করে রেটিং। তবে, লিনিয়ার রিগ্রেশন কি যথাযথ হবে, বা বহুজাতিক / আদেশযুক্ত লজিস্টিক রিগ্রেশন ব্যবহার করা ভাল?
লজিস্টিক রিগ্রেশন নির্দিষ্ট নির্দিষ্ট বিভাগগুলিকে দেওয়া ভাল বলে মনে হয়, যেমন একটি অবিচ্ছিন্ন নির্ভরশীল পরিবর্তনশীল নয় তবে (1) 11 টি বিভাগ রয়েছে (কিছুটা অনেক বেশি?) এবং (2) পরিদর্শন করার পরে, কেবল এই বিভাগগুলির 6-7 এর জন্য কেবলমাত্র ডেটা রয়েছে ডেটাসেটে 5-4 বিভাগগুলির কোনও উদাহরণ নেই।
অন্যদিকে, লিনিয়ার রিগ্রেশন 0-10-এর মধ্যে রেটিংকে রৈখিকভাবে অনুমান করা উচিত যা আমি অনুসন্ধান করার চেষ্টা করছি তার কাছাকাছি মনে হয়; তথাপি নির্ভরশীল ভেরিয়েবল ডেটাসেটে অবিচ্ছিন্ন নয়।
ভাল পদ্ধতির কোনটি? দ্রষ্টব্য: আমি বিশ্লেষণের জন্য আর ব্যবহার করছি
উত্তরে বর্ণিত কিছু পয়েন্ট সম্বোধন করে সম্পাদনা করুন:
- ব্যবসায়ের কোনও লক্ষ্য নেই কারণ এটি প্রকৃতপক্ষে কোনও বিশ্ববিদ্যালয় কোর্সের জন্য। কাজটি হ'ল আমি যে কোনও উপায়ে ফিট দেখলে পছন্দের একটি ডেটাসেট বিশ্লেষণ করা।
- রেটিংগুলির বিতরণটি সাধারণ দেখায় (হিস্টোগ্রাম / কিউকিউ প্লট)। ডেটাসেটের আসল মানগুলি 3-8 এর মধ্যে (যদিও প্রযুক্তিগতভাবে 0-10)।