বেস ডেটা : আমার কাছে মূল্যায়নগুলি সহ ~ 1000 জন চিহ্নিত রয়েছে: '1,' [ভাল] '2,' [মাঝারি] বা '3' [খারাপ] - এই মানগুলি আমি ভবিষ্যতে মানুষের জন্য ভবিষ্যদ্বাণী করার চেষ্টা করছি । এছাড়াও, আমার কাছে কিছু জনসংখ্যার তথ্য আছে: লিঙ্গ (শ্রেণিবদ্ধ: এম / এফ), বয়স (সংখ্যাসূচক: 17-80), এবং জাতি (বিভাগীয়: কালো / ককেশীয় / ল্যাটিনো)।
আমার প্রধানত চারটি প্রশ্ন রয়েছে:
আমি প্রথমে একাধিক রিগ্রেশন বিশ্লেষণ হিসাবে উপরে বর্ণিত ডেটাसेट চালানোর চেষ্টা করছিলাম। তবে আমি সম্প্রতি শিখেছি যেহেতু আমার নির্ভরশীল একটি অর্ডারযুক্ত ফ্যাক্টর এবং একটি অবিচ্ছিন্ন পরিবর্তনশীল নয়, তাই এরকম কোনও কিছুর জন্য আমার সাধারণ লজিস্টিক রিগ্রেশন ব্যবহার করা উচিত। আমি প্রথমে এমন কিছু ব্যবহার করছিলাম
mod <- lm(assessment ~ age + gender + race, data = dataset)
, আমাকে কি কেউ সঠিক দিকে নির্দেশ করতে পারে?সেখান থেকে, আমি মনে করি যে আমি সহগগুলি পেয়েছি যার সাথে আমি স্বাচ্ছন্দ্য বোধ করছি, আমি বুঝতে পারছি কীভাবে x1, x2 ইত্যাদির জন্য সম্পূর্ণরূপে সংখ্যাসূচক মানগুলি প্লাগ করতে হবে - তবে আমি কীভাবে জাতিদের সাথে কাজ করব, উদাহরণস্বরূপ, যেখানে একাধিক প্রতিক্রিয়া রয়েছে: কালো / ককেশীয় / ল্যাটিনো? সুতরাং যদি এটি আমাকে বলে যে ককেশীয় গুণাগুণটি 0.289 এবং আমি যে কারও কাছে ভবিষ্যদ্বাণী করতে চেষ্টা করছি তা ককেশীয়, আমি কীভাবে এটি পিছনে আনব যেহেতু মানটি সংখ্যাসূচক নয়?
আমার কাছে এলোমেলো মানগুলিও রয়েছে যা অনুপস্থিত - কিছু রেসের জন্য, কিছু লিঙ্গের জন্য ইত্যাদি I এগুলি কিছুই স্কাইং করছে না তা নিশ্চিত করার জন্য আমাকে কি অতিরিক্ত কিছু করতে হবে? (আমি লক্ষ্য করেছি যে যখন আমার ডেটাসেটটি আর-স্টুডিওতে লোড হয়ে যায়, যখন অনুপস্থিত ডেটা লোড হয়ে যায় তখন
NA
আর এর মতো কিছু বলে(162 observations deleted due to missingness)
- তবে তারা ফাঁকা হিসাবে লোড হয়ে গেলে এটি কিছুই করে না))এই সমস্তটি কার্যকর হয়ে গেছে এবং আমি লিঙ্গ, বয়স, এবং বর্ণ নিয়ে নতুন ডেটা পেয়েছি যার বিষয়ে আমি পূর্বাভাস দিতে চাই - আর নতুন কোনও সহগের সাথে আমার সূত্রটি যে রূপান্তরিত হয়েছে তা থেকে আর কী তা চালানোর সহজ উপায় আছে, ম্যানুয়ালি না করে? (যদি এই প্রশ্নটি এখানে যথাযথ না হয় তবে আমি এটিকে আর ফোরামে ফিরিয়ে নিতে পারি))