বেস ডেটা : আমার কাছে মূল্যায়নগুলি সহ ~ 1000 জন চিহ্নিত রয়েছে: '1,' [ভাল] '2,' [মাঝারি] বা '3' [খারাপ] - এই মানগুলি আমি ভবিষ্যতে মানুষের জন্য ভবিষ্যদ্বাণী করার চেষ্টা করছি । এছাড়াও, আমার কাছে কিছু জনসংখ্যার তথ্য আছে: লিঙ্গ (শ্রেণিবদ্ধ: এম / এফ), বয়স (সংখ্যাসূচক: 17-80), এবং জাতি (বিভাগীয়: কালো / ককেশীয় / ল্যাটিনো)।
আমার প্রধানত চারটি প্রশ্ন রয়েছে:
আমি প্রথমে একাধিক রিগ্রেশন বিশ্লেষণ হিসাবে উপরে বর্ণিত ডেটাसेट চালানোর চেষ্টা করছিলাম। তবে আমি সম্প্রতি শিখেছি যেহেতু আমার নির্ভরশীল একটি অর্ডারযুক্ত ফ্যাক্টর এবং একটি অবিচ্ছিন্ন পরিবর্তনশীল নয়, তাই এরকম কোনও কিছুর জন্য আমার সাধারণ লজিস্টিক রিগ্রেশন ব্যবহার করা উচিত। আমি প্রথমে এমন কিছু ব্যবহার করছিলাম
mod <- lm(assessment ~ age + gender + race, data = dataset), আমাকে কি কেউ সঠিক দিকে নির্দেশ করতে পারে?সেখান থেকে, আমি মনে করি যে আমি সহগগুলি পেয়েছি যার সাথে আমি স্বাচ্ছন্দ্য বোধ করছি, আমি বুঝতে পারছি কীভাবে x1, x2 ইত্যাদির জন্য সম্পূর্ণরূপে সংখ্যাসূচক মানগুলি প্লাগ করতে হবে - তবে আমি কীভাবে জাতিদের সাথে কাজ করব, উদাহরণস্বরূপ, যেখানে একাধিক প্রতিক্রিয়া রয়েছে: কালো / ককেশীয় / ল্যাটিনো? সুতরাং যদি এটি আমাকে বলে যে ককেশীয় গুণাগুণটি 0.289 এবং আমি যে কারও কাছে ভবিষ্যদ্বাণী করতে চেষ্টা করছি তা ককেশীয়, আমি কীভাবে এটি পিছনে আনব যেহেতু মানটি সংখ্যাসূচক নয়?
আমার কাছে এলোমেলো মানগুলিও রয়েছে যা অনুপস্থিত - কিছু রেসের জন্য, কিছু লিঙ্গের জন্য ইত্যাদি I এগুলি কিছুই স্কাইং করছে না তা নিশ্চিত করার জন্য আমাকে কি অতিরিক্ত কিছু করতে হবে? (আমি লক্ষ্য করেছি যে যখন আমার ডেটাসেটটি আর-স্টুডিওতে লোড হয়ে যায়, যখন অনুপস্থিত ডেটা লোড হয়ে যায় তখন
NAআর এর মতো কিছু বলে(162 observations deleted due to missingness)- তবে তারা ফাঁকা হিসাবে লোড হয়ে গেলে এটি কিছুই করে না))এই সমস্তটি কার্যকর হয়ে গেছে এবং আমি লিঙ্গ, বয়স, এবং বর্ণ নিয়ে নতুন ডেটা পেয়েছি যার বিষয়ে আমি পূর্বাভাস দিতে চাই - আর নতুন কোনও সহগের সাথে আমার সূত্রটি যে রূপান্তরিত হয়েছে তা থেকে আর কী তা চালানোর সহজ উপায় আছে, ম্যানুয়ালি না করে? (যদি এই প্রশ্নটি এখানে যথাযথ না হয় তবে আমি এটিকে আর ফোরামে ফিরিয়ে নিতে পারি))