বলি যে আমি একটি চলচ্চিত্র এম এর জন্য লজিস্টিক শ্রেণিবদ্ধ তৈরি করতে চাই। আমার বৈশিষ্ট্যগুলি ব্যক্তির বয়সের মতো, লিঙ্গ, পেশা, অবস্থানের মতো কিছু হবে। প্রশিক্ষণের সেটটি এমন কিছু হবে:
- বয়স লিঙ্গ পেশার অবস্থানের মতো (1) / অপছন্দ (0)
- 23 এম সফটওয়্যার মার্কিন 1
- 24 এফ ডাক্তার ইউ কে 0
এবং এইভাবেই .... এখন আমার প্রশ্ন হল কীভাবে আমার বৈশিষ্ট্যগুলি স্কেল এবং উপস্থাপন করা উচিত। একটি উপায় আমি ভেবেছিলাম: বয়সকে গ্রুপের হিসাবে ভাগ করুন, সুতরাং 18-25, 25-35, 35-উপরে, এম, এফ, জেন্ডার হিসাবে মার্কিন, যুক্তরাজ্য, অন্যান্য। এখন এই সমস্ত মানগুলির জন্য একটি বাইনারি বৈশিষ্ট্য তৈরি করুন, অতএব বয়সের প্রত্যেকটি বয়সের সাথে সম্পর্কিত হবে বাইনারি বৈশিষ্ট্য প্রতিটি বয়সের সাথে সম্পর্কিত এবং অন্যান্য। সুতরাং, মার্কিন যুক্তরাষ্ট্রের একজন 28 বছর বয়সী পুরুষ 010 10 100 (010-> বয়স গ্রুপ 25-35, 10 -> পুরুষ, 100 -> মার্কিন) হিসাবে প্রতিনিধিত্ব করা হবে
এখানে বৈশিষ্ট্য উপস্থাপনের সেরা উপায় কী হতে পারে? এছাড়াও, আমি কিছু ই-জিএস-তে লক্ষ্য করেছি স্কেলেনের যে সমস্ত বৈশিষ্ট্য কোনও উপায়ে স্কেল / নরমাল করা হয়েছে, যেমন জেন্ডারটি দুটি মান দ্বারা প্রতিনিধিত্ব করা হয়, পুরুষ এবং মহিলা জন্য 0.0045 এবং -.0.0045। এভাবে স্কেলিং / মর্মালাইজেশন কীভাবে করা যায় সে সম্পর্কে আমার কোনও ধারণা নেই?