সহজভাবে বলা যায় কারণ আপনার শ্রেণিবদ্ধ বৈশিষ্ট্যগুলির একটি স্তর (এখানে অবস্থান) রিগ্রেশনের জন্য ডামি এনকোডিংয়ের সময় রেফারেন্স গ্রুপ হয়ে যায় এবং তা অপ্রয়োজনীয়। আমি এখানে ফর্মের উদ্ধৃতি দিচ্ছি "কে বিভাগের বা বিভাগগুলির একটি স্পষ্টতামূলক পরিবর্তনশীল, সাধারণত কে -1 ডামি ভেরিয়েবলের ক্রম হিসাবে একটি রিগ্রেশন প্রবেশ করে This এটি স্তর স্তরের মানে লিনিয়ার অনুমানের মতো is"
এটি ইতিমধ্যে এই খুব সুন্দর স্ট্যাটাসে আলোচনা করা হয়েছে st স্ট্যাকেক্সেক্সঞ্জের উত্তর ।
আমাকে বলা হয়েছিল কোর্সেরায় ইয়ানডেক্সের একটি উন্নত কোর্স রয়েছে যা এই বিষয়ে আরও বিশদে কভার করে যদি আপনার এখনও সন্দেহ থাকে তবে এখানে দেখুন । দ্রষ্টব্য আপনি সর্বদা বিনা মূল্যে কোর্সের সামগ্রীটি নিরীক্ষণ করতে পারেন। ;-)
আরেকটি চমৎকার পোস্ট আপনি পরিসংখ্যানগত দৃষ্টিভঙ্গি দিয়ে উদাহরণ প্রচুর সঙ্গে একটি পুঙ্খানুপুঙ্খ ব্যাখ্যা চান যদি না সীমাবদ্ধ হচ্ছে শুধুমাত্র কোডিং ডামি দেখুন এই ইউসিএলএ থেকে (রাঃ) এর
মনে রাখবেন যে আপনি যদি ব্যবহার pandas.get_dummies
করেন তবে একটি প্যারামিটার রয়েছে drop_first
যাতে প্রথম স্তরটি সরিয়ে K-1 ডমিগুলি কে বিভাগীয় স্তর থেকে বের করা যায় কিনা। অনুগ্রহ করে নোট করুন default = False
, এর অর্থ হল যে রেফারেন্সটি বাদ পড়ে না এবং K বিভাগীয় স্তর থেকে কে ডামি তৈরি হয়!