আমার প্রশ্ন হ'ল লজিস্টিক রিগ্রেশন ফিটিংয়ের আগে [0,1] এর মধ্যে সমস্ত ভেরিয়েবলের একই স্কেল রয়েছে কিনা তা নিশ্চিত করার জন্য আমাদের কী ডেটা সেট মানক করা দরকার? সূত্রটি হ'ল:
আমার ডেটা সেটে 2 টি ভেরিয়েবল রয়েছে, তারা দুটি চ্যানেলের জন্য একই জিনিস বর্ণনা করে তবে ভলিউমটি আলাদা। বলুন এটি দুটি স্টোরের গ্রাহকের সংখ্যার সংখ্যা, y এখানে গ্রাহক কেনা কিনা তা এখানে। কারণ কোনও গ্রাহক কেনার আগে দু'বার স্টোর, বা দু'বার প্রথম স্টোর, একবার দ্বিতীয় স্টোরটি দেখতে পারবেন। তবে প্রথম স্টোরের জন্য গ্রাহকের মোট পরিদর্শন দ্বিতীয় স্টোরের চেয়ে 10 গুণ বেশি। আমি যখন এই লজিস্টিক রিগ্রেশন মানানসই, ফিট করি coef(store1)=37, coef(store2)=13
; আমি যদি ডেটা মানক করে রাখি তবে coef(store1)=133, coef(store2)=11
। এটার মতো কিছু. কোন পদ্ধতির আরও বোধগম্য হয়?
আমি যদি সিদ্ধান্তের গাছের মডেলটি ফিট করি? আমি জানি গাছের কাঠামোর মডেলগুলিকে মানককরণের প্রয়োজন নেই যেহেতু মডেল নিজেই এটি কোনওভাবে সামঞ্জস্য করবে। তবে আপনার সকলের সাথে চেক করা হচ্ছে।
C
পরিবর্তন হয়। সুতরাং আপনাকে C
ডেটা মানক করার পরে বেছে নেওয়া দরকার ।