আমি কাগল ( হাউস মূল্য সম্পর্কিত হিউম্যান অ্যানালগের কার্নেল: অ্যাডভান্স রিগ্রেশন টেকনিকস ) এর আবাসন মূল্য প্রতিযোগিতার একটি সমাধানের মধ্য দিয়ে যাচ্ছিলাম এবং এই অংশটি পেরিয়ে এসেছি:
# Transform the skewed numeric features by taking log(feature + 1).
# This will make the features more normal.
from scipy.stats import skew
skewed = train_df_munged[numeric_features].apply(lambda x: skew(x.dropna().astype(float)))
skewed = skewed[skewed > 0.75]
skewed = skewed.index
train_df_munged[skewed] = np.log1p(train_df_munged[skewed])
test_df_munged[skewed] = np.log1p(test_df_munged[skewed])
স্কিউড ডিস্ট্রিবিউশনটিকে একটি সাধারণ বিতরণে রূপান্তরিত করার জন্য প্রয়োজনীয়তা সম্পর্কে আমি নিশ্চিত নই। দয়া করে, কেউ কি বিস্তারিতভাবে ব্যাখ্যা করতে পারেন:
- এখানে কেন এটি করা হচ্ছে? বা এটি কীভাবে সহায়ক?
- বৈশিষ্ট্য-স্কেলিং থেকে এটি কীভাবে আলাদা?
- বৈশিষ্ট্য-প্রকৌশল জন্য এটি কি প্রয়োজনীয় পদক্ষেপ? আমি এই পদক্ষেপটি বাদ দিলে কি ঘটতে পারে?