এসভিএম এবং র্যান্ডম ফরেস্টের জন্য নরমালাইজেশন করা কি প্রয়োজনীয়?


29

আমার বৈশিষ্ট্যগুলির প্রতিটি মাত্রার মান আলাদা আলাদা থাকে। আমি জানতে চাই যে এই ডেটাসেটটি স্বাভাবিক করার জন্য প্রয়োজনীয়।

উত্তর:


29

আপনার প্রশ্নের উত্তর নির্ভর করে আপনি কোন মিল / দূরত্বের ফাংশনটি ব্যবহার করার পরিকল্পনা করছেন তার উপর (এসভিএমগুলিতে)। এটি যদি সাধারণ (অচেতন) ইউক্লিডিয়ান দূরত্ব হয় তবে আপনি যদি নিজের ডেটাটিকে সাধারণীকরণ না করেন তবে আপনি অজান্তে কিছু বৈশিষ্ট্য অন্যদের চেয়ে বেশি গুরুত্ব দিচ্ছেন।

উদাহরণস্বরূপ, যদি আপনার প্রথম মাত্রা 0-10 থেকে এবং দ্বিতীয় মাত্রা 0-1 থেকে থাকে তবে প্রথম মাত্রায় 1 এর একটি পার্থক্য (মাত্রার দশমাংশ) দু'দিক থেকে আলাদা আলাদা মান হিসাবে দূরত্বের গণনায় যতটা অবদান রাখে? দ্বিতীয় মাত্রা (0 এবং 1)। সুতরাং এটি করার দ্বারা, আপনি প্রথম মাত্রায় ছোট পার্থক্যটি অতিরঞ্জিত করছেন। আপনি অবশ্যই একটি কাস্টম দূরত্ব ফাংশন নিয়ে আসতে পারেন বা কোনও বিশেষজ্ঞের অনুমানের সাহায্যে আপনার মাত্রা ওজন করতে পারেন, তবে এটি আপনার ডেটার মাত্রিকতার উপর নির্ভর করে প্রচুর সুরযুক্ত প্যারামিটার তৈরি করবে। এই ক্ষেত্রে, স্বাভাবিককরণ একটি সহজ পাথ (যদিও এটি প্রয়োজনীয়ভাবে আদর্শ নয়) কারণ আপনি কমপক্ষে শুরু করতে পারেন।

অবশেষে, এখনও এসভিএমগুলির জন্য, আপনি করতে পারেন এমন আরও একটি জিনিস হ'ল দূরত্বের ফাংশন না হয়ে একটি সাদৃশ্য ফাংশন নিয়ে আসে এবং এটি কর্নেল হিসাবে প্লাগ ইন করে (প্রযুক্তিগতভাবে এই ফাংশনটি অবশ্যই ইতিবাচক-নির্দিষ্ট ম্যাট্রিক তৈরি করতে পারে)। এই ফাংশনটি আপনার পছন্দ মতো যেকোন উপায়ে তৈরি করা যেতে পারে এবং বৈশিষ্ট্যগুলির ব্যাপ্তিতে বৈসাদ্যকে বিবেচনায় নিতে পারে।

অন্যদিকে এলোমেলো বনের জন্য, যেহেতু একটি বৈশিষ্ট্য কখনও কখনও অন্যান্য বৈশিষ্ট্যের সাথে পরিমাপের সাথে তুলনা করা হয় না, তাই রেঞ্জগুলি কোনও ব্যাপার নয়। এটি কেবলমাত্র প্রতিটি বৈশিষ্ট্যে বিভক্ত এমন একটি বৈশিষ্ট্যের পরিসীমা।


12

র্যান্ডম ফরেস্ট স্বতন্ত্র বৈশিষ্ট্যগুলির একঘেয়ে রূপান্তরগুলির জন্য অদম্য। অনুবাদ বা প্রতিটি বৈশিষ্ট্য স্কেলিংগুলি এলোমেলো বনটির জন্য কোনও পরিবর্তন করবে না। আপনার বৈশিষ্ট্যগুলি মোটামুটি একই পরিমাণে থাকলে এসভিএম সম্ভবত আরও ভাল করবে, যদি না আপনি এপ্রিওরি জানেন যে কিছু বৈশিষ্ট্য অন্যদের তুলনায় অনেক বেশি গুরুত্বপূর্ণ, সেক্ষেত্রে এটির বৃহত্তর পরিমাণ থাকা ঠিক আছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.