সিদ্ধান্ত গাছের পরিবর্তনশীল (বৈশিষ্ট্য) স্কেলিং এবং ভেরিয়েবল (বৈশিষ্ট্য) নরমালাইজেশন (টিউনিং) কোন বাস্তবায়নের প্রয়োজন?


10

অনেক মেশিন লার্নিং অ্যালগরিদমগুলিতে, বৈশিষ্ট্য স্কেলিং (ওরফে ভেরিয়েবল স্কেলিং, নরমালাইজেশন) একটি সাধারণ পূর্ববর্তী পদক্ষেপ উইকিপিডিয়া - বৈশিষ্ট্য স্কেলিং - এই প্রশ্নটি নিকটে প্রশ্ন # 41704 - কীভাবে এবং কেন বৈশিষ্ট্য স্কেলিং কাজ করে?

সিদ্ধান্ত গাছ সম্পর্কিত ক্ষেত্রে আমার দুটি প্রশ্ন রয়েছে:

  1. বৈশিষ্ট্য স্কেলিং প্রয়োজন হয় এমন কোন সিদ্ধান্ত ট্রি বাস্তবায়ন আছে? আমি এই ছাপে আছি যে বেশিরভাগ অ্যালগরিদমের বিভাজন মানদণ্ড স্কেল সম্পর্কে উদাসীন।
  2. এই ভেরিয়েবলগুলি বিবেচনা করুন: (১) ইউনিট, (২) ঘন্টা, (৩) প্রতি ঘন্টা ইউনিট - সিদ্ধান্ত গাছে খাওয়ানোর সময় এই তিনটি ভেরিয়েবলকে "যেমন রয়েছে" রেখে দেওয়া ভাল বা আমরা কোনও ধরণের সংঘাতের মধ্যে চলে যাই? যেহেতু "নরমালাইজড" ভেরিয়েবল (3) (1) এবং (2) এর সাথে সম্পর্কিত? অর্থাৎ, আপনি কি তিনটি পরিবর্তনশীলকে মিশ্রণে ফেলে এই পরিস্থিতিটি আক্রমণ করবেন, বা আপনি সাধারণত তিনটির কিছু সমন্বয় বেছে নেবেন বা কেবল "নরমালাইজড / স্ট্যান্ডার্ডাইজড" বৈশিষ্ট্যটি ব্যবহার করবেন (3)?

উত্তর:


6

1 এর জন্য, সাধারণভাবে সিদ্ধান্ত নেওয়া গাছগুলিকে সাধারণত স্কেলিংয়ের প্রয়োজন হয় না। তবে এটি ডেটা ভিজ্যুয়ালাইজেশন / ম্যানিপুলেশনে সহায়তা করে এবং আপনি যদি অন্য ডেটা বা এসভিএমের মতো অন্যান্য পদ্ধতির সাথে পারফরম্যান্স তুলনা করতে চান তবে এটি কার্যকর হতে পারে।

2 এর জন্য, এটি টিউন করার প্রশ্ন। ইউনিট / ঘন্টা একটি ধরণের চলক মিথস্ক্রিয়া হিসাবে বিবেচিত হতে পারে এবং প্রতিটি একক থেকে ভবিষ্যদ্বাণীপূর্ণ শক্তি পৃথক হতে পারে। যদিও এটি আপনার ডেটার উপর নির্ভর করে। আমি কোন পার্থক্য আছে কিনা তা চেষ্টা করেও চেষ্টা করেছি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.