কেউ কি অ্যালগরিদমগুলিকে এক-হট-এনকোডযুক্ত শ্রেণীবদ্ধ বৈশিষ্ট্যগুলির প্রয়োজন এবং কোনটি না করে তার একটি তালিকা দিতে পারে?
এএফআইইউ, নির্দিষ্ট অ্যালগরিদমের সাথে এটি নির্দিষ্ট ডেটা সহ আরও কিছু করতে হবে । বিশেষত, এটি বিভাগগুলিতে কিছু অর্থপূর্ণ ক্রম রয়েছে কিনা তার উপর নির্ভর করে।
দুটি ক্ষেত্রে বিবেচনা করুন। প্রথমটিতে আপনার কাছে খারাপ, মেহ, ভাল এবং দ্বিতীয়টিতে আপেল, কমলা, নাশপাতি রয়েছে । প্রথম ক্ষেত্রে একটি প্রাকৃতিক অর্ডার রয়েছে, কারণ মেহ সম্ভবত খারাপ এবং ভাল মধ্যে রয়েছে তবে সম্ভবত আপেল, কমলা, নাশপাতিতে তেমন কিছু ঘটে না ।
আপনি যদি প্রথম কেসটির জন্য এক-হট এনকোডিং এড়ান, আপনি অর্ডার সম্পর্কিত তথ্য "হারাচ্ছেন"। আপনি যদি দ্বিতীয় কেসের জন্য এক-হট এনকোডিং ব্যবহার করেন তবে আপনি বিভাগগুলিতে কিছু আদেশ অর্পণ করছেন যা স্বাভাবিকভাবে সত্য নয়।
আমি যখনই করি অ্যালগোরিদম দূরত্বের মেট্রিক ব্যবহার করে সাদৃশ্য গণনা করি।
কেন? ধরা যাক বৈশিষ্ট্যগুলির মধ্যে একটি স্পষ্টিকর খারাপ, মেহ, ভাল এবং আপনার তিনটি উদাহরণ রয়েছে, 1, 2, এবং 3, যেখানে সেগুলি অভিন্ন, বাদে 1 টি খারাপ , 2 মেহ এবং 3 টি ভাল is আপনি সম্ভবত অ্যালগরিদমের কাছে প্রকাশ করতে চান যে 1 এর চেয়ে 3 এর তুলনায় 2 এর সাথে বেশি মিল রয়েছে।