এটি কীভাবে করা ভাল আপনি যে কার্য সম্পাদন করছেন তার উপর নির্ভর করে দুর্দান্তভাবে পরিবর্তিত হতে চলেছে , তাই কোন কার্য-স্বতন্ত্র উপায়ে সেরা কি হবে তা বলা অসম্ভব।
আপনার স্তরগুলি যদি সাধারণ হয় তবে চেষ্টা করার জন্য দুটি সহজ জিনিস রয়েছে:
- তাদের বিন। উদাহরণস্বরূপ, 0 = (0 250), 1 = (251 500) ইত্যাদি আপনি সীমাটি নির্বাচন করতে চাইতে পারেন যাতে প্রতিটি বিনের সমান সংখ্যক আইটেম থাকে।
- আপনি স্তরগুলির লগ রূপান্তর নিতে পারেন। এটি রেঞ্জটি নীচে স্কোয়াশ করবে।
স্তরগুলি যদি অर्डিনাল না হয় তবে আপনি আপনার ডেটাসেটের অন্যান্য বৈশিষ্ট্য / ভেরিয়েবলের উপর ভিত্তি করে স্তরগুলি ক্লাস্টার করতে পারেন এবং পূর্বের স্তরের জন্য ক্লাস্টার আইডির বিকল্প দিতে পারেন। ক্লাস্টারিং অ্যালগরিদম হিসাবে এটি করার অনেকগুলি উপায় রয়েছে, তাই ক্ষেত্রটি প্রশস্ত। আমি এটি পড়তে হিসাবে, এই কি combine.levels()
করছে। আপনি একইভাবে kmeans()
বা ব্যবহার করে করতে পারেন prcomp()
। (আপনি পরবর্তী সময়ে নতুন ডেটাপয়েন্টের জন্য ক্লাস্টারগুলির পূর্বাভাস দেওয়ার জন্য কোনও শ্রেণিবদ্ধ প্রশিক্ষণ দিতে পারেন / করতে পারেন))