আমি প্রায়শই একটি মডেল (শ্রেণিবদ্ধকরণ বা রিগ্রেশন) তৈরি করছি যেখানে আমার কাছে কিছু অনুমানকারী ভেরিয়েবল রয়েছে যা সিকোয়েন্স রয়েছে এবং আমি মডেলটিতে ভবিষ্যদ্বাণীকারী হিসাবে অন্তর্ভুক্তির জন্য সর্বোত্তম উপায়ে সংক্ষিপ্ত করার জন্য কৌশল প্রস্তাবনাগুলি সন্ধান করার চেষ্টা করছি।
একটি দৃ concrete় উদাহরণ হিসাবে, বলুন যে কোনও গ্রাহক আগামী 90 দিনের মধ্যে (টি এবং টি + 90 এর মধ্যে যে কোনও সময়; এইভাবে একটি বাইনারি ফলাফল) কোম্পানীটি ত্যাগ করবেন কিনা তা অনুমান করার জন্য একটি মডেল তৈরি করা হচ্ছে। উপলব্ধ পূর্বাভাসীদের মধ্যে একটি হ'ল টি-টু-টি-টি পিরিয়ডের জন্য গ্রাহকদের আর্থিক ব্যালেন্সের স্তর। সম্ভবত এটি পূর্ববর্তী 12 মাসের জন্য মাসিক পর্যবেক্ষণগুলি উপস্থাপন করে (অর্থাত 12 মাপদণ্ড)।
আমি এই সিরিজ থেকে বৈশিষ্ট্যগুলি নির্মাণের উপায়গুলি খুঁজছি। আমি প্রতিটি গ্রাহক সিরিজের বর্ণনামূলক ব্যবহার করি যেমন গড়, উচ্চ, নিম্ন, স্ট্যান্ড ডেভেলপেন্ড, প্রবণতা পেতে একটি ওএলএস রিগ্রেশন ফিট করে। বৈশিষ্ট্য গণনা করার জন্য তাদের অন্যান্য পদ্ধতিগুলি কী? পরিবর্তন বা অস্থিরতার অন্যান্য ব্যবস্থা?
যোগ করুন
নীচের প্রতিক্রিয়া হিসাবে উল্লিখিত হিসাবে, আমি ডায়নামিক টাইম ওয়ার্পিং (ডিটিডাব্লু) ব্যবহার করে এবং তারপরে ফলাফল দূরত্বের ম্যাট্রিক্সের উপর শ্রেণিবিন্যাসমূলক ক্লাস্টারিং - কিছু সংখ্যক ক্লাস্টার তৈরি করে এবং পরে ক্লাস্টারের সদস্যতাটি বৈশিষ্ট্য হিসাবে ব্যবহার করেও বিবেচনা করেছি (তবে এখানে যুক্ত করতে ভুলে গেছি)। স্কোরিং পরীক্ষার ডেটা সম্ভবত এমন একটি প্রক্রিয়া অনুসরণ করবে যেখানে ডিটিডব্লিউটি নতুন ক্ষেত্রে এবং ক্লাস্টার সেন্ট্রয়েডগুলিতে করা হয়েছিল - যা তাদের নিকটতম সেন্ট্রয়েডগুলির সাথে নতুন ডেটা সিরিজের সাথে মিলছে ...