কল করার সেরা সময়টির পূর্বাভাস দিন


10

ক্যালিফোর্নিয়ার বিভিন্ন শহরে গ্রাহকদের একটি সেট, প্রতিটি গ্রাহকের কল করার সময় এবং কলের স্থিতি সহ আমার একটি ডেটাসেট রয়েছে (গ্রাহক যদি কলটি উত্তর দেয় এবং সত্য যদি গ্রাহক উত্তর না দেয় তবে))

আমাকে ভবিষ্যতের গ্রাহকদের কল করার উপযুক্ত সময় খুঁজে পেতে হবে যাতে কলটির উত্তর দেওয়ার সম্ভাবনা বেশি। তাহলে, এই সমস্যার জন্য সর্বোত্তম কৌশল কী? ক্লাসিফিকেশন সমস্যা হিসাবে আমি কী বিবেচনা করব যা ঘন্টা (0,1,2, ... 23) ক্লাস হয়? বা আমি এটিকে কোনও রিগ্রেশন টাস্ক হিসাবে বিবেচনা করব যা সময়টি অবিচ্ছিন্ন পরিবর্তনশীল? আমি কীভাবে নিশ্চিত করতে পারি যে কলটির উত্তর দেওয়ার সম্ভাবনা বেশি থাকবে?

কোন সাহায্য প্রশংসা করা হবে। আপনি যদি আমাকে অনুরূপ সমস্যার বিষয়ে উল্লেখ করেন তবে এটি দুর্দান্তও হবে।

নীচে তথ্যগুলির একটি স্ন্যাপশট দেওয়া আছে।


শন ওউন, কাজটি কীভাবে গেল? আমি এখন একটি অনুরূপ সমস্যা সমাধানের চেষ্টা করছি এবং আপনার অভিজ্ঞতা শুনতে পছন্দ করব - ওয়েবে এই বিষয়টিতে খুব বেশি সংস্থান নেই। আগাম ধন্যবাদ!
ডোমিনিকা

উত্তর:


5

আপনি যদি যথাযথ রূপান্তর ছাড়াই একটি রিগ্রেশন সমস্যা হিসাবে মডেল করেন তবে আপনি আসলে সমস্যার মুখোমুখি হতে পারেন। উদাহরণস্বরূপ, আমরা জানি যে বেশিরভাগ কলগুলির উত্তর সম্ভবত দিনের সময় এবং রাতের সময় এবং সকালে খুব কম দেওয়া হয়। একটি লিনিয়ার রিগ্রেশন অসুবিধা হবে কারণ সম্পর্ক সম্ভবত বাঁকানো, লিনিয়ার না। একই কারণে, লজিস্টিক রিগ্রেশন সহ এটি একটি শ্রেণিবদ্ধকরণ কাজ হিসাবে আচরণ করাও সমস্যাযুক্ত হবে।

অন্যান্য উত্তরদাতাদের পরামর্শ অনুসারে, আপনার ডেটাগুলি সময়কালগুলিতে পুনরায় শ্রেণিবদ্ধকরণ সাহায্য করবে এবং আমি আপনাকে প্রথমে সিদ্ধান্ত গাছ বা এলোমেলো বন হিসাবে কিছু চেষ্টা করার পরামর্শ দেব।

যে সমস্ত বলেছিল, এটি সাধারণ বর্ণনামূলক পরিসংখ্যানগুলির ক্ষেত্রে হতে পারে। যদি আপনি দিনের সময় অনুপাতের উত্তর কলগুলি প্লট করেন (শহর বা অন্য কোনও জনসংখ্যার দ্বারা বিভক্ত), তবে কি সুস্পষ্ট সেরা সময় আছে? যদি তাই হয় তবে মডেলটির সাথে জিনিসগুলি কেন জটিল করবেন?


1

আপনি নিম্নলিখিত চেষ্টা করতে পারেন:

  1. দিনটিকে বিভিন্ন অংশে ভাগ করুন - সকাল-সকাল, সকাল, দুপুর, বিকেল, সন্ধ্যা, সন্ধ্যা, সন্ধ্যা, রাত ইত্যাদি
  2. দিনের প্রতিটি অংশের সময়সীমা নির্ধারণ করুন, উদাহরণস্বরূপ দুপুর 12 টা থেকে 1 টা পর্যন্ত হতে পারে।
  3. 3 টি নতুন লেবেল তৈরি করুন - "গ্রাহককে কল করার জন্য দিনের একটি অংশ", প্রতিটি ইতিবাচক ক্ষেত্রে (কলটির সত্যতা = সত্য) এটি সম্পর্কিত লেবেল বরাদ্দ করুন (সকাল / দুপুর / সন্ধ্যা)। এই লেবেলগুলি এক-হট এনকোডযুক্ত ফর্ম্যাটে থাকবে যেমন प्राथमिक_মর্নিং = 0/1, পছন্দ_নুন, পছন্দ_মোহানো ইত্যাদি etc.
  4. কলটি সফল হওয়ার জন্য নেতৃত্বটি সকাল / দুপুর / বা দিনের সন্ধ্যা সময়টিকে পছন্দ করে কিনা তা অনুমান করার জন্য 3 টি মডেল তৈরি করুন।

এছাড়াও, আমি অতিরিক্ত বৈশিষ্ট্য যেমন পেশা, লিঙ্গ ইত্যাদি যুক্ত করার পরামর্শ দিচ্ছি যেহেতু সারণীতে তালিকাভুক্ত বৈশিষ্ট্যগুলি (শহর ইত্যাদি) খুব অস্পষ্ট এবং গ্রাহকদের মধ্যে পার্থক্য করার জন্য খুব বেশি তথ্য দেয় না।

মন্তব্যগুলিতে পরামর্শ অনুযায়ী সম্পাদনা করুন:

মডেলটি ব্যবহার করার সময়, প্রতিটি সীসা পছন্দসই_মর্নিং = হ্যাঁ / না, অগ্রাধিকার_নুন = হ্যাঁ / না এবং পছন্দসই_ইভেনিং = হ্যাঁ / না হিসাবে শ্রেণিবদ্ধ হবে। দিনের সময়ের উপর ভিত্তি করে, উদাহরণস্বরূপ সকালে, কল সেন্টার এজেন্ট (বা সফ্টওয়্যার) সকালে অগ্রাধিকার সেটে শ্রেণিবদ্ধ শ্রেণিতে কল কল করতে পারে। যখন তার দুপুর হয়, কল সফ্টওয়্যার বাছাই করে দুপুরের পছন্দের তালিকার তালিকা তৈরি করে ইত্যাদি।


@ সন্দীপ-এস-সান্ধু সমস্যাটিকে ডেটা বিজ্ঞানের শ্রেণিবদ্ধকরণ সমস্যায় রূপান্তর করার একটি সহজ উপায়। তবে মনে হয় এই পদ্ধতির কিছু অসুবিধাগুলি থাকতে পারে: ১. লেবেল তথ্যে কেবল ইতিবাচক ক্ষেত্রে অন্তর্ভুক্ত থাকে, নেতিবাচক মামলার তথ্য হ্রাস পায় ২. গ্রাহকের কেবলমাত্র একটি লেবেল থাকতে পারে। অনুশীলনে, কোনও গ্রাহকের একাধিক লেবেল থাকতে পারে (যেমন, আমি মানুষকে সন্ধ্যা বা রাতে যে কোনও দিকে ফোন করতে পছন্দ করি)) আপনি কি মনে করেন?
nkhuyu

@ এনখুয়ু, ১) লেবেলে নেতিবাচক ক্ষেত্রেও অন্তর্ভুক্ত রয়েছে। আমি মনে করি আপনি "একটি নতুন লেবেল তৈরি করুন -" গ্রাহককে কল করার দিনের একটি অংশ ", প্রতিটি ইতিবাচক ক্ষেত্রে (কলের অবস্থা = সত্য)" বিবৃতিটি ভুল বুঝেছেন। এই পদক্ষেপটি একটি অতিরিক্ত লেবেল তৈরি করতে চায়, কলটি সফল হয়েছিল কিনা সেটির মূল লেবেল যেমন রয়েছে তেমন রয়েছে। 2) হ্যাঁ, আপনি ঠিক বলেছেন, এটি প্রতিফলিত করার জন্য উত্তর সম্পাদনা করেছেন।
সন্দীপ এস সন্ধু

@ সন্দীপ-এস-সাধু সাড়া দেওয়ার জন্য আপনাকে ধন্যবাদ। হ্যাঁ, আমি এটি ভুল বুঝেছি। ঠিক আছে. তারপরে আপনার দুটি লেবেল থাকবে (কলটির স্থিতি, আপনার নতুন লেবেল)। তাহলে আপনি কীভাবে এই সমস্যার সমাধান করতে পারেন? এটি কোনও নিয়মিত শ্রেণিবিন্যাসের সমস্যা নয়।
nkhuyu

@ এনখুয়ে, এটি লক্ষ করার জন্য ধন্যবাদ, আমি এখন এটিকে সম্পাদনা করেছি এবং এটি স্পষ্ট করে দিয়েছি # 4। তিনটি মডেলের প্রত্যেকটি সীডের একটি সেট দেবে যারা সেই নির্দিষ্ট সময়ের জন্য কলটি গ্রহণ করবে, কল সেন্টার তাদের কলকে অগ্রাধিকার দেওয়ার জন্য এটি ব্যবহার করবে।
সন্দীপ এস সন্ধু

1
পদক্ষেপ 1 তৃতীয় ধাপ অনুসরণ করা হয় এবং আমি এগুলি প্রশিক্ষণের জন্য উপযুক্ত লেবেল তৈরি করার পরামর্শ দিয়েছি। মূল প্রশ্নটি ছিল - "আমাকে কল করার উপযুক্ত সময়টি সন্ধান করতে হবে ..."। এগুলি সকাল / দুপুর / সন্ধ্যা বা আরও দানাদার যেমন ঘন্টা দ্বারা হওয়া উচিত কিনা তা সিদ্ধান্ত নেওয়ার সিদ্ধান্ত নেবে to
সন্দীপ এস সন্ধু

0

আমি একটি লজিস্টিক রিগ্রেশন ব্যবহার করব - আপনার নমুনার দরকার হবে যেখানে তারা গ্রহণ করেনি। তারপরে আমি ঘন্টাটিকে একটি alতুযুক্ত ডমি রেজিস্ট্রার হিসাবে বিবেচনা করব (২৩ ঘন্টা ডামি ভেরিয়েবল হিসাবে এবং একটিতে বাধা দিতে হবে)।

আপনি যদি এটি মরসুমের ডমি রেজিস্ট্রার হিসাবে ব্যবহার না করে থাকেন তবে আপনাকে কিছুটা রূপান্তর করতে হবে কারণ সম্পর্কটি লিনিয়ার হতে পারে না।

এর আগে কেউ মধ্য-মধ্য ইত্যাদিকে বিশিষ্ট পরিবর্তনশীল হিসাবে প্রতিস্থাপনের পরামর্শ দিয়েছিল। এটি একটি খারাপ ধারণা কারণ আপনার বিশদ রয়েছে এবং আপনি সেখানে বিশদটি হারাচ্ছেন। সম্পর্কের রৈখিক করার জন্য অনুকূল বিন্ন ব্যবহারের ক্ষেত্রে এটি একইরকম প্রভাব ফেলবে তবে আমি এখনও মনে করি না এটি কার্যকর হবে। .তুযুক্ত ডমি রেজিস্ট্রার ব্যবহার করে দেখুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.