কক্স মডেল বনাম লজিস্টিক রিগ্রেশন


15

ধরা যাক আমাদের নিম্নলিখিত সমস্যাটি দেওয়া হয়েছে:

ভবিষ্যদ্বাণী করুন কোন ক্লায়েন্টরা সম্ভবত আগামী 3 মাসের মধ্যে আমাদের দোকানে কেনা বন্ধ করবে।
প্রতিটি ক্লায়েন্টের জন্য আমরা মাসটি জানি যখন কেউ আমাদের দোকানে কেনা শুরু করে এবং অতিরিক্তভাবে আমাদের মাসিক সামগ্রীতে অনেকগুলি আচরণগত বৈশিষ্ট্য রয়েছে। 'প্রবীণ' ক্লায়েন্ট পঞ্চাশ মাস ধরে কিনছেন; আসুন সেই সময়টিকে চিহ্নিত করুন যেহেতু একজন ক্লায়েন্ট ( ) দ্বারা কেনা শুরু করেছিলেন। ধারণা করা যেতে পারে যে ক্লায়েন্টের সংখ্যা খুব বেশি। যদি কোনও ক্লায়েন্ট তিন মাসের জন্য ক্রয় বন্ধ করে দেয় এবং তারপরে ফিরে আসে, তবে তাকে নতুন গ্রাহক হিসাবে ধরা হবে তাই কোনও ইভেন্ট (কেনা বন্ধ করুন) কেবল একবারই ঘটতে পারে।t [ 0 , 50 ]tt[0,50]

দুটি সমাধান আমার মনে আসে:

লজিস্টিক রিগ্রেশন - প্রতিটি ক্লায়েন্টের জন্য এবং প্রতি মাসে (সম্ভবত 3 টি নতুন মাস বাদে), আমরা বলতে পারি কোনও ক্লায়েন্ট কেনা বন্ধ করেছে কিনা, তাই আমরা প্রতি ক্লায়েন্ট এবং মাসে এক পর্যবেক্ষণের সাথে ঘূর্ণায়মান নমুনাগুলি করতে পারি। বেস হ্যাজার্ড ফাংশনের কিছু সমতুল্য অর্জনের জন্য আমরা একটি শ্রেণিবদ্ধ ভেরিয়েবল হিসাবে শুরু থেকে মাসের সংখ্যা ব্যবহার করতে পারি।

বর্ধিত কক্স মডেল - বর্ধিত কক্স মডেল ব্যবহার করে এই সমস্যাটিও মডেল করা যেতে পারে। দেখে মনে হচ্ছে এই সমস্যাটি বেঁচে থাকার বিশ্লেষণের পক্ষে আরও উপযুক্ত।

প্রশ্ন: অনুরূপ সমস্যায় টিকে থাকার বিশ্লেষণের সুবিধা কী কী? বেঁচে থাকার বিশ্লেষণটি কোনও কারণে উদ্ভাবিত হয়েছিল, তাই এর কিছুটা গুরুতর সুবিধা থাকতে হবে।

টিকে থাকার বিশ্লেষণে আমার জ্ঞান খুব গভীর নয় এবং আমি মনে করি যে কক্স মডেলের সর্বাধিক সম্ভাব্য সুবিধাগুলিও লজিস্টিক রিগ্রেশন ব্যবহার করে অর্জন করা যেতে পারে।

  • স্তরিত কক্সবাজার মডেল সমতুল্য একটি মিথস্ক্রিয়া ব্যবহার প্রাপ্ত করা যাবে এবং stratifying পরিবর্তনশীল। টি
  • ইন্টারঅ্যাকশন কক্স মডেল জনসংখ্যাকে বিভিন্ন উপ-জনগোষ্ঠীতে ডুব দিয়ে এবং প্রতিটি উপ-জনসংখ্যার জন্য এলআর অনুমান করে পাওয়া যায়।

আমি দেখি একমাত্র সুবিধা হ'ল কক্স মডেলটি আরও নমনীয়; উদাহরণস্বরূপ, কোনও ক্লায়েন্ট 6 মাসের মধ্যে কেনা বন্ধ করে দেবে এমন সম্ভাবনাটি আমরা সহজেই গণনা করতে পারি।

উত্তর:


10

কক্স মডেলটির সমস্যাটি হ'ল এটি কোনও কিছুই ভবিষ্যদ্বাণী করে না। কক্স মডেলগুলিতে "ইন্টারসেপ্ট" (বেসলাইন হ্যাজার্ড ফাংশন) আসলে অনুমান করা যায় না। কোনও ঘটনার ঝুঁকি বা সম্ভাবনার পূর্বাভাস দেওয়ার জন্য লজিস্টিক রিগ্রেশন ব্যবহার করা যেতে পারে, এক্ষেত্রে: নির্দিষ্ট মাসে কোনও বিষয় কিছু কেনার জন্য আসে কিনা।

সাধারণ লজিস্টিক রিগ্রেশনের পিছনে অনুমানগুলির সমস্যাটি হ'ল আপনি প্রতিটি ব্যক্তি-মাসের পর্যবেক্ষণকে স্বাধীন হিসাবে বিবেচনা করুন, নির্বিশেষে এটি একই ব্যক্তি বা একই মাসে পর্যবেক্ষণ হয়েছে কিনা whether এটি বিপজ্জনক হতে পারে কারণ কিছু আইটেম দুটি মাসের ব্যবধানে কেনা হয়, সুতরাং এক মাস পর পর পর্যবেক্ষণে নেতিবাচকভাবে সম্পর্কিত হয়। পর্যায়ক্রমে, কোনও গ্রাহক মাসিক পর্যবেক্ষণ দ্বারা পরের ব্যক্তিকে নেতৃত্ব দেওয়ার জন্য ভাল বা খারাপ অভিজ্ঞতা দ্বারা ধরে রাখা বা হারিয়ে যেতে পারে positive

আমি মনে করি এই পূর্বাভাস সমস্যাটির একটি ভাল শুরুটি পূর্বাভাসের পদ্ধতিকে গ্রহণ করছে যেখানে আমরা পরবর্তী মাসের ব্যবসায় সম্পর্কে আমাদের ভবিষ্যদ্বাণীগুলি অবহিত করতে পূর্ববর্তী তথ্য ব্যবহার করতে পারি। এই সমস্যাটির একটি সহজ সূচনা হ'ল পিছিয়ে যাওয়া প্রভাবের জন্য সামঞ্জস্য করা বা কোনও মাসে গত মাসে কোন বিষয় এসেছিল কিনা তার একটি সূচক, তারা এই মাসে আসতে পারে কিনা সে সম্পর্কে ভবিষ্যদ্বাণী হিসাবে ।


2
স্বাধীনতার ইস্যু সমাধান করতে কি এখানে বহুবিধ লজিস্টিক রিগ্রেশন ব্যবহার করা যায় না? স্তর 2 ক্লায়েন্ট হবে এবং স্তরের 1 সময়ের সাথে সাথে পুনরায় পদক্ষেপগুলি পুনরুদ্ধার করা হবে।
ফরেনস্ট্যান্স

1
@AdamO, পথিমধ্যে করতে আনুমানিক, এবং ব্যক্তির আংশিক বিপত্তি ভবিষ্যদ্বাণী সঙ্গে মিলিত, আমরা পৃথক বেঁচে থাকার রেখাচিত্র তৈরি করতে পারেন। আমি নিশ্চিত নই আপনি কেন মনে করেন কক্স মডেলটি "কিছুই নয়" অনুমান করতে পারে।
ক্যাম.ড্যাভিডসন.পিলন

δ

পূর্বাভাসের উদ্দেশ্যে, আমি মনে করি এটি ব্লকার নয়। একক পূর্বাভাস তৈরি করতে একাধিক অনুমান একত্রিত করা অস্বাভাবিক কিছু নয় এবং (দুর্ভাগ্যক্রমে এবং আমি এর পক্ষে সমর্থন দিচ্ছি না) পূর্বাভাস অন্তরগুলি সাধারণত ব্যবহৃত হয় না বা যাইহোক উপলব্ধ।
ক্যাম.ড্যাভিডসন.পিলন

@ ক্যাম.ড্যাভিডসন।পিলন আমি বলিনি যে বেঁচে থাকার ডেটা থেকে ঝুঁকি পূর্বাভাস পাওয়া যায় না, আমি বলেছিলাম কক্স মডেলগুলি ঝুঁকি নিয়ে পূর্বাভাস দেয় না। কল coxphএবং ঝুঁকি অনুমান পাওয়ার মধ্যে পদক্ষেপগুলি খাড়া এবং অনেকগুলি।
অ্যাডমো

3

TjjPr(Tj>3)j3

বেঁচে থাকার বিশ্লেষণটি এই বিষয়টি বিবেচনা করে যে প্রতিটি ক্লায়েন্টের অধ্যায়ের মধ্যে তার নিজস্ব প্রবেশের সময় রয়েছে। ফলো-আপ সময়কাল ক্লায়েন্ট জুড়ে পরিবর্তিত হয় যে সমস্যা তাই নয়।

j


মন্তব্য : এখানে একটি কাগজ যা দেখায় যে কিছু প্রতিবন্ধকতাগুলির মধ্যে লজিস্টিক এবং কক্স মডেল উভয়ই লিঙ্কযুক্ত।


উত্তরের জন্য ধন্যবাদ. যদি SA যথাযথভাবে সেন্সরিং পরিচালনা করে তবে এটি বোঝায় যে এলআর সলিউশনটি সেন্সর সঠিকভাবে পরিচালনা করে না। কীভাবে এটি ফলস্বরূপ? আমি এখনও নিজেকে স্থির করতে পারি না যে নির্ধারিত সময়ের জন্য এসএ আরও ভাল। আমি নিবন্ধটি নিখরচায় খুঁজে পেতে পারি?
টোমেক তার্কিজেনস্কি

Y=0

আমার ইমেলটি: tomek.tarczynski@gmail.com আপনাকে অনেক ধন্যবাদ!
টোমেক তার্কিজেনস্কি

@ টোমেকটারজাইস্কি: পেয়েছেন?
অক্টোবর

হ্যাঁ, আবারও ধন্যবাদ! কালকে আরও মনোযোগ সহকারে পড়ার জন্য আমার সময় হবে। আমি কেবল এটি স্কিম করেছিলাম এবং যদি আমি সঠিকভাবে বুঝতে পারি তবে এটি কিছুটা ভিন্ন সমস্যার সমাধান করে। দোকানের সাদৃশ্যটি ব্যবহার করে এটি এলআর এবং কক্সকে সমস্যার সাথে তুলনা করে "শুরু থেকে কয়েক মাস নির্দিষ্ট সময় পরে ক্লায়েন্ট আর ক্লায়েন্ট না হওয়ার সম্ভাবনা কী?"
টোমেক তার্কিজেনস্কি

2

বিপণন সাহিত্যের একটি পেরেটো / এনবিডি এখানে বা অনুরূপ পরামর্শ দেয়। আপনি মূলত ক্রয়টি অনুমান করুন - তারা ক্রয় করার সময় - একটি নেতিবাচক দ্বিপদী বিতরণ অনুসরণ করে। কিন্তু গ্রাহক যখন থামবে তখন আপনাকে মডেল করতে হবে। এটি অন্য অংশ।

পিতে ফাদার এবং ব্রুস হার্ডির এই নিয়ে আবে সহ কিছু কাগজপত্র রয়েছে।

পেরেটো / এনবিডি-তে অনেকগুলি সহজ পদ্ধতির রয়েছে, এমনকি কেবল ফাদার এবং হার্ডির বিভিন্ন কাগজপত্র গণনা করা হচ্ছে। যে সহজ পদ্ধতির মধ্যে এটি ধরে নেওয়া হয় যে থামানোর সম্ভাবনা সময়ে প্রতিটি পর্যায়ে স্থির থাকে - তার অর্থ আপনার ভারী ভারী গ্রাহকরা যত তাড়াতাড়ি ছাড়বেন তার সম্ভাবনা বেশি। এটি ফিট করার জন্য একটি সহজ মডেল, তবে ভুল।

আমি কিছুক্ষণের মধ্যে এইগুলির একটিও ফিট করি না; কিছুটা অনর্থক বলে দুঃখিত।

এখানে আবে কাগজের একটি রেফারেন্স দেওয়া হয়েছে, যা এই সমস্যাটিকে শ্রেণিবদ্ধ বায়েস হিসাবে পুনরুদ্ধার করে। । আমি যদি এই ক্ষেত্রে আবার কাজ করে থাকি তবে আমার মনে হয় আমি এই পদ্ধতির পরীক্ষা করব।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.