র্যান্ডম এফেক্টস মডেল হ্যান্ডলিং রিডানড্যান্সিগুলি


9

বারবার বাইনারি ফলাফল ব্যবহার করে সময়-প্রতি-ইভেন্ট বিশ্লেষণের সাথে ডিল করার চেষ্টা করছি। মনে করুন যে সময় থেকে ইভেন্টটি দিনের মধ্যে পরিমাপ করা হয় তবে মুহুর্তের জন্য আমরা সপ্তাহের মধ্যে সময়কে আলাদা করে দেখি। বারবার বাইনারি ফলাফল ব্যবহার করে আমি প্রায় এক কাপলান-মিয়ার অনুমানকারী (তবে সিভারিদের অনুমতি দিন) চাই। এটি যাওয়ার মতো চারিদিকের মতো মনে হবে তবে আমি কীভাবে এটি সাধারণ ফলাফল এবং পুনরাবৃত্ত ইভেন্টগুলিতে প্রসারিত তা অন্বেষণ করছি।

যদি আপনি একটি বাইনারি ক্রম তৈরি করেন যা 3 সপ্তাহে সেন্সর করা কারুর জন্য 000, 4W তে সেন্সর করা কারও জন্য 0000, এবং 5W এ ব্যর্থ হয়েছে এমন কোন বিষয়টির জন্য 0000111111111111 .... .... শেষ বিষয়টি 1 পয়েন্ট পর্যন্ত প্রসারিত হবে সমীক্ষায় অনুসরণ করা হয়েছে), আপনি যখন 1 সেকেন্ডের সপ্তাহ-নির্দিষ্ট অনুপাতের গণনা করেন তখন আপনি সাধারণ ক্রমবর্ধমান প্রবণতা পেতে পারেন (যতক্ষণ না আপনি পরিবর্তনশীল সেন্সরিং বারে পৌঁছান, যেখানে এটি কেবল প্রায় কাছাকাছি হয় তবে এটি কাপলান-মিয়ার ক্রমযুক্ত সংখ্যার তুলনায় সমান হয় না)।

উপরের মত সময়কে আলাদা করার পরিবর্তে সময় মতো স্প্লাইন ব্যবহার করার পরিবর্তে আমি জিআইই ব্যবহার করে বাইনারি লজিস্টিক মডেলের সাথে পুনরাবৃত্ত বাইনারি পর্যবেক্ষণগুলি ফিট করতে পারি। ক্লাস্টার স্যান্ডউইচ কোভারিয়েন্স অনুমানক যুক্তিসঙ্গতভাবে ভাল কাজ করে। তবে আমি একটি মিশ্র প্রভাবগুলির মডেল ব্যবহার করে আরও সঠিক অনুমান পেতে চাই। সমস্যাটি হ'ল প্রথম 1 এর পরে 1 এর কাজগুলি অতিরিক্ত কাজ করে। এলোমেলো প্রভাবগুলি নির্দিষ্ট করতে বা এমন কোনও মডেল নির্দিষ্ট করার কোনও উপায় কি কেউ জানেন যে স্ট্যান্ডার্ড ত্রুটিগুলি অপসারণযোগ্য না হয়?

মনে রাখবেন যে, এই সেটআপ পৃথক এফরন এর কারণ তিনি লজিস্টিক মডেল ব্যবহার করছিলেন ঝুঁকি সেটে শর্তাধীন সম্ভাব্যতা অনুমান করার জন্য। আমি শর্তহীন সম্ভাবনার অনুমান করছি।

উত্তর:


3

যতদূর আমি বারবার বাইনারি পর্যবেক্ষণের জন্য জিইই বা মিশ্র মডেল উভয়ের সাথে দেখতে পাচ্ছি, আপনার সমস্যা হবে যে মডেলটি প্রথম '1' পর্যবেক্ষণের পরে একটি '0' এর জন্য একটি ইতিবাচক সম্ভাবনা নির্ধারণ করবে।

যাইহোক , আপনি জিআইই-র মতো একই ব্যাখ্যা করতে হবে এমন মিশ্র প্রভাবগুলির লজিস্টিক রিগ্রেশন থেকে অনুমান পেতে চান ( আপনি আরও তথ্যের জন্য এখানে দেখুন), আপনি জিএলএমএমএডিপটিভ প্যাকেজ mixed_model()থেকে ফাংশনটি ব্যবহার করে মডেলটি ফিট করতে পারেন এবং তারপরে ব্যবহার । উদাহরণস্বরূপ, এখানে দেখুনmarginal_coefs()


1
ধন্যবাদ দিমিত্রিস। অপ্রয়োজনীয় 1 এর সাথে আমার ক্ষেত্রে (গড় ফাংশনটি সঠিকভাবে পেতে) আমার মনে হয় আমার একটি পরিবর্তিত মডেল বা একটি অদ্ভুত র্যান্ডম এফেক্টস সেটআপ লাগবে। GLMMadaptiveপ্যাকেজ আরও সাধারণ সেটআপের জন্য ভয়ঙ্কর দেখায়।
ফ্র্যাঙ্ক হ্যারেল

2

এই সম্পর্কে কয়েক দফা চিন্তাভাবনা:

  1. দেখে মনে হচ্ছে একটি মিশ্র-প্রভাবের মডেল মূলত একটি 'শর্তসাপেক্ষ' সম্ভাবনা মডেল, অর্থাত্ কোনও ইভেন্টের জন্য কোনও ইভেন্টের সম্ভাবনা কতটা। ঘটনার ঝুঁকিতে রয়েছে।

  2. আমরা জানি প্রথম '1' এর পরে একটি '1' এর সম্ভাবনা। সুতরাং, পরবর্তী '1' মানগুলিতে কোনও অতিরিক্ত তথ্য নেই।

  3. দেখে মনে হয়, কারণ পরবর্তী '1' মানগুলিতে কোনও অতিরিক্ত তথ্য থাকে না, তাদের সম্ভাবনা ফাংশনের উপর কোনও প্রভাব ফেলতে হবে না এবং সম্ভবত সম্ভাবনা-ভিত্তিক অনুমানকারীগুলির নিজস্ব ত্রুটিগুলির উপরও কোনও প্রভাব ফেলবে না। প্রকৃতপক্ষে, পরবর্তী (1) মানগুলির কোনও প্রভাব থাকবে না যদি p (y = '1' | x) = 1 মডেল প্যারামিটার মানগুলি নির্বিশেষে, এটি হওয়া উচিত।

  4. আমরা এই আচরণটি জোর করে সক্ষম করতে পারি (যেমন, পি (y = '1' | x) = 1), এবং পরবর্তীগুলির চিহ্নিতকরণকারী মডেলটিতে একটি সূচক সহকারীকে যুক্ত করে এবং এর সহগকে জোর করে, পছন্দসই গড় কার্যকারিতা ধরে রাখতে পারি খুব বড় হতে যাতে কার্যকরভাবে p (y = '1' | x) = 1।

  5. যেমন আপনি উল্লেখ করেছেন, প্রথম '1' এবং পরবর্তী প্রতিক্রিয়াগুলিকে 100% পারস্পরিক সম্পর্ক রাখতে বাধ্য করারও একটি উপায় থাকতে পারে। তবে দ্বিপদী মডেলটিতে, পরবর্তী উত্তরগুলির জন্য পি (y = '1' | x) = 1 এর সমান।


1
ধন্যবাদ ম্যাট যদি আমি একটি পূর্ণ মডেল না চাইতাম তবে সমীকরণ অনুমানের সাথে সন্তুষ্ট থাকতাম তবে আপনি যা পেয়ে যাচ্ছেন তা সঠিক ফাংশনটি সঠিকভাবে পেতে স্কোর ফাংশনে ডুপ্লিকেট প্রতিক্রিয়া যুক্ত করছে তবে তথ্য ফাংশনে এগুলি যুক্ত করছে না। আমি মনে করি না যে আমি কোনও সূচী কোভারিয়েট যুক্ত করতে পারি, কারণ এটি চিকিত্সার প্রভাব থেকে শুরু করে। আমি মিশ্র ইফেক্ট মডেলটিকে আরও শর্তহীন মডেল হিসাবে মনে করি। ইভেন্টটি যদি কোনও শোষণকারী রাষ্ট্র না হয়, আপনি সময়-নির্ভর উপায়ে প্রান্তিক প্রভাবগুলি মডেলিং করছেন।
ফ্র্যাঙ্ক হ্যারেল

1

আপনি যা করার চেষ্টা করছেন তা আমি ঠিক নিশ্চিত নই তবে আপনি কি একটি পুলযুক্ত লজিস্টিক রিগ্রেশন মডেল ফিট করতে পারেন ( https://www.ncbi.nlm.nih.gov/pubmed/2281238 )? এক্ষেত্রে আপনি কেবলমাত্র টার্মিনাল ইভেন্টের বিরতিতে 1 টি অন্তর্ভুক্ত করবেন - ইভেন্টটি হওয়ার পরে এটি পুনরাবৃত্তি করবে না। আপনি মডেলটিতে নমনীয় পদ্ধতিতে সময় অন্তর্ভুক্ত করবেন (উদাহরণস্বরূপ, স্প্লাইস ব্যবহার করে প্রসারিত)।


1
আরে ব্রায়ান - আমি সত্যিই পুলযুক্ত লজিস্টিক রিগ্রেশন পছন্দ করি এবং এটি প্রায়শই ব্যবহার করি। তবে আপনি যদি টার্মিনাল ইভেন্টে কোনও বিষয়ের পর্যবেক্ষণগুলি সমাপ্ত করে থাকেন এবং কোনও বিষয় ছাড়াই অন্য বিষয়গুলি সেই বিন্দু ছাড়িয়ে অনুসরণ করে থাকেন তবে আপনি গড় ফাংশনটি (পি (সময় অনুসারে টি)) ভুল পাবেন। আমি কমপক্ষে বিশেষ ক্ষেত্রে গড় কর্মের জন্য কাছাকাছি-কাপলান-মিয়ার সংক্ষিপ্ত ঘটনা অনুমানগুলি পেতে চাই।
ফ্র্যাঙ্ক হ্যারেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.