অফসেটগুলি যে কোনও রিগ্রেশন মডেলটিতে ব্যবহার করা যেতে পারে, তবে আপনার প্রতিক্রিয়া ভেরিয়েবলের জন্য গণনা ডেটা নিয়ে কাজ করার সময় সেগুলি আরও বেশি সাধারণ। একটি অফসেট কেবল একটি পরিবর্তনশীল যা মডেলটিতে সহগ থাকতে বাধ্য হয় । (এই দুর্দান্ত সিভি থ্রেডটিও দেখুন: কখন পইসন রিগ্রেশনসে অফসেট ব্যবহার করবেন? ) 1
গণনা ডেটা সহ সঠিকভাবে ব্যবহার করা হলে, এটি আপনাকে গণনার পরিবর্তে হারের মডেল করতে দেয় । যদি এটি আগ্রহী হয়, তবে এটি করার কিছু। সুতরাং, এটি সেই প্রসঙ্গে যা অফসেটগুলি প্রায়শই ব্যবহৃত হয়। আসুন একটি লগ লিঙ্ক (যা ক্যানোনিকাল লিঙ্ক) সহ একটি পায়সন জিএলআইএম বিবেচনা করি।
ln(λ)ln(λtime)ln(λ)−ln(time)ln(λ)ln(λ)=β0+β1X=β0+β1X⇒=β0+β1X=β0+β1X+1×ln(time)≠=β0+β1X+β2×ln(time)when β2≠1(counts)(rates)(still rates)(counts again)
(যেমন আপনি দেখতে পাচ্ছেন, অফসেটটি সঠিকভাবে ব্যবহারের চাবিকাঠিটি অফসেট তৈরি করা,, নয় )) t i m eln(time)time
যখন এর সহগ হয় না , আপনি আর মডেলিং হার নন। তবে যেহেতু ডেটা ফিট করার জন্য অনেক বেশি নমনীয়তা সরবরাহ করে, যে মডেলগুলি অফসেট হিসাবে ব্যবহার করে না সাধারণত আরও ভাল ফিট (যদিও তারা এমনকি উপকার করতে পারে)। 1 β 2 ∈ ( - ∞ , 1 ) ∪ ( 1 , ∞ ) ln ( t i m e )ln(time)1β2∈ ( - ∞ , 1 ) ∪ ( 1 , ∞ )Ln( টি আমি এম ই )
আপনার মডেল গণনা বা হারগুলি হওয়া উচিত কিনা তা নির্ভর করে আপনার মূল প্রশ্নটি কী তার উপর। আপনি যা জানতে চান তার সাথে মডেল করা উচিত।
না হওয়ার জন্য এর অর্থ কী হতে পারে , একটি উদাহরণ বিবেচনা করুন যেখানে সময় প্রশ্নে পরিবর্তনশীল নয়। বিভিন্ন হাসপাতালে শল্য চিকিত্সার জটিলতার সংখ্যা অধ্যয়ন করার কল্পনা করুন। একটি হাসপাতালে আরও অনেকগুলি শল্য চিকিত্সা সংক্রান্ত জটিলতার রিপোর্ট রয়েছে তবে তারা দাবি করতে পারে যে তুলনাটি ন্যায্য নয় কারণ তারা আরও অনেক শল্য চিকিত্সা করে। সুতরাং আপনি এই জন্য নিয়ন্ত্রণ করার চেষ্টা করার সিদ্ধান্ত নিন। আপনি কেবল অফসেট হিসাবে সার্জারীর সংখ্যার লগটি ব্যবহার করতে পারেন, যা আপনাকে সার্জারি প্রতি জটিলতার হার অধ্যয়ন করতে দেয়। আপনি সার্ভারের সংখ্যাটির লগটিকে অন্য কোভারিয়েট হিসাবেও ব্যবহার করতে পারেন। ধরা যাক যে সহগ থেকে উল্লেখযোগ্যভাবে পৃথক । যদিβ211β2> ঘ, তারপরে আরও বেশি শল্য চিকিত্সা করা হাসপাতালগুলিতে জটিলতার হার বেশি থাকে (সম্ভবত তারা আরও কাজ সম্পন্ন করতে ছুটে চলেছেন)। যদি যেসব হাসপাতালে সর্বাধিক কাজ করা হয় তাদের শল্য চিকিত্সার ক্ষেত্রে কম জটিলতা থাকে (সম্ভবত তাদের সেরা ডাক্তার রয়েছে, তাই আরও কিছু করা এবং আরও ভাল করা)। β2< 1
যদি প্রশ্নের পরিবর্তনশীল সময় হয় তবে এটি কীভাবে ঘটতে পারে তা দেখে আরও জটিল complicated পইসন বিতরণের থেকে দেখা দেয় দুটো কারণে পইসন প্রক্রিয়া , যা ইভেন্টের মধ্যে সময় ব্যাখ্যা মূলকভাবে বিতরণ করা হয়, তাই সেখানে বেঁচে থাকার বিশ্লেষণ একটি প্রাকৃতিক সংযোগ। বেঁচে থাকার বিশ্লেষণে, ইভেন্টগুলির সময় প্রায়শই ঘনিষ্ঠ হিসাবে বিতরণ করা হয় না তবে সময়ের সাথে সাথে বেসলাইন বিপত্তি আরও বেশি বা কমতে পারে। সুতরাং, এমন কোনও ক্ষেত্রে বিবেচনা করুন যেখানে আপনি কিছু প্রাকৃতিক সূচনার পয়েন্ট অনুসরণ করে ইভেন্টগুলির সংখ্যাকে মডেলিং করছেন। যদি , এর অর্থ ইভেন্টের হার দ্রুত , অন্যদিকে যদি , এর অর্থ ইভেন্টের হার । β2> ঘβ2< 1
প্রাক্তনটির একটি দৃ concrete় উদাহরণের জন্য, প্রাথমিকভাবে টিউমারটি সার্জিকভাবে অপসারণের পরে ক্যান্সার কোষগুলির সংখ্যার সময়ের জন্য একটি স্ক্যান কল্পনা করুন। কিছু রোগীদের ক্ষেত্রে, অস্ত্রোপচারের পর থেকে আরও সময় অতিবাহিত হয়েছে এবং আপনি এটি বিবেচনায় নিতে চেয়েছিলেন। যেহেতু একবার ক্যান্সার তার পায়ে ফিরে এসেছিল এটি তাত্ক্ষণিকভাবে বৃদ্ধি পেতে শুরু করবে, অতিরিক্ত চিকিত্সা ছাড়াই শল্য চিকিত্সা করার পরে এই হার সময়ের সাথে সাথে বৃদ্ধি পাবে।
পরবর্তীকালের একটি দৃ concrete় উদাহরণের জন্য, এমন একটি রোগের প্রাদুর্ভাবে মারা যাওয়া লোকের সংখ্যা বিবেচনা করুন যার জন্য আমাদের কোনও চিকিত্সা নেই। প্রথমদিকে, প্রচুর লোক মারা যায় কারণ তারা এই রোগের প্রতি বেশি সংবেদনশীল ছিল বা ইতিমধ্যে একটি আপোসযুক্ত প্রতিরোধ ব্যবস্থা ছিল ইত্যাদি time সময়ের সাথে সাথে, যেহেতু বাকী মানুষের সংখ্যা এই রোগের প্রতি কম সংবেদনশীল, তাই এই হারও হ্রাস পাবে। (দুঃখিত, এই উদাহরণটি এতটাই দুর্বল))