এক্ষেত্রে লুইন রিগ্রেশন পইসন রিগ্রেশন এর কি সুবিধা রয়েছে?


12

আমাকে একটি ডেটা সেট দেওয়া হয়েছে যাতে একটি হাই স্কুলে শিক্ষার্থীদের দ্বারা প্রাপ্ত পুরষ্কারের সংখ্যা রয়েছে যেখানে অর্জিত পুরষ্কারের পূর্বাভাসকারীদের মধ্যে শিক্ষার্থীর নাম নথিভুক্ত হওয়া প্রোগ্রামের ধরণ এবং গণিতে তাদের চূড়ান্ত পরীক্ষার স্কোর অন্তর্ভুক্ত থাকে।

আমি ভাবছিলাম যে কেউ যদি আমাকে বলতে পারে যে এই ক্ষেত্রে একটি লিনিয়ার রিগ্রেশন মডেলটি অনুপযুক্ত হতে পারে এবং কেন এটি পইসন রিগ্রেশন ব্যবহার করা ভাল? ধন্যবাদ।

উত্তর:


14

পোইসন বনাম সাধারণ রিগ্রেশন সম্পর্কিত তিনটি বিষয়, সমস্ত মডেলের স্পেসিফিকেশন সম্পর্কিত:

ভবিষ্যদ্বাণীকারীদের পরিবর্তনের প্রভাব

গণিত পরীক্ষার স্কোরের মতো পোয়েসন রিগ্রেশন (সাধারণ লগ লিঙ্কের সাথে) মতো অবিচ্ছিন্ন ভবিষ্যদ্বাণী সহ সূচিত হয় যে ভবিষ্যদ্বাণীকের একটি ইউনিট পরিবর্তন পুরষ্কারের সংখ্যার শতাংশের পরিবর্তনের দিকে পরিচালিত করে, অর্থাত গণিত পরীক্ষায় আরও 10 পয়েন্ট উদাহরণস্বরূপ 25 শতাংশের সাথে যুক্ত আরও পুরষ্কার। এটি ইতিমধ্যে শিক্ষার্থীর কতটা পুরষ্কারের পূর্বাভাস দেওয়া হয়েছে তার উপর নির্ভর করে। বিপরীতে, সাধারণ রিগ্রেশন স্থির পরিমাণের সাথে আরও 10 পয়েন্ট যুক্ত করে, সমস্ত পরিস্থিতিতে আরও 3 টি পুরষ্কার বলুন। যে মডেলটি তৈরি করে তা ব্যবহার করার আগে আপনার সেই অনুমানের সাথে খুশি হওয়া উচিত। (তবে আমি মনে করি এটি খুব যুক্তিসঙ্গত, পরের পয়েন্টে মডুলো।)

কোনও পুরস্কার ছাড়াই শিক্ষার্থীদের সাথে লেনদেন করা

সত্যিকার অর্থে প্রচুর পুরষ্কার প্রচুর শিক্ষার্থীর মধ্যে ছড়িয়ে না থাকলে আপনার পুরষ্কারের সংখ্যাগুলি বেশিরভাগের চেয়ে কম হবে। আসলে আমি শূন্য-মুদ্রাস্ফীতি সম্পর্কে ভবিষ্যদ্বাণী করব, বেশিরভাগ শিক্ষার্থীরা কোনও পুরষ্কার পায় না, তাই প্রচুর শূন্য, এবং কিছু ভাল শিক্ষার্থীরা বেশ কয়েকটি পুরষ্কার পায়। এটি পোইসন মডেলের অনুমানগুলি নিয়ে গণ্ডগোল পেয়েছে এবং সাধারণ মডেলের পক্ষে কমপক্ষে খারাপ।

যদি আপনার কাছে একটি শালীন পরিমাণের ডেটা থাকে তবে 'শূন্য-স্ফীত' বা 'বাধা' মডেলটি প্রাকৃতিক হবে। এটি দুটি মডেল একসাথে বাঁধা: একটি ছাত্র কোন পুরষ্কার পায় কিনা তা ভবিষ্যদ্বাণী করা এবং অন্যটি যদি সে কিছু পেয়ে যায় তবে সে কতোটি পায় সে সম্পর্কে ভবিষ্যদ্বাণী করা (সাধারণত পোয়েসন মডেলের কিছু রূপ)। আমি আশা করব সমস্ত পদক্ষেপটি প্রথম মডেলটিতে হবে।

পুরষ্কার এক্সক্লুসিভিটি

অবশেষে, পুরষ্কার সম্পর্কে একটি ছোট বিষয়। যদি পুরষ্কারগুলি একচেটিয়া হয়, অর্থাত্ যদি একজন শিক্ষার্থী পুরষ্কার পায় তবে অন্য কোনও শিক্ষার্থী পুরষ্কারটি পেতে পারে না, তবে আপনার ফলাফলগুলি মিলিত হয়; শিক্ষার্থীর জন্য একটি গণনা প্রতিটি অন্যান্যের সম্ভাব্য গণনাকে ঠেলে দেয়। এটি উদ্বেগজনক কিনা তা পুরষ্কারের কাঠামো এবং শিক্ষার্থীদের জনসংখ্যার উপর নির্ভর করে। আমি প্রথম পাস এ এড়ানো হবে।

উপসংহারে, পয়সন খুব বড় গণনা ব্যতীত স্বাচ্ছন্দ্যে সাধারণের উপর আধিপত্য বজায় রাখেন, তবে পোয়েসনের অনুমানগুলি পরীক্ষা করার জন্য এটি ভারীভাবে ঝোঁক দেওয়ার আগে পরীক্ষা করুন এবং প্রয়োজনে আরও হালকা জটিল মডেল শ্রেণিতে যাওয়ার জন্য প্রস্তুত থাকুন।


9

এই ক্ষেত্রে পোয়েসন রিগ্রেশন আরও উপযুক্ত হবে কারণ আপনার প্রতিক্রিয়া কোনও কিছুর গণনা।

λ

λλ

সাধারণ লিনিয়ার রিগ্রেশন গড়ের চারপাশে সাধারণ ত্রুটিগুলি ধরে নেয় এবং তাই তাদের সমানভাবে ওজন করে। এটি বলে যে কোনও শিক্ষার্থীর যদি প্রত্যাশিত সংখ্যার পুরস্কারের সংখ্যা 1 থাকে তবে তাদের পক্ষে 3-টি পুরষ্কার প্রাপ্তির জন্য -2 পুরষ্কার প্রাপ্তির পক্ষে ঠিক এটিই স্পষ্ট: এটি স্পষ্টতই বাজে এবং পোয়েসনকে সম্বোধন করার জন্য তৈরি।


8

ln(awards+0.5)

এছাড়াও, পুরষ্কারের প্রত্যাশিত সংখ্যা যেহেতু খুব বড় হয়ে ওঠে, ওআরএলএসকে @ কোরোনের দ্বারা বর্ণিত কারণগুলির জন্য আরও ভাল অভিনয় করা উচিত। ইন লেক Wobegon , OLS ঔজ্জ্বল্যের প্রেক্ষাপটে যেতে উপায়।

যদি প্রচুর শূন্যের সাথে প্রত্যাশিত সংখ্যাটি কম থাকে তবে আমি পয়েসনটিকে নেতিবাচক দ্বিপদী মডেলের চেয়ে শক্তিশালী মান ত্রুটিযুক্ত ব্যবহার করব। এনবি রিগ্রেশনটি সহগের উত্পাদনকারী প্রথম-ক্রমের শর্তে উপস্থিত তারতম্য সম্পর্কে দৃ strong় ধারণা গ্রহণ করে। যদি এই অনুমানগুলি সন্তুষ্ট না হয় তবে সহগগুলি নিজেই দূষিত হতে পারে। পয়সনের ক্ষেত্রে এটি হয় না।


4

λλ

set.seed(12345)
pois10 <- rpois(1000, 10)
plot(density(pois10))
library(moments)
skewness(pois10)

০.০১ এর স্কিউনেস দেখায় যা 0 এর কাছাকাছি।

আমি @ কনজুগেটেপরিওর এর পয়েন্টগুলিও পছন্দ করি। আমার অভিজ্ঞতায় পয়সন রিগ্রেশন ভালভাবে ফিট করা বিরল; আমি সাধারণত নেতিবাচক দ্বিপদী বা শূন্য-স্ফীত মডেলটি ব্যবহার করে শেষ হয়ে যাই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.