এই ডেটাগুলি দ্বিপদী গ্ল্যামের অনুপাতে একত্রিত করা যেতে পারে?


11

আমরা 60 জনকে আটলান্টায় যতটা রেস্তোঁরা ফ্র্যাঞ্চাইজি পারে তার তালিকা করতে বলেছিলাম। সামগ্রিক তালিকায় over০ টিরও বেশি রেস্তোরাঁ অন্তর্ভুক্ত ছিল, তবে আমরা সেগুলিকে সরিয়ে দিয়েছিলাম যেগুলি লোকদের 10% এর চেয়ে কম লোক দ্বারা উল্লেখ করা হয়েছিল, আমাদের 45 রেখে এসেছিল these এই 45 টির জন্য আমরা ভোটাধিকারের তালিকাভুক্ত তথ্যপ্রযুক্তির অনুপাতটি গণনা করেছি এবং আমরা এতে আগ্রহী এই অনুপাতকে ফ্র্যাঞ্চাইজিগুলির (লগ-ট্রান্সফর্মড) বিজ্ঞাপনের বাজেট এবং ফ্র্যাঞ্চাইজি হওয়ার পরে বছরগুলির হিসাবে কাজ করে।

সুতরাং আমি এই কোড লিখেছি:

model <- glm ( cbind (listed, 55-listed) ~ log.budget + years, family = binomial, data = list.45)

পূর্বাভাস হিসাবে, উভয় ভেরিয়েবল শক্তিশালী, উল্লেখযোগ্য প্রভাব প্রদর্শন করে।

তবে যদিও আমি জানি যে আনুপাতিক ডেটা কখনই ওএলএস রিগ্রেশন দিয়ে মডেল করা উচিত নয়, পরে আমি এই কোডটি লিখেছিলাম:

model.lm <- lm ( proportion.55 ~ log.budget + years, data = list.45)

এই ক্ষেত্রে, "বাজেট" এখনও একটি গুরুত্বপূর্ণ ভবিষ্যদ্বাণীকারী, তবে "বছরগুলি" তুলনামূলকভাবে দুর্বল এবং তাৎপর্যপূর্ণ নয়।

এটি আমাকে উদ্বিগ্ন করে তোলে যে অনুমানের উপর আস্থা কৃত্রিমভাবে সমষ্টি দ্বারা ফুলে উঠেছে। দ্বিপদী গ্ল্যাম প্রয়োজনীয়ভাবে ডেটাটিকে ভেক্টরাইজ করে না যে মডেলটি 45 * 55 = 2,475 সারিগুলির উপর ভিত্তি করে? সত্যিই কেবল 45 টি রেস্তোঁরা এবং 55 জন তথ্যপ্রযুক্তি আছে কি তা দেওয়া উপযুক্ত? এই মিশ্র-প্রভাব মডেলিং জন্য কল করবে?


4
ইঙ্গিত: দেখুন কি হয়family=quasibinomial
বেন বলকার

1
মজাদার. অনুমানযুক্ত সহগগুলি একই, তবে মান ত্রুটিগুলি আরও রক্ষণশীল (এবং বছরগুলি কাসিবিনোমিয়াল মডেলের ক্ষেত্রে উল্লেখযোগ্য নয়)। আমি ক্যাসিবিনোমিয়ালের জন্য সহায়তা ফাইলগুলি সন্ধান করছি, তবে কী চলছে তা আপনি ব্যাখ্যা করতে পারেন? আমার ধারণাটি হ'ল মূলত ওভারডিস্পেরিয়েন্সের জন্য ক্যাসিবিনোমিয়াল ব্যবহৃত হয়। । ।
জেরেমি _

3
যথাযথভাবে। সেখানে পার্থক্য বিভিন্ন হয় lmএবং glm(...,family=binomial), কিন্তু গুরুত্বপূর্ণ বেশী এক একটি দ্বিপদ GLM ভ্যারিয়েন্স সম্পর্কে শক্তিশালী অনুমানের করে তোলে। যদি ডেটা অত্যধিক সংবেদনশীল না হয় তবে একত্রিত / একত্রিতকরণ কোনও তাত্পর্য রাখে না
বেন বলকার

1
আর আউটপুটটি দেখায় যে ছড়িয়ে পড়া প্যারামিটারটি 8.7 হিসাবে নেওয়া হয়। আমি ওভারডিস্পেরেশন সম্পর্কে এটি কী বলে তা বোঝার চেষ্টা করছি। এদিকে, বেন, আমি দেখতে পাচ্ছি যে আপনি মিশ্র মডেলগুলির সাথে যথেষ্ট ব্যাকগ্রাউন্ড পেয়েছেন। আমি কি কোনও তথ্যদাতা বা ভোটাধিকারের জন্য মিশ্রিত প্রভাব ছাড়াই দ্বিপদী গ্লাম ব্যবহার করা নিরাপদ (যে ক্ষেত্রে "ইনফর্মেন্ট আইডি" এর জন্য একটি কলাম যুক্ত করার সময় আমি সম্ভবত সমস্ত ডেটা ভেক্টরাইজ করতে পারি)?
জেরেমি _

উত্তর:


1

ওয়াই=এক্স11এক্স22এক্সএনএনLn(ওয়াই)=Ln()+ +1Ln(এক্স1)+ +2Ln(এক্স2)+ +এনLn(এক্সএন)আর2

এখন যদি আনল্টারড রিগ্রেশন রেখা (আদর্শভাবে দ্বিখণ্ডিত রিগ্রেশন, উদাহরণস্বরূপ, একটি ডেমিং রিগ্রেশন) us 0,0 through এর মধ্য দিয়ে যায় না, তবে এটি কিছুটা জটিল হয়ে যায় এবং কেউ সাধারণ ব্যবহারের চেয়ে অফসেটের আনুপাতিক লোকসান কার্যটি কমিয়ে দেয় স্কোয়ার।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.