আর-তে কোনও লজিস্টিক রিগ্রেশন মডেলের ফিটের অভাবে আমি পিয়ারসনের পরীক্ষার পরিসংখ্যানকে কীভাবে গণনা করতে পারি ?


10

সম্ভাবনা অনুপাত (ওরফে বিচ্যুতি) স্ট্যাটিস্টিক এবং অভাব-ফিট (বা ধার্মিকতা-এর-ফিট) পরীক্ষাটি আর-তে লজিস্টিক রিগ্রেশন মডেল ( ফাংশনটি ব্যবহার করে ফিট) পাওয়ার জন্য মোটামুটি সোজা However তবে এটি হতে পারে কিছু ঘর গণনা করা সহজ পর্যাপ্ত পরিমাণে শেষ হয় যে পরীক্ষাটি অবিশ্বাস্য। ফিটের অভাবে সম্ভাবনা অনুপাতের পরীক্ষার নির্ভরযোগ্যতা যাচাই করার একটি উপায় হ'ল তার পরীক্ষার পরিসংখ্যানগুলি এবং পি- মূল্যকে পিয়ারসন চি স্কোয়ারের (বা ) অভাবের-ফিটের পরীক্ষার সাথে তুলনা করা ।G2glm(..., family = binomial)χ2

কোনও glmজিনিস বা তার summary()পদ্ধতিই ফিটের অভাবে পিয়ারসনের চি স্কোয়ার পরীক্ষার পরীক্ষার পরিসংখ্যানের প্রতিবেদন করে না । আমার সন্ধানে, কেবলমাত্র আমি যে জিনিসটি সামনে এলাম তা হ'ল chisq.test()ফাংশন ( statsপ্যাকেজে): এর ডকুমেন্টেশনে বলা হয়েছে, " chisq.testচি-স্কোয়ার্ড কন্টিনজেন্সি টেবিল টেস্ট এবং গুড-অফ-ফিট টেস্ট করা হয়।" যাইহোক, এই জাতীয় পরীক্ষাগুলি কীভাবে সম্পাদন করা যায় তার বিষয়ে ডকুমেন্টেশনটি খুব কম:

যদি xএক সারি বা কলাম সহ একটি ম্যাট্রিক্স হয়, বা যদি xকোনও ভেক্টর হয় এবং yনা দেওয়া হয় তবে একটি ধার্মিকতা-ফিট ফিট পরীক্ষা করা হয় ( xএক-মাত্রিক কনজিঞ্জেন্সি টেবিল হিসাবে গণ্য করা হয়)। এর এন্ট্রিগুলি xঅবশ্যই অ-নেতিবাচক পূর্ণসংখ্যার হতে হবে। এই ক্ষেত্রে, অনুমান করা পরীক্ষিত জনসংখ্যার সম্ভাবনাগুলি সমান p, বা pদেওয়া না হলে সমস্ত সমান কিনা whether

আমি কল্পনা করতাম যে আপনি যুক্তির জন্য বস্তুর yউপাদানটি ব্যবহার করতে পারেন । তবে আপনি যুক্তির জন্য বস্তুর উপাদানটি ব্যবহার করতে পারবেন না , কারণ আপনি একটি ত্রুটি পাবেন: " "glmxchisq.testfitted.valuesglmpchisq.testprobabilities must sum to 1.

আমি কীভাবে (আরে) ম্যানুয়ালি পদক্ষেপগুলি না চালিয়ে ফিটের অভাবের জন্য কমপক্ষে পিয়ারসন পরীক্ষার পরিসংখ্যান গণনা করতে পারি ?χ2

উত্তর:


13

স্কোয়ার পিয়ারসনের অবশিষ্টাংশের যোগফল ফিটের অভাবে পিয়ারসন পরীক্ষার পরিসংখ্যানের সমান । সুতরাং যদি আপনার লাগানো মডেলটিকে (অর্থাত্, বস্তুটি) বলা হয় , নিম্নলিখিত কোডটি পরীক্ষার পরিসংখ্যান ফিরিয়ে আনবে:χ2glmlogistic.fit

sum(residuals(logistic.fit, type = "pearson")^2)

residuals.glmঅন্যান্য অবশিষ্টাংশগুলি কী কী উপলভ্য রয়েছে সে সম্পর্কে আরও তথ্যের জন্য ডকুমেন্টেশন দেখুন । উদাহরণস্বরূপ, কোড

sum(residuals(logistic.fit, type = "deviance")^2)

আপনি পরীক্ষার পরিসংখ্যান পাবেন, যেমন সরবরাহ করে।G2deviance(logistic.fit)


আমি ম্যাক্রোর সাথে একমত আপনি যদি গ্রুপটি থেকে উত্তর চান তবে অন্যদের প্রথমে কী বলতে হবে তা শুনতে আপনার অপেক্ষা করা উচিত ছিল। আপনি এখন যা কিছু পেতে পারেন তা আপনার উত্তর দেখে পক্ষপাতদুষ্ট। এছাড়াও, আপনি যদি উত্তরটি জানেন তবে আপনি এটি করে কী প্রমাণ করার চেষ্টা করছেন?
মাইকেল আর চেরনিক

@ ম্যাক্রো - ফায়ারফ্যাথার এই সাইটে চারটি প্রশ্ন পোস্ট করেছেন (এটি সহ) এবং তার মধ্যে তিনটি (এই একটি সহ) তার উত্তর দিয়েছেন, একবার তার নিজের উত্তর স্বীকার করেছে। এর মতো আরও কয়েকটি এবং আমি সম্ভবত কোনও প্যাটার্ন দেখা শুরু করব!
jboman

@ জাবোম্যান, আমি আপনার নিজের প্রশ্নের উত্তরটি কল্পনা করতে পারি যদি আপনি নিজেরাই এটির সন্ধান করেন তবে অন্য কেউ উত্তর পোস্ট করার আগে তবে ফায়ার ফ্যাথার প্রশ্ন পোস্ট করার 5 মিনিটেরও কম সময়ে আক্ষরিকভাবে একটি উত্তর পোস্ট করেছেন, মনে হয় তিনি / তার কোনও প্রয়োজন নেই , যা আমাকে জিজ্ঞাসা করতে বাধ্য করেছিল ... আমি সত্যিই অনুপ্রেরণা বুঝতে পারি না ...
ম্যাক্রো

3
@ ম্যাক্রো, দয়া করে এই অফিশিয়াল লিঙ্কটি দেখুন: blog.stackoverflow.com/2011/07/… (এটি নীচে চেকবক্স লেবেলে একটি প্রশ্ন জিজ্ঞাসা পৃষ্ঠায় লিঙ্কযুক্ত: "আপনার নিজের প্রশ্নের উত্তর দিন - আপনার জ্ঞান ভাগ করুন, প্রশ্নোত্তর ও শৈলী ")। আমি হোমওয়ার্ক করার সময় আমার এই প্রশ্নটি ছিল (মিনিতাবের পরিবর্তে আর ব্যবহার করা বেছে নেওয়া হয়েছিল, যদিও মিনিতাব ক্লাসে প্রদর্শিত হয়েছিল), তবে আমার কাছে প্রশ্নটি টাইপ করার এবং প্রতিক্রিয়ার অপেক্ষা করার মতো পর্যাপ্ত সময় ছিল না। আমি এই কর্মসূচীটি আবিষ্কার করেছি এবং এটি সম্প্রদায়ের সাথে ভাগ করে নেওয়ার সিদ্ধান্ত নিয়েছি।
ফায়ারফ্যাথ

2
@ ম্যাক্রো, আপনাকে স্বাগতম! আমি আশা করি যেখানে আমি উত্তর সরবরাহ করি না সেখানে আরও প্রশ্ন জিজ্ঞাসা করতে পারি এবং আমি জিজ্ঞাসা করি না এমন আরও প্রশ্নের উত্তর দিতে পারি। কিন্তু jbowman এর একটি প্যাটার্ন সম্পর্কে সঠিক: সম্প্রদায়ের আমার অবদান করছে আপন মনে কথা বলা দিকে tending। :) (কমপক্ষে আমি কোনওভাবে সম্প্রদায়কে অবদান রাখছি, তাই না?)
ফায়ারফ্যাথ

10

পিয়ারসন স্ট্যাটিস্টিকের একটি ডিজেনরেট ডিস্ট্রিবিউশন রয়েছে সুতরাং লজিস্টিক মডেল সদ্ব্যবহারের জন্য সাধারণভাবে সুপারিশ করা হয় না। আমি কাঠামোগত পরীক্ষাগুলি পছন্দ করি (লিনিয়ারিটি, সংযোজন)। আপনি যদি কোনও সর্বজনীন পরীক্ষা চান তবে আর rmsপ্যাকেজ ফাংশনটিতে প্রয়োগ করা হয়েছে এমন একক ডিগ্রি স্বাধীনতা লে সেসি - ভ্যান হউইলিনজেন - কোপাস - হোসমার অবিচ্ছিন্ন সমষ্টি পরীক্ষা দেখুন residuals.lrm


2
-1: অন্তর্দৃষ্টি জন্য আপনাকে ধন্যবাদ! তবে এটি আমার প্রশ্নের উত্তর দেয় না। কারণ এটি আমার প্রশ্নের পটভূমিতে আমি যে বিবৃতি দিয়েছি তা সম্পর্কিত মন্তব্য / আলোচনা, কারণ আপনার উত্তর সম্ভবত কোনও মন্তব্যে অন্তর্ভুক্ত, উত্তর না দিয়ে।
ফায়ারফ্যাথার

2
আমার অনুমান যে আমার উত্তরটির পক্ষে ভোট দেওয়া চার জন আপনার সাথে একমত নন। এবং আপনি অধঃপতন বিতরণ মোকাবেলা করেন নি।
ফ্র্যাঙ্ক হ্যারেল

@ ফ্র্যাঙ্কহারেল: এই জিওএফটি কি হোসমার-লেমেশো (এইচএল) জিওএফ পরীক্ষার চেয়ে আলাদা? নামটির কারণে ধরে নেওয়া এবং এটি দুটির সাথে তুলনাও করেছে: ResourceSelectionপ্যাকেজে পাওয়া হিসাবে পরিচালিত এইচএল জিওএফ পরীক্ষা , এবং এর ফলাফলটি resid(lrm_object, 'gof')আমার লজিস্টিক রিগ্রেশন মডেল হিসাবে ফিট করার পরে দৌড় থেকে যা পেয়েছি তার থেকে আলাদা lrm_object <- lrm(...)। যদি সেগুলি সত্যিই আলাদা হয় তবে আপনি এখানে উল্লেখ করেছেন এমনটির তুলনায় এইচএল পরীক্ষা কীভাবে স্ট্যাক করে তা মন্তব্য করতে পারেন? ধন্যবাদ!
মেগ

1
দুটি সম্পূর্ণ ভিন্ন। এইচএল পরিসংখ্যান (এখন অপ্রচলিত) স্থির df আছে এবং সাধারণত ঝুঁকি ডেস্কিলের উপর ভিত্তি করে। এইচএল পরিসংখ্যানগুলি এইভাবে হিসাবে ক্ষয় হয় না । অন্যদিকে, যে কোনও পরিসংখ্যান থেকে সাবধান থাকুন যেখানে ডিএফ সাথে প্রসারিত করে । χ2Nχ2N
ফ্র্যাঙ্ক হ্যারেল

আমি একটি সিমুলেশন দেখতে পছন্দ করব যা এই অবক্ষয় দেখায়।
wdkrnls

0

ধন্যবাদ, আমি বুঝতে পারিনি যে এটি এতটা সহজ: সমষ্টি (অবশিষ্টাংশ (এফ 1, টাইপ = "পার্সন") ^ 2) তবে দয়া করে নোট করুন যে পিয়ারসনের অবশিষ্টাংশগুলি কোভারিয়েট গ্রুপ বা পৃথকভাবে গণনা করা হয় তার উপর নির্ভর করে পরিবর্তিত হয়। একটি সহজ উদাহরণ:

এম 1 একটি ম্যাট্রিক্স (এটি একটি বৃহত্তর ম্যাট্রিক্সের প্রধান):

M1 [1: 4,1: 8]

    x1 x2 x3 obs    pi   lev  yhat y
obs  1  1 44   5 0.359 0.131 1.795 2
obs  0  1 43  27 0.176 0.053 4.752 4
obs  0  1 53  15 0.219 0.062 3.285 1
obs  0  1 33  22 0.140 0.069 3.080 3

যেখানে x1-3 পূর্বাভাসকারী সেখানে ওবস নেই। প্রতিটি গ্রুপে পর্যবেক্ষণ, পাই হ'ল গ্রুপের সদস্যতার সম্ভাবনা (রিগ্রেশন সমীকরণ থেকে পূর্বাভাস), লেভ হ'ল লিভারেজ, টুপি ম্যাট্রিক্সের তির্যক, যাহা পূর্বাভাসিত নং। (y = 1 এর) গ্রুপে এবং y এর প্রকৃত নং।

এটি আপনাকে পিয়ারসন দলে দলে দেবে। Y == 0: ' 'fun1 <- function(j){        if (m1[j,"y"] ==0){ # y=0 for this covariate pattern     Pr1 <- sqrt( m1[i,"pi"] / (1-m1[i,"pi"]))     Pr2 <- -sqrt (m1[i,"obs"]) res <- round( Pr1 * Pr2, 3) return(res) } else {  Pr1 <- m1[j,"y"] - m1[j,"yhat"] Pr2 <- sqrt(   m1[j,"yhat"] * ( 1-(m1[j,"pi"]) )   ) res <- round( Pr1/Pr2, 3) return(res) }    }

এইভাবে

nr <-nrow(m1)
nr1 <- seq(1,nr)
Pr <- sapply(1:nrow[m1], FUN=fun1)
PrSj <- sum(Pr^2)

যদি y = 0 কোভেরিয়েট নিদর্শন সহ বৃহত্তর সাবজেক্ট থাকে তবে 'ইন্ডিভিউয়াল' পদ্ধতির পরিবর্তে 'গ্রুপ অনুসারে' ব্যবহার করে গণনা করার সময় পিয়ার্সের অবশিষ্টাংশগুলি আরও বড় হবে।

উদাহরণস্বরূপ হোসমার এবং লেমশো "অ্যাপ্লাইড লজিস্টিক রিগ্রেশন", উইলি, ২০০ দেখুন।


0

আপনি c_hat(mod)যে একই আউটপুট দিতে হবে তা ব্যবহার করতে পারেন sum(residuals(mod, type = "pearson")^2)


1
কোন প্যাকেজ c_hatপাওয়া যায়?
আগুন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.