কোন সিউডো-


55

আমার কাছে SPSSলজিস্টিক রিগ্রেশন মডেলের আউটপুট রয়েছে। আউটপুট মডেল ফিট করার জন্য দুটি পদক্ষেপের প্রতিবেদন করে Cox & Snellএবং Nagelkerke

সুতরাং থাম্বের একটি নিয়ম হিসাবে, এই পদক্ষেপের মডেল ফিট হিসাবে আপনি রিপোর্ট করবেন?R²

অথবা, সাধারণত কোন জার্নালে রিপোর্ট করা হয় এমন কোন সূচকগুলি সূচক হয়?


কিছু পটভূমি: কিছুটা পরিবেশগত পরিবর্তনশীল (যেমন, খাড়া হওয়া, গাছপালার আচ্ছাদন, ...) থেকে কোনও পাখির উপস্থিতি বা অনুপস্থিতি (ক্যাপেরাইলি) উপস্থিতি অনুমানের চেষ্টা করে। দুর্ভাগ্যক্রমে, পাখিটি প্রায়শই দেখা যায় না (35 টি হিট থেকে 468 মিস করে) তাই রিগ্রেশনটি খারাপভাবে সম্পাদন করে। কক্স অ্যান্ড স্নেল .09, নাগেলকার্কে, .23।

বিষয়টি পরিবেশ বিজ্ঞান বা বাস্তুশাস্ত্র।


3
দুর্দান্ত ইউসিএলএ পরিসংখ্যান সহায়তা সাইটের বিভিন্ন সিউডো এর কীভাবে তারা একে অপরের সাথে সম্পর্কিত তা বর্ণনা করে একটি দুর্দান্ত পৃষ্ঠা রয়েছেR2
গং - মনিকা পুনরায়

এখানে দুটি লিঙ্ক রয়েছে যা সঠিক নন-প্যারাম্যাট্রিক আলগোরিদম নিয়ে আলোচনা করে যা লজিস্টিক রিগ্রেশন মডেলের যথার্থতাকে সর্বাধিক করে তোলে izes আপনি যদি এই উপায়ে আপনার ডেটা ব্যবহার করেন তবে নমুনায় প্রয়োগ করার সাথে সাথে এটি আপনার লজিস্টিক রিগ্রেশন মডেলের শ্রেণিবিন্যাসের কার্যকারিতা বাড়িয়ে তুলবে। উদাহরণ 1: onlinelibrary.wiley.com/doi/10.1111/j.1540-5915.1991.tb01912.x/… উদাহরণ 2: epm.sagepub.com/content/54/1/73.abstract
user31256

1
নতুন ইউসিএলএ লিঙ্ক: stats.idre.ucla.edu/other/mult-pkg/faq/general/…
অ্যারন - মনিকা

উত্তর:


74

সাধারণত আমি প্রতিবেদন করতাম না । হোসমার এবং লেমেশো তাদের পাঠ্যপুস্তক প্রয়োগকৃত লজিস্টিক রিগ্রেশন (২ য় সংস্করণ ) এ ব্যাখ্যা করুন কেন:R2

সাধারণভাবে, [ ব্যবস্থা] ফিটেড মডেল থেকে [বেস বেস) থেকে প্রাপ্তদের কাছে পূর্বাভাসিত মানগুলির বিভিন্ন তুলনার উপর ভিত্তি করে তৈরি করা হয়, কোনও ডেটা বা আটকানো একমাত্র মডেল নয় এবং ফলস্বরূপ, সদর্থকের মূল্যায়ন করবেন না -fit। আমরা মনে করি ফিটের প্রকৃত পরিমাপ হ'ল ফিট মডেল থেকে ভবিষ্যদ্বাণী করা মানগুলির তুলনা করার ভিত্তিতে কঠোরভাবে ভিত্তি করে।R2

[পি। 164.]

এর বিভিন্ন এমএল সংস্করণ , "সিউডো " স্ট্যাটাস সম্পর্কিত, তারা উল্লেখ করেছেন যে এটি "রুটিন ব্যবহারের জন্য সুপারিশ করা হয় না, কারণ এটি ব্যাখ্যা করার মতো স্বজ্ঞাততাই সহজ নয়", তবে তারা এটি বর্ণনা করতে বাধ্য বোধ করেন কারণ বিভিন্ন সফ্টওয়্যার প্যাকেজ এটি রিপোর্ট।আর 2R2R2

তারা এই আলোচনাটি লেখার মাধ্যমে শেষ করেছেন,

... লজিস্টিক রিগ্রেশনের নিম্ন মানগুলি আদর্শ এবং লিনিয়ার রিগ্রেশন মানগুলি অভ্যস্ত শ্রোতার কাছে তাদের মানগুলি রিপোর্ট করার সময় এটি একটি সমস্যা উপস্থাপন করে। ... এইভাবে [পাঠ্যে উদাহরণ হিসাবে চলমান উদাহরণগুলির প্রসঙ্গে বিতর্ক করে] আমরা লাগানো লজিস্টিক মডেলগুলির ফলাফল সহ মানগুলির রুটিন প্রকাশের প্রস্তাব দিই না । যাইহোক, তারা প্রতিযোগী মডেলগুলি মূল্যায়নের পরিসংখ্যান হিসাবে মডেল বিল্ডিং রাজ্যে সহায়ক হতে পারে।আর 2R2R2

[পি। 167]

কিছু বড় লজিস্টিক মডেলগুলির সাথে আমার অভিজ্ঞতা (100 কে থেকে 300 কে রেকর্ড, 100 - 300 ব্যাখ্যামূলক ভেরিয়েবল) ঠিক যেমনটি এইচএন্ড এল বর্ণনা করেছেন। আমি আমার ডেটা দিয়ে প্রায় 0.40 পর্যন্ত তুলনামূলকভাবে উচ্চতর অর্জন করতে পারি । এগুলি 3% থেকে 15% (ভ্রান্ত নেতিবাচক এবং মিথ্যা ধনাত্মক, ভারসাম্যযুক্ত, 50% হোল্ড-আউট ডেটাসেট ব্যবহার করে নিশ্চিত হওয়া হিসাবে) শ্রেণিবদ্ধকরণের ত্রুটির হারের সাথে মিল রয়েছে। এইচ ও এল hinted হিসেবে আমি ক্লায়েন্ট (ক অত্যাধুনিক পরামর্শক নিজেকে কার সাথে পরিচিত ছিল disabusing অনেক সময় ব্যয় করতে হয়েছে ) বিষয়ে এবং তাকে (কি বিশ্লেষণে গুরুত্বপূর্ণ ফোকাস করতে শ্রেণীবিন্যাস ত্রুটি পেয়ে হার)। আমি analysis উল্লেখ ছাড়াই আপনার বিশ্লেষণের ফলাফলগুলি বর্ণনা করার জন্য উষ্ণতার সাথে সুপারিশ করতে পারি , যা না ভ্রান্ত হওয়ার সম্ভাবনা বেশি।আর 2 আর 2 আর 2R2R2R2R2


1
(+1) আমি প্রথমে আমার প্রতিক্রিয়াটি প্রসারিত করার কথা ভাবছিলাম (এটি আপনার পরে এসেছিল) তবে অবশ্যই আপনার উত্তর স্বয়ংসম্পূর্ণ।
chl

এর জন্য ধন্যবাদ, আমি বর্তমানে যে প্রকল্পে কাজ করছি তার জন্য সহায়ক - এবং পুরোপুরি অর্থপূর্ণ।
ব্র্যান্ডন বার্টেলসেন

1
@ ভুবার: আমিও সঠিক শ্রেণিবদ্ধের দিকে ঝুঁকতে দেখি। রেট, তবে আমি পাঠ্যপুস্তক এবং ওয়েবসাইটগুলিতে অসংখ্য উল্লেখ দেখেছি যে বিশ্লেষকদের তাদের উপর আস্থা না রাখার বিষয়ে সতর্ক করে দেওয়া এবং সিউডো-আরএসকিউ এর সীমাবদ্ধতা সত্ত্বেও জোর দিয়ে বলা, এটি একটি ফায়ার মেট্রিক। আমি প্রায়শই এমন কিছু পড়ি যা আমার নিজস্ব বিশ্লেষণগুলিতে কিছুটা ডিগ্রি দ্বারা বহনযোগ্য মনে হয়: প্রদত্ত ভবিষ্যদ্বাণীকারী সিউডো-আরএসকিউ যুক্ত করার সাথে উপরে উঠতে পারে (এবং অন্যান্য মেট্রিকগুলি যোগফল থেকে কোনও উপকারের ইঙ্গিত দেবে) যখন সঠিক শ্রেণিবিন্যাসের হার ব্যর্থ হয়, এবং যে কারও উপর নির্ভর করা উচিত নয়। আপনি কি এই কোন চিন্তা দিয়েছেন?
Rolando2

4
@ রোল্যান্ডো 2 হ্যাঁ, আমার আছে। এটি ভেরিয়েবলের অন্তর্ভুক্তিকে ন্যায্যতা দিতে সিউডো- কতটুকু উচিৎ তা নিয়ে প্রশ্ন উঠেছে । আমি সন্দেহ করি যে আপনার "সঠিক শ্রেণিবিন্যাসের হার" ইন-স্যাম্পল হারকে বোঝাতে পারে , অবশ্যই কোনটি পক্ষপাতদুষ্ট। যদি এটি সঠিক হয় তবে আপনি যা পড়েছেন তা কেবল দুটি নিকৃষ্ট পরিসংখ্যানের সাথে তুলনা করে। নমুনা থেকে বের হার ছদ্ম- চেয়ে একটি সূচক অনেক বেশী দরকারী । আর 2R2R2
whuber

1
+1 টি। এছাড়াও, আপনার উত্তরের সূক্ষ্ম অংশে প্রসারিত করার জন্য, আপনি শ্রেণিবিন্যাস ত্রুটির হারগুলি উল্লেখ করেছেন যা বহুবচন এবং যথার্থতার সাথে বিভ্রান্ত হওয়া উচিত নয় । - গণনার একটি বিভ্রান্তির ম্যাট্রিক্স থেকে বেরিয়ে আসতে পারে অনেক প্রকারের আছে সঠিকতা , মিথ্যা ইতিবাচক হার , স্পষ্টতা , ইত্যাদি - এবং যা এক আমরা যত্নশীল আবেদন উপর নির্ভর করে। এছাড়াও, আপনি আউট-অফ-স্যাম্পলটির পার্থক্য তৈরি করেন যা ক্রস বৈধতা থেকে পৃথক , তবে কখনও কখনও এটির সাথে বিভ্রান্ত হয়।
ওয়েইন

27

উভয় সূচকগুলি সংযুক্তির শক্তির পদক্ষেপ (যেমন কোনও ভবিষ্যদ্বাণী ফলাফলের সাথে সম্পর্কিত কিনা, এলআর পরীক্ষার মতো) এবং ভবিষ্যদ্বাণীমূলক ক্ষমতা বা মডেল পারফরম্যান্সের পরিমাণ প্রমাণ করতে ব্যবহার করা যেতে পারে। একজন একক ভবিষ্যদ্বাণী ফলাফলের উপর উল্লেখযোগ্য প্রভাব ফেলতে পারে তবে স্বতন্ত্র প্রতিক্রিয়ার পূর্বাভাস দেওয়ার জন্য এটি প্রয়োজনীয়ভাবে কার্যকর নাও হতে পারে , সুতরাং সামগ্রিকভাবে মডেলটির কার্যকারিতা মূল্যায়নের প্রয়োজন (রিং। নাল মডেল)। শ্রীকান্ত বলেছিলেন, নাগেলকার্কে দরকারী কারণ এটির সর্বোচ্চ মূল্য 1.0 রয়েছে 1.0 এটি সম্ভাবনা অনুপাত থেকে গণনা করা এর একটি সাধারণ সংস্করণ ,আর 2 আর 2 এলআর = 1 - এক্সপ্রেস ( - এলআর / এন )R2R2RLR2=1exp(LR/n), যা সামগ্রিক সংস্থার জন্য ওয়াল্ড পরিসংখ্যানের সাথে সংযোগ রয়েছে, যা মূলত কক্স এবং স্নেল দ্বারা প্রস্তাবিত। ভবিষ্যদ্বাণীমূলক দক্ষতার অন্যান্য সূচকগুলি হ'ল ব্রিয়ার স্কোর, সি ইনডেক্স (সম্মতি সম্ভাবনা বা আরওসি অঞ্চল), বা সামার্স ডি, পরের দুটি অনুমানমূলক বৈষম্যের আরও ভাল পরিমাপ সরবরাহ করে।

শুধুমাত্র লজিস্টিক রিগ্রেশন তৈরি অনুমানগুলোর যে রৈখিকতা এবং additivity (+ + স্বাধীনতা)। যদিও অনেকগুলি বিশ্বব্যাপী ফিটনেস-অফ-ফিট পরীক্ষাগুলি (যেমন হোসমার ও লেমশো i পরীক্ষা, তবে @ ইউনেস্টপের কাছে আমার মন্তব্য দেখুন ) প্রস্তাবিত হয়েছে, তাদের সাধারণত পাওয়ারের অভাব থাকে। মডেল হইয়া নির্ধারণে জন্য, এটি চাক্ষুষ মাপদণ্ড (স্তরীভূত অনুমান, nonparametric মসৃণকরণ) যে পূর্বাভাস এবং পালিত ফলাফল মধ্যে স্থানীয় বা আন্তর্জাতিক দুর্ভিক্ষ (যেমন অ রৈখিকতা বা পারস্পরিক আদানপ্রদান) স্পট করতে সাহায্য উপর নির্ভর করাই ভালো, এবং এই Harrell এর মূলত বিস্তারিত আরএমএস বিলিপত্র । সম্পর্কিত বিষয়ে (ক্রমাঙ্কন পরীক্ষা), স্টিয়েরবার্গ ( ক্লিনিকাল প্রেডিকশন মডেলস)χ2, ২০০৯) পর্যবেক্ষণের ফলাফল এবং পূর্বাভাসযুক্ত সম্ভাবনার মধ্যে চুক্তিটি মূল্যায়নের জন্য একই পদ্ধতির দিকে ইঙ্গিত করে:

ক্রমাঙ্কন হ'ল ধার্মিকতার সাথে সম্পর্কিত, যা কোনও নির্দিষ্ট উপাত্তের সেটকে ফিট করার জন্য কোনও মডেলের দক্ষতার সাথে সম্পর্কিত। সাধারণত, কোনও ভবিষ্যদ্বাণী মডেলের ফিটের অভাবে সমস্ত ধরণের বিরুদ্ধে ভাল ক্ষমতা আছে এমন কোনও একমাত্র ধার্মিকতা-ফিট-টেস্ট পরীক্ষা নেই। ফিটের অভাবের উদাহরণগুলি অ-রৈখিকতা, মিথস্ক্রিয়া বা রৈখিক ভবিষ্যদ্বাণী এবং ফলাফলের মধ্যে একটি অনুপযুক্ত লিঙ্ক ফাংশন মিস হয়। Good স্ট্যাটিস্টিক সহ গুডনেস অফ ফিট fit (পৃষ্ঠা 274)χ2

তিনি দৃoot়ভাবে পর্যবেক্ষণ করা ফলাফল এবং ভবিষ্যদ্বাণী করা সম্ভাব্যতার মধ্যে প্রত্যক্ষভাবে বা তথাকথিত হ্যারেলের ই পরিসংখ্যানগুলির সাথে নিখুঁত পার্থক্যের উপর নির্ভর করার পরামর্শও দিয়েছেন।

আরও বিশদ হ্যারেলের বই, রিগ্রেশন মডেলিং কৌশলগুলি (পৃষ্ঠা 203-205, 230-244, 247-249) পাওয়া যাবে। আরও সাম্প্রতিক আলোচনার জন্য, আরও দেখুন

স্টিয়ারবার্গ, ইডাব্লু, ভিকার্স, এজে, কুক, এনআর, গার্ডস, টি, গোনেন, এম, ওবুচোস্কি, এন, পেনসিনা, এমজে, এবং ক্যাটান, এমডাব্লু (2010)। প্রেডিক্সন মডেল, ঐতিহ্যবাহী এবং উপন্যাস ব্যবস্থা জন্য একটি কাঠামোর পারফরমেন্স মূল্যায়নএপিডেমিওলজি , 21 (1) , 128-138।


আপনি কি "ফিটনেসের ধার্মিকতা" এবং সংযুক্তির শক্তি বা ভবিষ্যদ্বাণীমূলক দক্ষতার মধ্যে পার্থক্যটি ব্যাখ্যা করতে পারেন?
অ্যান্ডি ডব্লু

@ অ্যান্ডি এটি দেখানোর জন্য ধন্যবাদ। আমি পরে বুঝতে পারি যে আমার প্রথম বাক্যটি সত্যই ভাল শোনাচ্ছে না। আমি আমার উত্তর আপডেট করব, দয়া করে আপনার সাথে ঠিক আছে কিনা তা আমাকে জানান।
chl

আপডেটের জন্য ধন্যবাদ এবং এটি পার্থক্য স্পষ্ট করে।
অ্যান্ডি ডব্লিউ

21

আমি ভাবতাম লজিস্টিক রিগ্রেশনের জন্য কোনও ধরণের পরিমাপের মূল সমস্যাটি হ'ল আপনি এমন একটি মডেলটির সাথে কাজ করছেন যা একটি জ্ঞাত শব্দের মান রয়েছে। এটি স্ট্যান্ডার্ড লিনিয়ার রিগ্রেশন-এর বিপরীতে যেখানে শব্দের স্তরটি সাধারণত অজানা হিসাবে বিবেচিত হয়। এর জন্য আমরা একটি গ্ল্যাম সম্ভাব্যতা ঘনত্ব ফাংশন লিখতে পারি:R2

f(yi|μi,ϕ)=exp(yib(μi)c(μi)ϕ+d(yi,ϕ))

যেখানে পরিচিত ফাংশন এবং বিপরীত লিঙ্ক ফাংশনের জন্য । আমরা যদি সাধারণ জিএলএম ডিভ্যান্সের অবশিষ্টাংশগুলি হিসাবে সংজ্ঞায়িত করিb(.), c(.), d(.;.)μi=g1(xiTβ)g1(.)

di2=2ϕ(log[f(yi|μi=yi,ϕ)]log[f(yi|μi=μ^i,ϕ)])=2ϕ[yib(yi)yib(μ^i)c(yi)+c(μ^i)]
আমাদের রয়েছে (সম্ভাবনা অনুপাত চি-বর্গের মাধ্যমে, )χ2=1ϕi=1Ndi2

E(i=1Ndi2)=E(ϕχ2)(Np)ϕ

যেখানে মাত্রা । লজিস্টিক রিগ্রেশন জন্য আমাদের , যা জানা যায়। সুতরাং আমরা এটিকে "গ্রহণযোগ্য" বা "যুক্তিসঙ্গত" এমন একটি নির্দিষ্ট স্তরের অবশিষ্টাংশের সিদ্ধান্ত নেওয়ার জন্য এটি ব্যবহার করতে পারি। এটি সাধারণত ওএলএস নিগ্রহের জন্য করা যায় না (যদি না আপনি গোলমাল সম্পর্কে পূর্বের তথ্য না থাকে)। যথা, আমরা আশা করি প্রতিটি বিচ্যুতি অবশিষ্টাংশ প্রায় । অনেকগুলি এবং এটি সম্ভবত কোনও গুরুত্বপূর্ণ প্রভাবগুলি মডেল (আন্ডার-ফিটিং) থেকে অনুপস্থিত হতে পারে; অনেকগুলি এবং এটি সম্ভবত অপ্রয়োজনীয় বা প্রভাব রয়েছে (ওভার-ফিটিং)। (এগুলি মডেল অপব্যবহারের অর্থও হতে পারে)।pβϕ=11di21di21

এখন এর অর্থ সিউডো- জন্য সমস্যাটি এটি বিবেচনায় নিতে ব্যর্থ হয় যে দ্বিপদী পরিবর্তনের মাত্রা অনুমানযোগ্য (তবে দ্বিপদী ত্রুটির কাঠামো নিয়ে প্রশ্ন তোলা হচ্ছে না)। সুতরাং নাগেলকারকে থেকে মধ্যে সত্ত্বেও এটি এখনও সঠিকভাবে মাপা যায় না। অতিরিক্ত হিসাবে, আমি দেখতে পাচ্ছি না যে এগুলিকে সিউডো কেন বলা হয় যদি আপনি একটি পরিচয় লিঙ্ক এবং সাধারণ ত্রুটির সাথে "জিএলএম" ফিট করেন তবে সেগুলি যদি সাধারণ সমান না হয় । উদাহরণস্বরূপ, সাধারণ ত্রুটির জন্য সমতুল্য কক্স-স্নেল আর-স্কোয়ার (ভেরিয়েন্সের আরএমএল প্রাক্কলন ব্যবহার করে) দেওয়া হয়েছে:R201R2R2

RCS2=1exp(NpNROLS21ROLS2)

যা অবশ্যই অদ্ভুত লাগে।

আমি মনে করি আরও ভাল "ফিটনের গুডি" পরিমাপ হ'ল বিচ্যুতির অবশিষ্টাংশের যোগফল, । এটি মূলত কারণ আমাদের লক্ষ্য অর্জনের একটি লক্ষ্য রয়েছে।χ2


শ্রীকান্তের উত্তরের পরে মন্তব্যে +1 ইস্যুগুলির চমৎকার প্রকাশের ইঙ্গিত দেয়
হোবার

প্রদত্ত যে দ্বিপদী জিএলএম পুনরাবৃত্তভাবে সর্বনিম্ন স্কোয়ারগুলি ব্যবহার করে ফিট হবে, তবে ফিটের গুণমানের পরিমাপ হিসাবে কেউ কেন সর্বশেষ আইআরএলএস পুনরাবৃত্তির সাথে ওজনযুক্ত সর্বনিম্ন বর্গগুলির আর 2 রিপোর্ট করতে পারে না যার সাথে জিএলএম ফিট ছিল? যেমনটি স্ট্যাটাস.স্ট্যাকেক্সেঞ্জার / প্রশ্নস / ৪১২৫৮০/২ ?
টম ভেনসিলিয়ার্স

16

আমি টিজুর সংক্ষিপ্ত কাগজটি "লজিস্টিক রিগ্রেশন মডেলগুলিতে সংকল্পের সহগ - একটি নতুন প্রস্তাব: বৈষম্যের সহগ" (২০০৯, আমেরিকান পরিসংখ্যানবিদ ) লজিস্টিক মডেলগুলিতে যথেষ্ট আলোকিতকরণের সংখ্যার সংখ্যার জন্য বিভিন্ন প্রস্তাব পেয়েছি on তিনি উপকারিতা এবং কনসকে হাইলাইট করে একটি ভাল কাজ করেন - এবং অবশ্যই একটি নতুন সংজ্ঞা দেয়। খুব প্রস্তাবিত (যদিও আমার নিজের পছন্দ নেই)।


1
সেই কাগজটি দেখানোর জন্য ধন্যবাদ; একরকম আমি এটিকে মিস করেছি (এবং এটি যখন উপস্থিত হয়েছিল তখন আমি একটি বড় লজিস্টিক রিগ্রেশন প্রকল্পের মাঝামাঝি ছিলাম!)।
whuber

3
রেকর্ডের জন্য, এই নতুন সংজ্ঞাটি হ'ল , যা প্রতিক্রিয়া জন্য গড় পূর্বাভাস মান প্রতিক্রিয়াগুলির গড় গড় পূর্বাভাস মান । এটি থেকে পর্যন্ত হতে পারে । টিজুর নাগেলকার্কে সিউডো কে বরখাস্ত করেন না , তবে এটির পরামর্শ দিয়েছেন যে এটি দ্বারা উপভোগ করা "স্বজ্ঞাত আবেদন" এর অভাব রয়েছে । 1 0 0 1 আর 2 ডিD=π^¯1π^¯01001R2D
শুক্র

8

আমি 'তাদের কোনওটিই' বলতে যাচ্ছিলাম না, তাই আমি whuber এর উত্তরকে অগ্রাহ্য করেছি।

আর ^ 2 সমালোচনা করার পাশাপাশি হোসমার ও লেমশো লজিস্টিক রিগ্রেশন-এর জন্য কখনও কখনও উপকারী যে ধার্মিকতার জন্য উপযুক্ত বিকল্পের ব্যবস্থাও করেছিলেন। এটি পূর্বাভাসপ্রাপ্ত সম্ভাব্যতার (বা সমতুল্যভাবে, লিনিয়ার ভবিষ্যদ্বাণী) অর্ডার করে সমান আকারের 10 টি (বা যতটা সম্ভব কাছাকাছি) গ্রুপে ডেটা বিভক্ত করার উপর ভিত্তি করে তারপরে প্রতিটি গ্রুপের প্রত্যাশিত সংখ্যার প্রত্যাশিত সংখ্যার সাথে তুলনা করে এবং একটি চি-স্কোয়ার্ড পরীক্ষা করা। বেশিরভাগ পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার প্যাকেজগুলিতে এই 'হোস্টার-লেমশো ধার্মিকতা-অফ-ফিট পরীক্ষা' প্রয়োগ করা হয়।


3
আসল এইচএল i Go জিওএফ পরীক্ষাটি খুব শক্তিশালী নয় কারণ এটি নির্বিঘ্নে ভবিষ্যদ্বাণীকারী স্কেলকে একটি স্বেচ্ছাসেবী সংখ্যায় গ্রুপে শ্রেণিবদ্ধ করার উপর নির্ভর করে; এইচ ও এল ডেসিলিকে বিবেচনা করার প্রস্তাব দিয়েছিল, তবে স্পষ্টতই এটি নমুনার আকারের উপর নির্ভর করে এবং কিছু পরিস্থিতিতে (যেমন আইআরটি মডেল) আপনার প্রায়শই খুব কম লোক থাকে স্কেলের এক বা উভয় প্রান্তে যেমন কাটাফগুলি অসম স্থানযুক্ত। লজিস্টিক রিগ্রেশন মডেল, স্ট্যাটাসের জন্য ধার্মিকতার সাথে ফিটনেস পরীক্ষার তুলনা দেখুন। মেড। 1997 16 (9): 965, j.mp/aV2W6Iχ2
chl

ধন্যবাদ চি, এটি একটি দরকারী রেফ, যদিও আপনার জে.এম.পি লিঙ্কটি আমাকে একটি বিবিলিও-ইনসারম লগইন প্রম্পটে নিয়ে গেছে। এখানে একটি ডোয়
অনটপ

ভুল লিঙ্কটির জন্য দুঃখিত ... আমি মনে করি ফ্র্যাঙ্ক হ্যারেলের Designপ্যাকেজটিতে বিকল্প এইচএন্ডএল 1 ডিএফ পরীক্ষার বৈশিষ্ট্য রয়েছে।
chl

3

মডেলটি পুরোপুরি ফিট করে যখন আপনার মডেলটি নিখুঁত ফিট থেকে কতটা দূরে of নিখুঁত মডেল ফিটের জন্য কক্স এবং শেল 1 অর্জন করে না এবং তাই 0.09 এর মান ব্যাখ্যা করা কিছুটা শক্ত। বিভিন্ন ধরণের ফিটের ব্যাখ্যার জন্য সিউডো আরস্কয়ার্ডে আরও তথ্যের জন্য এই url দেখুন ।


8
একটি "নিখুঁত ফিট" কোনও বাস্তবসম্মত লজিস্টিক রিগ্রেশন অর্জনের থেকে এত দূরে যে এটিকে রেফারেন্স বা মান হিসাবে ব্যবহার করা অন্যায় বলে মনে হয়।
হোবার

1
@ হুবুহু ট্রু তবে আপনি দুটি প্রতিযোগী মডেলের আপেক্ষিক পারফরম্যান্সের তুলনায় মানটি ব্যবহার করতে পারেন। আপনার উত্তরে আপনার নিম্ন আর ^ 2 এর পয়েন্টগুলি এবং এর প্রভাবগুলি ভাল পয়েন্ট তবে আপনার যদি (উদাহরণস্বরূপ, পর্যালোচকরা এটির দাবি করেন) আর some 2 এর কিছু ফর্ম ব্যবহার করেন তবে নাগেলকার্কে ভাল।

1
@ স্ক্রিড্যান্ট হ্যাঁ, এখনও পর্যালোচকদের সমস্যা যারা এবং বনফেরোনি সংশোধন সর্বত্র দেখতে চায় ...R2
chl

@ শ্রিকান্ট, @ সিএইচএল: এই থ্রেডটির একটি ছদ্মবেশী পাঠ্য এই সফ্টওয়্যার রিপোর্টগুলির মধ্যে কেবলমাত্র বৃহত্তম আর ^ 2 বাছাইয়ের পরামর্শ দিবে ;-)।
whuber

2
@ সিএইচএল পর্যালোচনা / ক্লায়েন্টদের পুশ-ব্যাক অফার করা অবশ্যই প্রয়োজনীয় তবে মাঝে মাঝে আমাদের ব্যবহারিকও হতে হয়। পাঠকরা যদি কম আর ^ 2 এর পর্যাপ্ত মডেল পারফরম্যান্সের অভাব হিসাবে ভুল ব্যাখ্যা না করেন তবে @ হোয়াইটারের উত্থাপিত সমস্যাগুলি কিছুটা হলেও প্রশমিত হবে।

3

সিউডো-আর-স্কোয়ার্ডগুলি ব্যবহার করার বিরুদ্ধে তর্ক সত্ত্বেও কিছু লোক বিভিন্ন কারণে কমপক্ষে নির্দিষ্ট সময়ে তাদের ব্যবহার চালিয়ে যেতে চাইবে। আমি আমার পড়া থেকে যা অভ্যন্তরীণ করেছি (এবং আমি দুঃখিত যে আমি এই মুহূর্তে উদ্ধৃতি দিতে পারি না) সেটাই

  • যদি সিএন্ডএস এবং নাগ উভয়ই হয়। .5 এর নীচে রয়েছে, সিএন্ডএস আরও ভাল গেজ হবে;
    যদি তারা উভয় উপরে .5, নাগ। ইচ্ছাশক্তি; এবং
    যদি তারা .5, প্যান্ট।

এছাড়াও, এমন একটি সূত্র যার ফলস্বরূপ ফলিত লজিস্টিক রিগ্রেশন অ্যানালাইসিস (সেজে) স্কট মেনার্ড দ্বারা উল্লিখিত, এই দুটিগুলির মধ্যে প্রায়শই পড়ে যায়

[-2LL0 - (-2LL1)]/-2LL0.

এটি নীচের চার্টে "এল" হিসাবে চিহ্নিত করা হয়েছে।

এখানে চিত্র বর্ণনা লিখুন


এই ছবিটি কী দেখায় (অনুভূমিক অক্ষটি কীসের জন্য দাঁড়ায়)? এছাড়াও, শেষ সূত্রটি (যা একটি মাপা সম্ভাবনা অনুপাতের পরিসংখ্যানের মতো দেখায়) নাগেল্কার্ক ঠিক কীভাবে পৃথক হয় ? R2
chl

বিশ্লেষণ #: আমি বিভিন্ন ডেটাसेट দিয়ে বিভিন্ন বিশ্লেষণ চেষ্টা করেছি tried নাগেলকার্কের সূত্রটি সহজে হাতে পাবেন না তবে আমি বাজি ধরছি এটি সহজলভ্য।
Rolando2

পল অ্যালিসন Nagelkerke সূত্র, যা একটি উর্ধ্বগামী সমন্বয়কৃত কক্সবাজার ও Snell সূত্র এ কভার statisticalhorizons.com/2013/02 । এই ব্লগটি পড়ার পরে এবং সাধারণত এই আলোচনার বেশিরভাগ ক্ষেত্রে 2-3 বছর পরে, আমি আরও দৃ become় বিশ্বাসী হয়ে উঠছি যে কক্স অ্যান্ড স্নেলের অপ্রত্যাশিত লোকেরা তারতম্য ব্যাখ্যা করেছিল এবং আমি সি অ্যান্ড এস এবং নাগেলকার্কের ফলাফলের গড়ের চেয়ে ভাল।
রোল্যান্ডো 2
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.