কোন ডায়াগনস্টিকস জিএলএমের কোনও নির্দিষ্ট পরিবারের ব্যবহারকে বৈধতা দিতে পারে?


19

এটি এত প্রাথমিক বলে মনে হচ্ছে তবে আমি সর্বদা এই মুহূর্তে আটকে যাই ...

আমি যে ডেটাগুলি নিয়ে কাজ করি সেগুলির বেশিরভাগই অ-স্বাভাবিক এবং কোনও GLM কাঠামোর উপর ভিত্তি করে বিশ্লেষণের বেশিরভাগ। আমার বর্তমান বিশ্লেষণের জন্য, আমার একটি প্রতিক্রিয়া পরিবর্তনশীল যা "ওয়াকিং স্পিড" (মিটার / মিনিট)। আমি ওএলএস ব্যবহার করতে পারি না তা সনাক্ত করা আমার পক্ষে সহজ, তবে তবে কোন পরিবার (গামা, ওয়েইবুল, ইত্যাদি) উপযুক্ত তা সিদ্ধান্ত নেওয়ার ক্ষেত্রে আমার অনেক অনিশ্চয়তা রয়েছে!

আমি স্টাটা ব্যবহার করি এবং রেসিডুয়ালিগুলি এবং হেটেরোসিসেস্টাস্টিটি, রেসিডুয়ালগুলি বনাম ফিটেড মান ইত্যাদি,

আমি সচেতন যে গণনা তথ্যগুলি হারের আকার নিতে পারে (উদাহরণস্বরূপ ঘটনাগুলির হার) এবং গামা ব্যবহার করেছে (অতিমাত্রায় বিযুক্ত নেতিবাচক দ্বিপদী মডেলগুলির অ্যানালগ), তবে কেবল "ধূমপান বন্দুক" হ্যাঁ হ্যাঁ, আপনার অধিকার আছে বলে পরিবার. এটি করার জন্য কি মানসম্পন্ন অবশিষ্টাংশ বনাম লাগানো মানগুলির একমাত্র এবং সর্বোত্তম উপায়ে দেখছেন? আমি ডেটাতে কিছু স্তরক্রমের জন্য অ্যাকাউন্ট করতে একটি মিশ্র মডেল ব্যবহার করতে চাই, তবে প্রথমে আমার প্রতিক্রিয়া পরিবর্তনশীলটির পরিবারটি কী বর্ণনা করে তা প্রথমে সাজিয়ে নেওয়া দরকার।

কোন সাহায্য প্রশংসা। স্টাটা ভাষার বিশেষভাবে প্রশংসা!


4
" আমি" ধূমপান বন্দুক "হ্যাঁ বলতে চাই, হ্যাঁ, আপনি সঠিক পরিবার " - এটি আপনাকে কিছুই বলবে না। আপনি সর্বোত্তম আশা করতে পারেন এমন একটি পরিবার যা পরিষ্কারভাবে ভুল নয়। আপনি একটি বিতরণকারী পরিবার চয়ন করতে পারেন এমন অনেকগুলি উপায় রয়েছে তবে সাধারণভাবে এটি কোনও প্রাকৃতিক বা তাত্ত্বিক বিবেচনার সংমিশ্রণ এবং ডেটা থেকেই সংকেতকে জড়িত করে।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


14

আমার কিছু টিপস রয়েছে:

(1) অবশিষ্টদের কীভাবে ফিটের সাথে তুলনা করা উচিত তা সবসময় স্পষ্ট নয়, তাই নির্দিষ্ট মডেলগুলির জন্য ডায়াগনস্টিকের সাথে পরিচিত হওয়া ভাল। লজিস্টিক রিগ্রেশন মডেলগুলিতে, উদাহরণস্বরূপ, হোসমার-লেমশো স্ট্যাটিস্টিকসটি ফিটের সদ্ব্যবহারের মূল্যায়ন করতে ব্যবহৃত হয়; উত্থাপিত মানগুলি যেখানে খুব কম, খুব ছোট বা প্রায় সমান; & শীঘ্রই.

(২) কখনও কখনও মডেলগুলির একটি পরিবারকে অন্যের বিশেষ ক্ষেত্রে হিসাবে দেখা যায়, তাই আপনি চয়ন করতে সহায়তা করার জন্য প্যারামিটারে একটি অনুমান পরীক্ষা ব্যবহার করতে পারেন। উদাহরণস্বরূপ এক্সফেনশনাল বনাম ওয়েইবুল।

(৩) আকাইকের তথ্য মানদণ্ড বিভিন্ন মডেলের মধ্যে নির্বাচন করতে কার্যকর, যার মধ্যে বিভিন্ন পরিবারের মধ্যে নির্বাচন করা অন্তর্ভুক্ত।

(৪) আপনি কী মডেলিং করছেন সে সম্পর্কে তাত্ত্বিক / অভিজ্ঞতাবাদী জ্ঞান দুর্ভাগ্যজনক মডেলের ক্ষেত্রকে সঙ্কুচিত করে।

তবে 'সঠিক' পরিবার সন্ধানের কোনও স্বয়ংক্রিয় উপায় নেই; রিয়েল-লাইফ ডেটা বিতরণগুলি থেকে আপনার পছন্দ মতো জটিল আসতে পারে এবং মডেলগুলির জটিলতাগুলি যেগুলি ফিট করার চেষ্টা করার জন্য আপনার মূল্যবান ডেটার পরিমাণ বাড়িয়ে দেয়। এটি বাক্সের আদেশের অংশ এবং পার্সেল যে কোনও মডেল সত্য নয় তবে কিছু দরকারী।

পুনঃ গুং এর মন্তব্য: এটি সাধারণত ব্যবহৃত হোসমার-লেমশো পরীক্ষাটি দেখা যায় (ক) বিনয়ের পছন্দ সম্পর্কে আশ্চর্যরকম সংবেদনশীল, এবং (খ) বিকল্প অনুমানের কিছু প্রাসঙ্গিক শ্রেণীর বিরুদ্ধে অন্যান্য পরীক্ষার তুলনায় সাধারণত কম শক্তিশালী। এটি পয়েন্ট (1) থেকে হ্রাস করে না: এটি আপ-টু-ডেট হওয়াও ভাল।


ধন্যবাদ! আপনার পরামর্শগুলি সংক্ষিপ্ত এবং নির্ভুল। আমার প্রতিক্রিয়া পরিবর্তনশীল (ইতিবাচক, ধারাবাহিক, তবে অত্যন্ত স্কিউড) এর কাঠামোর কারণে আমি যে পরিবারগুলিতে আমি ব্যবহার করতে পারি তার মধ্যে আমি সীমাবদ্ধ। ক্ষতিকারক পরিবারের মধ্যে, মনে হচ্ছে গামা সত্যিই একমাত্র বিকল্প। এরই মধ্যে, আমি স্টাটা জৌনাল 5 (2): 259-273 - গ্যামফিট (অনুমান আকার এবং স্কেল প্যারামিটার) এ প্রদর্শিত হিসাবে এনজে কক্সের কিছু দরকারী সরঞ্জাম পেয়েছি এবং ডিপিপ্লট ঘনত্ব সম্ভাবনার প্লটের ওভারলেটিকে অনুমতি দেয় এবং আমার প্রতিক্রিয়া পরিবর্তনশীল (হতে পারে অনেক বিতরণের সাথে সম্পন্ন হয়েছে এবং আমার ডেটাতে আমাকে সর্বোত্তম পরিবারের সাথে মেলানোর অনুমতি দেয়) other অন্য সুগমের জন্যও ধন্যবাদ!
আরলাং

1
নোট করুন যে হোসমার-লেমেশো জিএফ পরীক্ষায় ব্যবহৃত বিনিং / অবিশ্বস্ত হওয়ার উপর নির্ভর করে দেখানো হয়েছে।
গুং - মনিকা পুনরায়

@ গুং, এটি স্পষ্টভাবে ব্যবহৃত বিনের উপর নির্ভর করে - আদর্শ নয়, তবে নিশ্চিত না যে আপনি যে ফলাফলটি চান তার জন্য চেষ্টা করার জন্য বিন্নিংয়ের সাথে ঝাঁকুনি না দেওয়া ব্যতীত এটি একটি বড় সমস্যা। এটি কীভাবে অবিশ্বাস্য এবং কী কী অন্যান্য পরীক্ষা ভাল?
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন


1
আপনি ঠিক বলেছেন যে "অবৈধ" খুব শক্তিশালী; যদিও আমি কেবল "অবিশ্বস্ত" এবং হ্যারেল যদিও "অচল" ব্যবহার করি।
গুং - মনিকা পুনরায়

8

আর প্যাকেজের জন্য ভিনগেট (প্রারম্ভিক ম্যানুয়াল) পড়া আপনার কাছে আকর্ষণীয় মনে হতে পারে fitdistrplus। আমি স্বীকার করেছি যে আপনি স্টাটাতে কাজ করতে পছন্দ করেন তবে আমি মনে করি যে ভিগনেটটি যথেষ্ট পরিমাণে স্বতঃস্ফূর্ত হবে যে আপনি ডেটা থেকে বিতরণকারী পরিবারগুলির অনুমানের প্রক্রিয়াটি সম্পর্কে কিছুটা অন্তর্দৃষ্টি পেতে পারেন। আপনি সম্ভবত স্টাটাতে কিছু কোড নিজের কোডের মাধ্যমে প্রয়োগ করতে সক্ষম হবেন। বিশেষত, আমি মনে করি কুলেন এবং ফ্রে গ্রাফ, যদি এটি স্টাটাতে প্রয়োগ করা যায় / হতে পারে তবে এটি আপনার পক্ষে সহায়ক হতে পারে।


আমি আবারও এই সমস্যাটি পুনরায় দেখলাম, এবং আর এ পরিবর্তন করেছি এবং জুয়ার এবং আইনোকে একটি গাইডেন্স হিসাবে ব্যবহার করছি। তবুও অনেকগুলি সমস্যা, তবে সাধারণভাবে আমি আমার মডেল ডায়াগনস্টিকগুলিকে ভেরিডেন্ট ব্যবহার করে দেখে মনে হয় যে তাদের 'গৌণ বৈচিত্র্য' রয়েছে। লাগানো বিরুদ্ধে রেসিডুয়ালি প্লট করা ভাল দেখায়, প্রতিটি covariate এর বিরুদ্ধে রেসিডগুলি আমার এক মডেলের ভেরিয়েবলের (এলিভেশন) জন্য কিছু মজার ফলাফল সরবরাহ করে - বেশিরভাগ উচ্চ উচ্চতায় ছোট নমুনা আকারের একটি ফাংশন। ফিটডিসট্রপ্লাস সম্পর্কে আপনার মন্তব্যের জন্য ধন্যবাদ। এখন যে আমি আর এবং রোস্তুডিও ব্যবহার করছি (এটি পছন্দ করুন!) এটি কার্যকর হবে!
আরএল্যাং

1
লিঙ্কটি নষ্ট হয়ে গেছে। আপনি যে ইন্ট্রো ম্যানুয়ালটির কথা বলছিলেন এটি কি? cran.r-project.org/doc/contrib/Ricci-distributes-en.pdf নাকি এটিই ছিল: cran.r-project.org/web/packages/ Fitdistrplus
vignettes

পরবর্তী লিঙ্কটি আমি উল্লেখ করা ভিগনেটের আলাদা সংস্করণ বলে মনে হচ্ছে।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.