আমি আমার নির্ভরশীল ভেরিয়েবলকে রূপান্তরিত করে লগ করব, আমি কী লোগো লিংক ফাংশন দিয়ে জিএলএম সাধারণ বিতরণ ব্যবহার করতে পারি?


10

জেনারালাইজড লিনিয়ার মডেলস (জিএলএম) সম্পর্কিত আমার একটি প্রশ্ন রয়েছে M আমার নির্ভরশীল পরিবর্তনশীল (ডিভি) অবিচ্ছিন্ন এবং স্বাভাবিক নয়। সুতরাং আমি এটি রূপান্তরিত লগ (এখনও স্বাভাবিক না তবে এটি উন্নত)।

আমি দুটি স্বতন্ত্র ভেরিয়েবল এবং একটি অবিচ্ছিন্ন সহনীয়যোগ্য সহ ডিভি সম্পর্কিত করতে চাই। এর জন্য আমি একটি জিএলএম পরিচালনা করতে চাই (আমি এসপিএসএস ব্যবহার করছি) তবে কীভাবে বন্টন এবং সিদ্ধান্তটি বেছে নেওয়ার বিষয়ে সিদ্ধান্ত নেবেন তা সম্পর্কে আমি নিশ্চিত নই।

আমি লেভেনের ননপ্যারামেট্রিক পরীক্ষা পরিচালনা করেছি এবং আমার বৈচিত্রের একজাতীয়তা রয়েছে তাই আমি সাধারণ বিতরণটি ব্যবহার করতে আগ্রহী। আমি পড়েছি যে লিনিয়ার রিগ্রেশন জন্য ডেটা স্বাভাবিক হওয়ার দরকার নেই, অবশিষ্টাংশগুলি করে। সুতরাং, আমি পৃথকভাবে প্রতিটি জিএলএম থেকে লিনিয়ার প্রেডিক্টরের জন্য মানকৃত পিয়ারসন অবশিষ্টাংশ এবং পূর্বাভাসিত মান মুদ্রণ করেছি (জিএলএম স্বাভাবিক পরিচয় ফাংশন এবং সাধারণ লগ ফাংশন)। আমি স্বাতন্ত্র্য পরীক্ষা করেছি (হিস্টোগ্রাম এবং শাপিরো-উইলক) এবং পৃথকভাবে উভয়ের জন্য পূর্বাভাসিত মানগুলির (এলোমেলোতা এবং বৈকল্পিকতা পরীক্ষা করার জন্য) বিরুদ্ধে অবশিষ্টাংশ প্লট করেছি। পরিচয় ফাংশন থেকে অবশিষ্টগুলি স্বাভাবিক নয় তবে লগ ফাংশন থেকে প্রাপ্ত অবশিষ্টগুলি স্বাভাবিক। আমি লগ লিঙ্ক ফাংশন সহ স্বাভাবিক চয়ন করতে আগ্রহী কারণ পিয়ারসনের অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয়।

সুতরাং আমার প্রশ্নগুলি হ'ল:

  • ইতিমধ্যে লগটি রূপান্তরিত হয়ে গেছে এমন কোনও ডিভিতে আমি লগ লিঙ্ক ফাংশন সহ জিএলএম সাধারণ বিতরণ ব্যবহার করতে পারি?
  • বৈকল্পিক একজাতীয় পরীক্ষা কি সাধারণ বিতরণ ব্যবহার করে ন্যায়সঙ্গত করার পক্ষে যথেষ্ট?
  • লিঙ্ক ফাংশন মডেলটি বেছে নেওয়ার পক্ষে কি অবশিষ্টাংশের চেকিং পদ্ধতিটি সঠিক?

বামদিকে ডিভি ডিস্ট্রিবিউশনের চিত্র এবং ডানদিকে লগ লিঙ্ক ফাংশন সহ জিএলএম স্বাভাবিক থেকে অবশিষ্টগুলি।

বামদিকে ডিভি বিতরণ এবং ডানদিকে জিএলএম থেকে স্বাভাবিকের অবশিষ্টাংশ


আপনি এর অর্থ কী
বলছেন

আপনার মন্তব্যের জন্য ধন্যবাদ. আমি বোঝাতে চাইছি যে আমি প্রতিটি জিএলএম (পরিচয় এবং লগ) থেকে অবশিষ্টগুলি এবং পূর্বাভাসিত মানগুলি পৃথকভাবে মুদ্রণ করেছি এবং স্বাভাবিকতার জন্য পরীক্ষা করেছি এবং স্বতন্ত্রভাবে প্রতিটি মডেলের পূর্বাভাসিত মানগুলির বিরুদ্ধে মানকৃত পিয়ারসন রেসিডুয়ালগুলি প্লট করেছি। পরিচয় ফাংশনের জন্য, অবশিষ্টগুলি স্বাভাবিক নয়, লগ ফাংশনের জন্য, অবশিষ্টগুলি স্বাভাবিক।
বিজ্ঞানী

পূর্বাভাসিত মানগুলির বিরুদ্ধে মানসম্পন্ন পিয়ারসন অবশিষ্টাংশের প্লট কীভাবে নির্দেশ করে যে ডেটা আসলে স্বাভাবিক কিনা?
গ্লেন_বি -রিনস্টেট মনিকা

আমি অবশিষ্টাংশের হিস্টগ্রাম প্লট করে এবং লগ ফাংশনের জন্য শাপিরো-উইলক (পি> 0.05) পরিচালনা করে স্বাভাবিকতা পরীক্ষা করেছিলাম। তারপরে আমি পূর্বাভাসিত মানগুলির বিরুদ্ধে অবশিষ্টাংশগুলি পরিকল্পনা করেছিলাম যাতে এলোমেলোভাবে বিতরণ করা হয় কিনা এবং তারতম্যটি পরীক্ষা করে দেখুন। (গুরুত্বপূর্ণ তথ্য না বলার জন্য দুঃখিত, আমি প্রথম পোস্ট করছি)
বিজ্ঞানী

আমার ধারণা "পরিচয় ফাংশন" এখানে "ঘনত্বের ফাংশন" এর জন্য হোমোফোন স্লিপ।
নিক কক্স

উত্তর:


7

ইতিমধ্যে লগটি রূপান্তরিত হয়ে গেছে এমন কোনও ডিভিতে আমি লগ লিঙ্ক ফাংশন সহ জিএলএম সাধারণ বিতরণ ব্যবহার করতে পারি?

হ্যাঁ; যদি অনুমানগুলি সেই স্কেলটিতে সন্তুষ্ট হয়

বৈকল্পিক একজাতীয় পরীক্ষা কি সাধারণ বিতরণ ব্যবহার করে ন্যায়সঙ্গত করার পক্ষে যথেষ্ট?

কেন বৈচিত্রের সমতা স্বাভাবিকতা বোঝায়?

লিঙ্ক ফাংশন মডেলটি বেছে নেওয়ার পক্ষে কি অবশিষ্টাংশের চেকিং পদ্ধতিটি সঠিক?

আপনার অনুমানের উপযুক্ততা যাচাই করার জন্য আপনার হিস্টোগ্রাম এবং ফিট টেস্টের সদ্ব্যবহার উভয়ই ব্যবহার থেকে সতর্ক হওয়া উচিত:

1) স্বাভাবিকতা নিরূপণের জন্য হিস্টোগ্রাম ব্যবহার করে সাবধান । (এছাড়াও এখানে দেখুন )

সংক্ষেপে, আপনার দ্বিবিধের পছন্দের মতো ছোট্ট পরিবর্তন, বা বিন সীমানার ঠিক অবস্থানের মতো সাধারণ কোনও বিষয়ের উপর নির্ভর করে, ডেটার আকারের ভিন্ন ভিন্ন ছাপ পাওয়া সম্ভব:

দুটি হিস্টোগ্রাম অবশিষ্টাংশ

এটি একই ডেটা সেটের দুটি হিস্টোগ্রাম। বেশ কয়েকটি ভিন্ন দ্বিবিধ ব্যবহার করা ছাপটি সংবেদনশীল কিনা তা দেখার ক্ষেত্রে দরকারী হতে পারে।

2) স্বাভাবিকতা অনুমান করা যুক্তিসঙ্গত যে এই সিদ্ধান্তে পৌঁছানোর জন্য ফিট টেস্টের সদ্ব্যবহার ব্যবহারের বিষয়ে সতর্ক থাকুন। আনুষ্ঠানিক অনুমান পরীক্ষা সত্যই সঠিক প্রশ্নের উত্তর দেয় না।

যেমন আইটেমটি অধীনে লিঙ্ক দেখতে 2. এখানে

বৈকল্পিকতা সম্পর্কে, একই রকম ডেটাসেট ব্যবহার করে কিছু কাগজপত্রে এটি উল্লেখ করা হয়েছিল "কারণ বিতরণে একজাতীয় রূপ ছিল যা গাউসীয় বিতরণ সহ একটি জিএলএম ব্যবহৃত হয়েছিল"। যদি এটি সঠিক না হয়, তবে কীভাবে আমি বিতরণকে ন্যায়সঙ্গত বা সিদ্ধান্ত নিতে পারি?

সাধারণ পরিস্থিতিতে, প্রশ্নটি 'আমার ত্রুটিগুলি (বা শর্তসাপেক্ষ বিতরণ) কি স্বাভাবিক নয়?' - সেগুলি হবে না, আমাদের চেক করারও দরকার নেই। আরও প্রাসঙ্গিক প্রশ্ন হ'ল 'বর্তমানের অ-স্বাভাবিকতার ডিগ্রিটি আমার অনুমানগুলিকে কতটা খারাপভাবে প্রভাবিত করে?'

আমি একটি কার্নেল ঘনত্বের প্রাক্কলন বা সাধারণ কিউকিউপ্লট (সাধারণ স্কোর বনাম অবশিষ্টাংশের প্লট) প্রস্তাব দিই। বিতরণটি যদি যুক্তিসঙ্গতভাবে সাধারণ দেখায় তবে আপনার খুব চিন্তা করার দরকার নেই little প্রকৃতপক্ষে, এমনকি যখন এটি স্পষ্টত অস্বাভাবিক হয় তখনও এটি আপনি খুব বেশি কিছু করতে পারেন না, আপনি যা করতে চান তার উপর নির্ভর করে (সাধারণ পূর্বাভাস অন্তরগুলি সত্যিকারের স্বাভাবিকতার উপর নির্ভর করবে, উদাহরণস্বরূপ, তবে আরও অনেক কিছুই বড় আকারের নমুনার আকারে কাজ করতে ঝোঁক করবে) )

মজাদারভাবে যথেষ্ট, বড় নমুনাগুলিতে, স্বাভাবিকতা সাধারণত কম এবং কম গুরুত্বপূর্ণ হয় (উপরে বর্ণিত পিআইগুলি বাদে), তবে আপনার স্বাভাবিকতা প্রত্যাখ্যান করার ক্ষমতা আরও বেশি এবং আরও বেশি হয়ে যায়।

সম্পাদনা: ভ্যারিয়েন্সের সমতা সম্পর্কে পয়েন্ট যে সত্যিই পারেন এমনকি বৃহৎ নমুনা মাপ আপনার মতামতে উপনীত প্রভাবিত। তবে আপনার সম্ভবত অনুমান করা উচিত নয় যে কোনও অনুমানের পরীক্ষার দ্বারা। ভেরিয়েন্স অনুমানটি ভুল হওয়া আপনার বিবেচিত বিতরণ যাই হোক না কেন একটি সমস্যা।

আমি পড়েছি যে একটি উপযুক্ত ফিট জন্য ডান দিকনির্দেশ মডেল জন্য Np কাছাকাছি হওয়া উচিত?

আপনি যখন কোনও সাধারণ মডেল ফিট করেন তখন এর একটি স্কেল প্যারামিটার থাকে, এক্ষেত্রে আপনার বিতরণটি স্বাভাবিক না হলেও আপনার স্কেলড ডেভিয়েশন এনপি সম্পর্কে হবে।

আপনার মতে লগ লিঙ্ক সহ সাধারণ বিতরণ ভাল পছন্দ is

আপনি কী পরিমাপ করছেন বা কী জন্য আপনি অনুমানটি ব্যবহার করছেন তা অবিরত অনুপস্থিতিতে, আমি এখনও জিএলএমের জন্য অন্য বিতরণ প্রস্তাব করতে পারি না, বা আপনার অনুমানের পক্ষে স্বাভাবিকতা কতটা গুরুত্বপূর্ণ হতে পারে তা এখনও বিচার করতে পারি না।

তবে, যদি আপনার অন্যান্য অনুমানগুলিও যুক্তিসঙ্গত হয় (রৈখিকতা এবং বৈচিত্রের সাম্যতা অন্ততপক্ষে নির্ভরযোগ্যতার সম্ভাব্য উত্সগুলি বিবেচনা করা উচিত) তবে বেশিরভাগ পরিস্থিতিতে আমি সিআই ব্যবহার করা এবং সহগ বা বিপরীতে পরীক্ষাগুলি করার মতো কাজগুলি করতে খুব স্বাচ্ছন্দ্যবোধ করি be - এই অবশিষ্টাংশগুলিতে কেবল স্কিউনেসের খুব সামান্য ছাপ রয়েছে, এটি সত্যিকারের প্রভাব হলেও এই ধরণের অনুমানের কোনও প্রভাব ফেলতে পারে না।

সংক্ষেপে, আপনার ভাল হওয়া উচিত।

(অন্য বন্টন এবং লিঙ্ক ফাংশন যদিও পারে কিছুটা ভালো হইয়া পরিপ্রেক্ষিতে শুধুমাত্র সীমাবদ্ধ পরিস্থিতিতে তারা আরো জানার জন্য সম্ভবত হবে না,।)


আবার ধন্যবাদ! বৈকল্পিকতার বিষয়ে, যা কিছু কাগজপত্রগুলিতে অনুরূপ ডেটাसेट ব্যবহার করে উল্লেখ করা হয়েছিল "কারণ বিতরণে সমজাতীয় ভেরিয়েন্স ছিল গাউসীয় বিতরণ সহ একটি জিএলএম ব্যবহৃত হয়েছিল"। যদি এটি সঠিক না হয়, তবে কীভাবে আমি বিতরণকে ন্যায়সঙ্গত বা সিদ্ধান্ত নিতে পারি? অবশিষ্টাংশের স্বাভাবিক বিতরণ সম্পর্কিত, এর অর্থ এটি আরও যথাযথ? আমি পড়েছি যে একটি উপযুক্ত ফিট জন্য ডান দিকনির্দেশ মডেল জন্য Np কাছাকাছি হওয়া উচিত? জিএলএম এবং এনপি এর আশেপাশে মান একই the আমি এআইসির মানদণ্ডটি ব্যবহার করে মডেলটির মধ্যে সবচেয়ে উপযুক্ত মডেলটিও চিহ্নিত করেছি। আপনি এটি বোঝাতে চেয়েছিলেন কিনা তা নিশ্চিত নয়।
বিজ্ঞানী

উপরের আমার সম্পাদনাগুলিতে আলোচনাটি দেখুন
Glen_b -Reinstate Monica

সুন্দর ব্যাখ্যার জন্য ধন্যবাদ @ গ্লেন_ বি। আমি হিস্টোগ্রামটিও শাপিরো-উইলক ব্যবহার করে পরীক্ষা করেছি, এটি কি সবকিছু বিবেচনা করে না? আমি কিউকিউ প্লট করে প্রত্যাশিত স্বাভাবিক এবং পর্যবেক্ষণ করা পিয়ারসনের অবশিষ্ট অবধি এবং পয়েন্টগুলি প্লট করেছি - লাইনটি ফিট করে, টিপস যেখানে তারা খানিকটা উপরে চলে যায় তা বাদ দিয়ে fit এই আপনি কি বোঝাতে চেয়েছিলেন? অবশিষ্টাংশের বিতরণটি স্বাভাবিক দেখায়, তাই আমি কি এগিয়ে যেতে পারি? (লগ করা ডিভি সাধারণ না হলেও) (আমি এখনও লিঙ্কগুলি পড়ছি তবে এটি জানতে চেয়েছিলাম)
বিজ্ঞানী

1
" কারণ সাধারণ QQ প্লটটি সাধারণত এই মডেলের জন্য বিতরণ করা হত? " ... আমি বলতে পারি "অবশিষ্টাংশের কিউকিউ প্লট প্রস্তাব দেয় যে স্বাভাবিকতা অনুমিতি যুক্তিযুক্ত" বা "অবশিষ্টাংশগুলি যথাযথভাবে স্বাভাবিকের নিকটে উপস্থিত হয়"। যদি আপনার শ্রোতারা হাইপোথিসিস পরীক্ষাগুলির প্রত্যাশা করে তবে আপনি এখনও একটি উদ্ধৃতি দিতে পারেন (তবে এটি বিশেষভাবে সহায়ক নয় এমনটি পরিবর্তিত হয় না)। " ডেটাসেটের সমস্যা হ'ল ডিভির হিস্টোগ্রামে " ... নিঃশর্ত ডিভি বা আইভির কোনও বিতরণ সম্পর্কে ধারণা নেই।
গ্লেন_বি -রিনস্টেট মনিকা

1
আমার উত্তরের নীচে অতিরিক্ত আলোচনা দেখুন। দুঃখিত আমি এর আগে জবাব দিইনি তবে আমি ঘুমিয়ে ছিলাম। অন্য প্রশ্নে, আমি কেন কারণ জিজ্ঞাসা করেছি তা হল দুটি মডেলই তাদের অনুমানের বেশিরভাগ অংশীদারি করে এবং তাই এই আলোচনার সমস্তই সেই প্রশ্নের সাথে প্রাসঙ্গিক - এমনকি ডিভি আলাদা হলেও। এটি ঠিক একই পরিস্থিতি নয় (এবং তাই নতুন প্রশ্ন হওয়া উচিত) তবে এই প্রশ্নটি এটি থেকে সংযুক্ত করা উচিত, যাতে আপনি এই আলোচনার প্রসঙ্গে প্রশ্ন জিজ্ঞাসা করতে পারেন, যেমন কোনও আলাদা বা অতিরিক্ত সমস্যা রয়েছে কিনা তা।
গ্লেন_বি -রিনস্টেট মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.