একটি সমবায় কাঠামো নির্দিষ্ট করে: উপকারিতা এবং কনস


15

জিএলএম-এ কোভেরিয়েন্স কাঠামো নির্দিষ্ট করার সুবিধা কী (কোভরিয়েন্স ম্যাট্রিক্সের সমস্ত অফ-ডায়াগোনাল এন্ট্রিগুলিকে শূন্য হিসাবে গণ্য করার চেয়ে)? ডেটা সম্পর্কে যে কেউ জানে তার প্রতিফলন বাদ দিয়ে তা করে

  1. মানানসই ভালতা?
  2. আউট-আউট ডেটা সম্পর্কে ভবিষ্যদ্বাণীমূলক নির্ভুলতা উন্নত করবেন?
  3. আমাদের সম্প্রচারের মাত্রাটি অনুমান করার অনুমতি দেয়?

সমবায় কাঠামো চাপিয়ে দেওয়ার জন্য কী কী ব্যয় হয়? এটা কি পারে

  1. অনুমানের অ্যালগরিদমের জন্য গণনামূলক জটিলতা যুক্ত করবেন?
  2. আনুমানিক প্যারামিটারের সংখ্যা বৃদ্ধি করুন, এআইসি, বিআইসিসি, ডিআইসি বৃদ্ধি করছেন?

সঠিকভাবে সমবায় কাঠামোটি যথাযথভাবে নির্ধারণ করা সম্ভব, বা এটি এমন কিছু যা ডেটা-জেনারেটর প্রক্রিয়া সম্পর্কে আপনার জ্ঞানের উপর নির্ভর করে?

কোন ব্যয় / সুবিধা আমি উল্লেখ করিনি?


5
মূলত, আপনাকে অবশ্যই জিএলএম-এ একটি সমবায় কাঠামো নির্দিষ্ট করতে হবে । যদি "কোনও সমবায় অনুমান" না করে বোঝানো হয়, "কোভরিয়েন্স ম্যাট্রিক্সের সমস্ত অফ-ডায়াগোনাল এন্ট্রিগুলি শূন্য", তবে আপনারা যা করেছেন তা একটি খুব নির্দিষ্ট covariance কাঠামো ধরে নেওয়া হয়েছিল। (আপনি আরও সুনির্দিষ্ট হতে পারেন, উদাহরণস্বরূপ, সমস্ত রূপগুলি সমান um (আমি যাইহোক যাইহোক, উত্সাহিত করেছি, কারণ আমি মনে করি গুরুরা যখন কথা শুরু করবেন তখন আমি অনেক কিছু শিখব)) বা আমি আপনাকে ভুল বুঝাব?
স্টিফান কোলাসা

আপনি কি জিএলএম-তে একটি, বলুন, সাধারণ মিশ্রণ বিতরণকে বহুগুণে ফেলেছেন, বা কোভারিয়েন্স ম্যাট্রিক্সের সমবায় কাঠামো বিশ্লেষণ, বা অন্য কিছু নিয়ে সমবায় কাঠামোকে উল্লেখ করছেন?
টিম

1
@ স্টেফানকোলাসা আপনি কি আপনার মন্তব্যে একটি উত্তর অনুলিপি করতে চান? মনে হচ্ছে প্রশ্নের উত্তরটি যতটা উত্তম হতে চলেছে ততই উত্তম।
করোন

@ করোন: ভাল কথা, মনে করিয়ে দেওয়ার জন্য ধন্যবাদ। আমি গিয়ে একটি উত্তর পোস্ট করেছিলাম। সম্ভবত অন্য কেউ
চিমে প্রবেশ

উত্তর:


13

মূলত, আপনাকে অবশ্যই জিএলএম-এ একটি সমবায় কাঠামো নির্দিষ্ট করতে হবে । যদি "কোন সমবায় অনুমান" না করে বোঝানো হয়, "কোভরিয়েন্স ম্যাট্রিক্সের সমস্ত অফ-ডায়াগোনাল এন্ট্রিগুলি শূন্য", তবে আপনারা যা করেছেন তা একটি খুব নির্দিষ্ট covariance কাঠামো ধরে নেওয়া হয়েছিল। (আপনি আরও সুনির্দিষ্ট হতে পারেন যেমন ধরুন যে সমস্ত রূপগুলি সমান equal

"আমি কোনও দর্শনের সাবস্ক্রাইব করি না; আমি একজন বাস্তববাদী" এই বিষয়ে সত্যই একটি প্রকরণ। - "আপনি যে দর্শনের সাবস্ক্রাইব করেছেন সেগুলি আপনি কেবল বর্ণনা করেছেন।"

এর মতো, আমি বলব যে covariance কাঠামো সম্পর্কে চিন্তাভাবনা করার সুবিধাটি হ'ল এমন একটি মডেল ব্যবহারের সুযোগ যা আপনার তথ্যের জন্য আরও উপযুক্ত। আপনার পর্যবেক্ষণগুলির প্রত্যাশিত মান (বা গড়) জন্য যেমন আপনার পরিচিত কার্যকরী সম্পর্ককে অন্তর্ভুক্ত করা উচিত, তেমনি আপনারা যে কোনও কাঠামোর সাথে পরিচিত হন সেটিকে সমবায় থেকে জবাবদিহি করতে হবে।

এবং অবশ্যই, "অসুবিধা" হ'ল এটি আপনাকে আসলে এই সমস্ত সম্পর্কে ভাবতে হবে। আপনার সফ্টওয়্যারটির ডিফল্ট সেটিংসটি ব্যবহার করা অনেক সহজ। তবে এটি সর্বদা প্রথম গিয়ারে গাড়ি চালানোর মতো কারণ আপনি যখন কিনেছিলেন তখন আপনার গাড়ি প্রথম গিয়ারে ছিল এবং গিয়ার শিফটটি বোঝার জন্য প্রচেষ্টা করা দরকার। প্রস্তাবিত নয়।


2
+1 আপনার লেখা প্রতিটি শব্দের সাথে আমি একমত, তবে আমি মনে করি না এটি পুরোপুরি প্রশ্নের সমাধান করে। উদাহরণস্বরূপ, একটি আরও উপযুক্ত covariance কাঠামো নির্দিষ্ট করে মডেল অবশিষ্টাংশ হ্রাস?
জ্যাক ট্যানার

1
@ জ্যাকট্যানার: ধন্যবাদ! এবং আপনি ঠিক বলেছেন যে আমি আপনার প্রশ্নের পুরোপুরি জবাব দিই নি, এই কারণেই আমি মূলত এটি একটি মন্তব্য হিসাবে পোস্ট করেছি। সত্য বলা যেতে পারে: উদাহরণস্বরূপ, আমি জানি না যে সঠিক সমবায় কাঠামো নির্দিষ্ট করে প্রয়োজনীয়ভাবে অবশিষ্টাংশ হ্রাস করবে কিনা। আমি কল্পনা করি যে অবশিষ্টাংশের (সম্প্রচার) অতিরিক্ত কাঠামো চাপিয়ে দেওয়া এটি আরও বাড়িয়ে তুলতে পারে - তবে এটি পরামিতিগুলিতে সঞ্চয় করতে পারে। একটি কাঠামোগত কোভারিয়ান্স ম্যাট্রিক্সের পরিবর্তে একটি এআর (1) কাঠামোর কথা ভাবেন। আপনার পোস্টে অন্যান্য প্রশ্নের জন্য একই। আমি অবশ্যই এই সম্পর্কে অন্যান্য লোকের মতামত আগ্রহী হবে।
স্টিফান কোলাসা

1
+1 টি; এটি একটি দরকারী উত্তর, তদুপরি, দৃষ্টান্তটি দুর্দান্ত।
রাসেলপিয়ের্স

2

এখানে আরও একটি অসম্পূর্ণ উত্তর যা সরাসরি জিএলএম সম্পর্কেও নয় ... স্ট্রাকচারাল সমীকরণ মডেলিংয়ের (এসইএম) সাথে আমার অত্যন্ত সীমাবদ্ধ অভিজ্ঞতায় আমি কয়েকটি দম্পতি নিয়েছি যা আশা করি আলোচনায় কিছু যোগ করতে পারে hope দয়া করে মনে রাখবেন যে আমি SEM এর সাথে (সীমাবদ্ধ) অভিজ্ঞতার কথা বলছি, প্রতি সেচ জিএলএম নয় , এবং এই পার্থক্যটি গুরুত্বপূর্ণ হয়ে উঠতে পারে কিনা এবং আমি সম্পর্কে আমি মোটেই অজ্ঞ nt আমি একজন পরিসংখ্যানবিদদের চেয়ে একজন পরিসংখ্যানের ব্যবহারকারী, তাই আমি নিশ্চিত নই যে এই ধারণাগুলি সমস্ত বা এমনকি বেশিরভাগ ডেটাতে প্রযোজ্য হবে; আমি কেবল এটি পেয়েছি যে তারা আমার নিজের বেশিরভাগ ক্ষেত্রে প্রয়োগ করেছে।

প্রথমে, আপনি ইতিমধ্যে যা জানেন মডেলিংয়ের গুরুত্বের প্রতি আমি @ স্টিফানকোলাসার জোর প্রতিধ্বনিত করব। আপনি এটিকে স্বতন্ত্র হিসাবে স্বীকার করেছেন, তবে আমি মনে করি আপনি যে সুবিধাগুলি সম্পর্কে জিজ্ঞাসা করছেন তা হ'ল আপনি যা জানেন তা মডেলিংয়ের সুবিধা। এই হিসাবে, তারা অর্থপূর্ণভাবে প্রতিফলিত করে যে আপনার ফলাফল মডেলটি আপনি যুক্ত করেছেন এমন সমবায় কাঠামো সম্পর্কিত তথ্য ধারণ করেছেন।

এসইএম-তে , আমি পেয়েছি (তাত্ত্বিক অধ্যয়নের মাধ্যমে নয়, সীমিত অভিজ্ঞতার মাধ্যমে)

উপকারিতা

  1. কোভেরিয়েন্স স্ট্রাকচারকে মডেলিং করা ফিটের ন্যূনতাকে উন্নত করে (জিওএফ) যদি কোভেরিয়েন্স তার স্ট্যান্ডার্ড ত্রুটির চেয়ে অনেক বেশি শক্তিশালী হয় (যেমন, যদি প্রতিসাম্যপূর্ণ পথটি তাত্পর্যপূর্ণ হয়)। এর অর্থ আপনি সাধারণত শূন্যের কাছের মডেলিংয়ের মাধ্যমে জিওএফের উন্নতি করতে পারবেন না এবং বহুকলাইনারিটি GoF এর জন্য সমস্যা তৈরি করতে পারে কারণ এটি স্ট্যান্ডার্ড ত্রুটিগুলিকে সংক্রামিত করে।

  2. এখনও ভবিষ্যদ্বাণী করার জন্য ডেটা ধরে রাখার চেষ্টা করেননি, তবে আমার অন্তর্নিহিততাটি হ'ল আপনার মডেলটিতে কোভেরিয়েন্সগুলি শূন্যে ফিক্সিং করা পৃথক, একক-চতুর্থ, লিনিয়ার রিগ্রেশন সমীকরণের একটি সেট সংযুক্ত করে ডিভি পূর্বাভাস দেওয়ার সমতুল্য। এই পদ্ধতির বিপরীতে, ডিভিয়ের পূর্বাভাস দেওয়ার জন্য কোনও মডেল সমীকরণ তৈরি করার সময় একাধিক রিগ্রেশন আইভিগুলিতে স্ববিরোধী হয়ে থাকে। এটি অবশ্যই IV এর অন্তর্ভুক্ত সংস্থার মধ্যে ঘটে যা প্রত্যক্ষভাবে পরোক্ষ প্রভাবগুলি থেকে সরাসরি প্রভাবগুলি পৃথক করে ব্যাখ্যার উন্নতি করে। সত্যই, আমি নিশ্চিত নই যে এটি অবশ্যই ডিভি এর পূর্বাভাস উন্নত করে কিনা। একজন পরিসংখ্যান ব্যবহারকারী এবং কোনও পরিসংখ্যানবিদ নন, আমি এই আশাবাদী অ্যানালগাস কেসটিতে একটি অসম্পূর্ণ উত্তর দেওয়ার জন্য নিম্নলিখিত সিমুলেশন টেস্টিং ফাংশনটি একত্রিত করেছি (স্পষ্টতই, "হ্যাঁ, মডেল যখন IV কোভেরিয়েন্সকে অন্তর্ভুক্ত করবেন তখন ভবিষ্যদ্বাণীমূলক নির্ভুলতা উন্নত হয়) ...

    simtestit=function(Sample.Size=100,Iterations=1000,IV.r=.3,DV.x.r=.4,DV.z.r=.4) {
    require(psych); output=matrix(NA,nrow=Iterations,ncol=6); for(i in 1:Iterations) {
    x=rnorm(Sample.Size); z=rnorm(Sample.Size)+x*IV.r
    y=rnorm(Sample.Size)+x*DV.x.r+z*DV.z.r
    y.predicted=x*lm(y~x+z)$coefficients[2]+z*lm(y~x+z)$coefficients[3]
    bizarro.y.predicted=x*lm(y~x)$coefficients[2]+z*lm(y~z)$coefficients[2]
    output[i,]=c(cor(y.predicted,y)^2,cor(bizarro.y.predicted,y)^2,
    cor(y.predicted,y)^2>cor(bizarro.y.predicted,y)^2,cor(x,z),cor(x,y),cor(y,z))}
    list(output=output,percent.of.predictions.improved=100*sum(output[,3])/Iterations,
    mean.improvement=fisherz2r(mean(fisherz(output[,1])-fisherz(output[,2]))))}
    
    # Wrapping the function in str( ) gives you the gist without filling your whole screen
    str(simtestit())
    

    এন= IterationsএনSample.Sizez = x + +y = x + + z + +yxz

    1y.predicted

    2bizarro.y.predicted

    outputIterationsআর2121>2Rxyzoutputsimtestit()str( )আর21Rpsych

    আর2আর2IV.r) বড়। যেহেতু আপনি সম্ভবত আপনার চেয়ে আপনার জিএলএম ফাংশনটির সাথে বেশি পরিচিত (যা মোটেও নয়), আপনি সম্ভবত এই ফাংশনটি পরিবর্তন করতে পারেন বা আপনি খুব বেশি ঝামেলা ছাড়াই চান এমন অনেক আইভিতে জুড়ে GLM ভবিষ্যদ্বাণীগুলির তুলনা করতে বেসিক ধারণাটি ব্যবহার করতে পারেন। ধরে নিলে যে (বা করবে) একইভাবে পরিণত হবে, মনে হবে আপনার দ্বিতীয় প্রশ্নের মূল উত্তর সম্ভবত হ্যাঁ, তবে আইভিএস কোভারি কতটা দৃ strongly়তার সাথে নির্ভর করে। মডেলটিকে ফিট করার জন্য রাখা আউট-আউট ডেটা এবং ডেটাগুলির মধ্যে স্যাম্পলিং ত্রুটির পার্থক্যগুলি পরবর্তী ডেটাসেটের মধ্যে তার ভবিষ্যদ্বাণীমূলক নির্ভুলতার উন্নতি ডেকে আনতে পারে, কারণ আবার, IV সম্পর্কিতগুলি শক্তিশালী না হলে উন্নতিটি ছোট বলে মনে হয় (কমপক্ষে, মাত্র দুটি আইভি সহ সর্বাধিক বুনিয়াদির কেস)।

  3. মডেলটিতে IVs এর মধ্যে সহজাততার জন্য একটি নিখরচায় পথ নির্দিষ্ট করার অর্থ এই পথের সহগের অনুমান করার জন্য মডেল ফিটিং ফাংশনটি জিজ্ঞাসা করা, যা IVs এর মধ্যে সামঞ্জস্যের সীমাটি উপস্থাপন করে। যদি আপনার জিএলএম ফাংশন আপনাকে এমন একটি মডেল নির্দিষ্ট করতে দেয় যাতে আইভিগুলির মধ্যে সমবায় নির্ধারণের পরিবর্তে শূন্যের চেয়ে নির্ধারিত হয় তবে এটি কীভাবে করা যায় এবং কীভাবে আপনার ফাংশনটিকে আউটপুটে নিয়ে যায় তা নির্ধারণ করার জন্য আপনার সমস্যাটি আশাবাদী একটি সহজ বিষয় is যে অনুমান। যদি আপনার ফাংশনটি ডিফল্টরূপে চতুর্থ সমবায়গুলির অনুমান করে তবে আপনার সমস্যাটি কেবল পরবর্তী বিষয়গুলিতে আরও সহজতর হয় (যেমনটি হয় তেমন lm( ))।

খরচ

  1. হ্যাঁ, আইভিএসের মধ্যে নির্বিঘে ovক্যবদ্ধতার অনুমান করা মানে মডেল ফিটিং অ্যালগরিদমকে সেই পথের সহগটি অনুমান করার জন্য কিছু কাজ করতে হবে। মডেলটিতে যে পথটি নির্দিষ্ট করা হয় না তার অর্থ সাধারণত সহগকে শূন্যের সাথে সংশোধন করা হয় যার অর্থ মডেল ফিটিং অ্যালগরিদম সহগের অনুমান করার প্রয়োজন হয় না। অতিরিক্ত কোভেরিয়েন্স প্যারামিটারগুলি অনুমান করার অর্থ সামগ্রিক মডেলটিকে ফিট করার জন্য আরও বেশি সময় প্রয়োজন। এমন মডেলগুলিতে যা ইতিমধ্যে অনুমান করতে দীর্ঘ সময় নেয়, অতিরিক্ত সময় যথেষ্ট হতে পারে, বিশেষত আপনার যদি প্রচুর আইভি থাকে s

  2. হ্যাঁ, একটি অবাধে অনুমিত সমবায় কাঠামো প্যারামিটারের অনুমানগুলিকে বোঝায়। জনসংখ্যার কোভেরিয়েন্স প্যারামিটার রয়েছে, সুতরাং আপনি যদি জনসংখ্যার সমবায় অনুমান করেন তবে আপনি পরামিতিগুলি অনুমান করছেন। তবে, যদি আপনার মডেলটি আরও ভাল ফিট করে কারণ আপনি শূন্যে ফিক্সিংয়ের পরিবর্তে একটি অ-তুচ্ছ সম্পর্কের অনুমান করতে বেছে নিচ্ছেন, আপনি সম্ভবত জিএএফ-কে অন্তর্ভুক্ত অন্যান্য মানদণ্ডের মতো আকাইকে এবং বয়েসিয়ান তথ্যের মানদণ্ডের উন্নতি করতে পারে বলে আশা করতে পারেন। আমি বিচ্যুতি তথ্যের মানদণ্ডের সাথে পরিচিত নই (আপনি যে ডিআইসির বিষয়ে উল্লেখ করছেন, তাই না?) তবে এর উইকিপিডিয়া পৃষ্ঠা থেকে বিচার করলে এটি জিওএফ এবং মডেল জটিলতার জন্য একটি জরিমানা অন্তর্ভুক্ত বলে মনে হয়।

    সুতরাং ডিআইসির উন্নতি করার জন্য মডেলটির জটিলতা বৃদ্ধির চেয়ে জিওএফকে আনুপাতিকভাবে আরও উন্নত করা উচিত। যদি এটি সামগ্রিকভাবে না ঘটে, আপনি আরও IV সমবায়ুদের অনুমান করার সাথে সাথে মডেল জটিলতার জন্য জরিমানার মতো মানদণ্ডগুলি আরও খারাপ হবে। উদাহরণস্বরূপ, যদি আপনার আইভিগুলি পারস্পরিক সম্পর্ক স্থাপন না করে তবে এটি কোনও সমস্যা হতে পারে, তবে সমবায় কাঠামো নির্বিঘ্নে নির্ধারিতভাবেই নির্ধারিত হয় কারণ আপনি মনে করেন আইভিগুলি পারস্পরিক সম্পর্ক স্থাপন করতে পারে, বা কারণ এটি আপনার ফাংশনের ডিফল্ট সেটিংস। যদি আপনার পূর্ববর্তী তাত্ত্বিক কারণগুলি মনে করে যে কোনও পারস্পরিক সম্পর্ক শূন্য এবং আপনি চান না যে আপনার মডেল এই অনুমানটি পরীক্ষা করুন, এটি এমন একটি ক্ষেত্রে যেখানে শূন্যের পথে স্থির করার ক্ষেত্রে আপনি ন্যায়সঙ্গত হতে পারেন। যদি আপনার পূর্ববর্তী তত্ত্বটি প্রায় সঠিক হয়,

ডুনো আপনি কোন ফাংশন নিয়ে কাজ করছেন, তবে আবারও, আমি নিশ্চিত যে এর সাথে আমি অপরিচিত, তাই আমি নিশ্চিত যে এই উত্তরটি উন্নত হতে পারে, বিশেষত দ্বিতীয় উপকারের প্রশ্নের আমার উত্তর (একটি বিষয় হিসাবে, একটি গাণিতিক) একাধিক রিগ্রেশন সম্পর্কে সিমুলেশন দিয়ে আমি কী উত্তর দিচ্ছি তার প্রমাণ সম্ভবত কোথাও পাওয়া যায়)। আমি সাধারণভাবে জিএলএমের সাথেও পরিচিত নই (আপনি যেমন ট্যাগ হিসাবে বোঝাচ্ছেন আপনি জেনারেলাইজড , সাধারণ রৈখিক মডেলিং নয়, ধরে নিয়েছেন ), তাই আমি আশা করি যে এসএম থেকে ভিন্নতাগুলি আপনার প্রশ্নের উত্তরগুলিকে অকার্যকর করে দিলে কেউ এই উত্তর সম্পর্কে মন্তব্য করবে বা সম্পাদনা করবে I মোটেই

তবুও, মনে হচ্ছে আমরা গুরুদের কথা বলার জন্য দশ মাস অপেক্ষা করেছি, সুতরাং যদি এটি তাদের এটি না করে, তবে এটি কেবল নিজেই করতে হবে, আমার ধারণা। আপনার যদি মনে হয় যে কোনও বিশেষ জিএলএম ফাংশন আপনার মনে আছে তবে আপনি আমাকে আর-তে ম্যাসেজ করতে চাই। আপনি যদি আর এর সাথে আগ্রহের একটি GLM ফাংশন নির্দিষ্ট করতে পারেন তবে আমি কীভাবে আপনার অ্যাপ্লিকেশনের জন্য আরও # 3 সরাসরি উত্তর দিতে পারব তা বুঝতে সক্ষম হয়ে উঠতে পারি I'm আমি সিমুলেশন পরীক্ষায় কোনও বিশেষজ্ঞ নই, তবে আমি মনে করি আপনার অন্যান্য চারটি প্রশ্নের সিম পরীক্ষা করা যেতে পারে (আরও সরাসরি)।


2
+1 একটি চিত্তাকর্ষক চিন্তাশীল প্রতিক্রিয়া। সিভি, নিক আপনাকে স্বাগতম!
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.