কাঠামোগত সমীকরণের মডেলটিতে খুব ছোট নমুনা থাকার জটিলতা


13

আমি আমোসে 18 তে স্ট্রাকচারাল সমীকরণ মডেল (এসইএম) চালাচ্ছি my আমি আমার পরীক্ষার জন্য (শিথিলভাবে ব্যবহৃত) 100 জন অংশগ্রহণকারীকে খুঁজছিলাম, যা সম্ভবত সফল এসইএম পরিচালনার জন্য যথেষ্ট নয় বলে মনে করা হয়েছিল। আমাকে বারবার বলা হয়েছে যে এসইএম (ইএফএ, সিএফএ সহ) একটি "বৃহত নমুনা" পরিসংখ্যান প্রক্রিয়া। দীর্ঘ গল্প সংক্ষিপ্ত, আমি এটি 100 জন অংশগ্রহণকারী (এটি কী আশ্চর্য!) করতে পারিনি, এবং দুটি সমস্যাযুক্ত ডেটা পয়েন্ট বাদ দিয়ে কেবল 42 টি আছে। আগ্রহের বাইরে, আমি যাইহোক মডেলটি চেষ্টা করেছিলাম, এবং আমার আশ্চর্যরূপে, এটি খুব ভাল ফিট হয়েছিল বলে মনে হয়েছিল! সিএফআই> .95, আরএমএসইএ <.09, এসআরএমআর <.08।

মডেলটি সহজ নয়, বাস্তবে আমি বলব এটি তুলনামূলকভাবে জটিল। আমার দুটি সুপ্ত ভেরিয়েবল রয়েছে, একটিতে দুটি পর্যবেক্ষণকৃত এবং অন্যটি 5 টি পর্যবেক্ষণযোগ্য ভেরিয়েবলগুলি রয়েছে। মডেলটিতে আমার আরও চারটি অতিরিক্ত পর্যবেক্ষণযোগ্য ভেরিয়েবল রয়েছে। পরোক্ষ এবং প্রত্যক্ষের মধ্যে প্রচলিত সম্পর্ক রয়েছে, উদাহরণস্বরূপ কিছু ভেরিয়েবল চারজনের মধ্যে অন্তর্ভুক্ত being

আমি এসইএম-তে কিছুটা নতুন; যাইহোক, আমি জানি যে দুটি ব্যক্তি যারা SEM এর সাথে যথেষ্ট পরিচিত তারা আমাকে বলে যে ফিটের সূচকগুলি যতক্ষণ ভাল, প্রভাবগুলি ব্যাখ্যামূলক (যতক্ষণ না তারা তাৎপর্যপূর্ণ) এবং মডেলটির সাথে উল্লেখযোগ্যভাবে "ভুল" কিছুই নেই। আমি জানি কিছু ফিটের সূচকগুলি ভাল ফিটের প্রস্তাব দেওয়ার ক্ষেত্রে ছোট নমুনাগুলির পক্ষে বা বিপক্ষে পক্ষপাতদুষ্ট, তবে আমি আগে যে তিনটি উল্লেখ করেছি তা ভাল মনে হয়, এবং আমি বিশ্বাস করি একইভাবে পক্ষপাতদুষ্ট নয়। অপ্রত্যক্ষ প্রভাবের জন্য আমি বুটস্ট্র্যাপিং (2000 স্যাম্পল বা তার বেশি) ব্যবহার করছি, 90 শতাংশ পক্ষপাত আত্মবিশ্বাসের সংশোধন করেছে, মন্টে কার্লো। একটি অতিরিক্ত নোট আমি তিনটি পৃথক অবস্থার জন্য তিনটি পৃথক SEMs চালাচ্ছি।

আমার দুটি প্রশ্ন রয়েছে যা আমি আপনারা কেউ কেউ বিবেচনা করতে চাই এবং আপনার কিছু অবদান রাখলে দয়া করে এর জবাব দিন:

  1. আমার মডেলটিতে এমন কোনও উল্লেখযোগ্য দুর্বলতা রয়েছে যা উপযুক্ত সূচকগুলি দ্বারা প্রদর্শিত হয় না? ছোট্ট নমুনাটি অধ্যয়নের দুর্বলতা হিসাবে হাইলাইট করা হবে তবে আমি ভেবে অবাক হয়ে যাচ্ছি যে আমি এমন কিছু বিশাল পরিসংখ্যানগত সমস্যা আছে যা থেকে আমি পুরোপুরি অবজ্ঞাত। আমি ভবিষ্যতে আরও ১০-২০ জন অংশগ্রহণকারী নেওয়ার পরিকল্পনা করছি, তবে এটি এখনও এই জাতীয় বিশ্লেষণের জন্য অপেক্ষাকৃত ছোট্ট নমুনা নিয়ে আমাকে ছেড়ে যাবে।

  2. আমার ছোট নমুনা, বা আমি যে প্রসঙ্গে এটি ব্যবহার করছি তাতে বুটস্ট্র্যাপিংয়ের ব্যবহারে কোনও সমস্যা আছে?

আমি আশা করি এই প্রশ্নাগুলি এই ফোরামে খুব বেশি "বেসিক" নয়। আমি এসইএম এবং এর সাথে সম্পর্কিত বিভিন্ন বিষয়ে অধ্যায়গুলি পড়েছি তবে আমি দেখতে পাচ্ছি যে এই অঞ্চলে জনগণের মতামতের দিক থেকে খুব ছড়িয়ে ছিটিয়ে রয়েছে!

চিয়ার্স


1
@ বেহ্যাকড - সুস্পষ্ট ব্যাখ্যাযুক্ত সমস্যা। আপনি খুব বিরল ডেটা ব্যবহার করে প্রচুর প্যারামিটারের একটি হেক অনুমান করছেন। সুতরাং অনুমান ভয়ঙ্কর নড়বড়ে হতে চলেছে। তবে আমি পিছিয়ে গিয়ে জিজ্ঞাসা করতে চাই - আপনি কি এই 42 জনকে বৃহত্তর জনগোষ্ঠীর মধ্যে সম্পর্ক নির্ধারণের জন্য ব্যবহার করছেন? যদি তা হয়, তবে 42 টি কি এলোমেলো নমুনা, বা কমপক্ষে প্রদর্শিত কোনও প্রতিনিধি?
রোল্যান্ডো 2

আপনার মন্তব্য Rolando2 জন্য আপনাকে ধন্যবাদ! নমুনায় ৪২ টি বিশ্ববিদ্যালয়ের শিক্ষার্থী অন্তর্ভুক্ত রয়েছে এবং আমি বিভিন্ন কারণ ও উদ্বেগের মধ্যে সম্পর্কের দিকে তাকিয়ে আছি। যে সম্পর্কগুলি আমি অনুমান করতে চাইছি তা সাধারণ জনগণের মধ্যে। আমার সূচনাগুলি সীমিত কারণ অংশগ্রহণকারীরা সবাই তুলনামূলকভাবে কম তরুণ শিক্ষার্থী, তবে আমি কোনও নির্দিষ্ট জনসংখ্যার (যেমন, উদ্বেগজনিত ব্যাধিতে আক্রান্ত ব্যক্তি) খুঁজছি না। আমি উদাহরণস্বরূপ বিস্তৃতভাবে উল্লেখ করতে আগ্রহী যে এক্স অপ্রত্যক্ষভাবে একটি নন-ক্লিনিক্যাম নমুনায় ওয়াইয়ের সাথে যুক্ত। এটি কি আপনার প্রশ্নের উত্তর দেয়?
বেহাকাদ

1
@ বেচ্যাকড - ধরে নিচ্ছেন যে আপনি আপনার সম্ভাব্য সমালোচকদের আপনার নমুনার প্রতিনিধিত্বশীলতার পক্ষে রক্ষা করতে পারেন, আমি স্পষ্টতই বলব যে 12 ভেরিয়েবলের মধ্যে সম্পর্কের অনুমান করার চেষ্টা করা আপনার 42 টির ক্ষেত্রে খুব বেশি জিজ্ঞাসা করছে। আপনি কেবলমাত্র 3 টি সবচেয়ে আকর্ষণীয় ভবিষ্যদ্বাণীকে অন্তর্ভুক্ত করতে আপনার মডেলটিকে সহজ করতে পারেন কিনা তা দেখুন। যদিও আমি বুঝতে পারি যে এটি ডেটা ভাগ করে নিতে কষ্টদায়ক তা আপনি সংগ্রহ করতে কঠোর পরিশ্রম করেছেন!
রোল্যান্ডো

উত্তর দেওয়ার জন্য আপনাকে ধন্যবাদ। আমার একটি "অনুভূতি" আছে যে এই সমস্ত ভেরিয়েবলের মধ্যে সম্পর্কের অনুমান করা খুব ভাল 42 ডেটা পয়েন্টগুলির সাথে করা শক্ত এবং আপনি দেখতে পাচ্ছেন যে আপনি কোথা থেকে এসেছেন। বলা হচ্ছে, এই সমস্যার জন্য একটি পরিসংখ্যানগত কারণ (সর্বাধিক উদ্ধৃত) কী হবে? এটি বিভিন্ন নির্ভরশীল ভেরিয়েবলের উপর প্রচুর রিগ্রেশন / পারস্পরিক সম্পর্ক চালানো থেকে কীভাবে আলাদা? ফিট ভাল (এবং আমি আসলে বিভিন্ন পরীক্ষামূলক কাজের জন্য তিনটি আলাদা মডেল চালাচ্ছি) এবং ফলাফলগুলি মডেলগুলিতে এবং তত্ত্বের সাথে সামঞ্জস্যপূর্ণ। আমি যদি প্রতিরক্ষামূলক হিসাবে এসেছি তবে দুঃখিত!
বেহাকাদ

(প্রতিরক্ষামূলক নয় - কোনও উদ্বেগের বিষয় নয়!) ৪২ টি কেস থাকার কারণে আপনি অবিচ্ছিন্ন পরিসংখ্যানের অনুমানের পরেও খুব কমপক্ষে নমুনা ত্রুটির কাছে উপস্থিত হন। এখন, এসইএম এ, প্রতিটি পরিবর্তনশীল বহুবার ব্যবহার করা হয়, কারণ আপনি সি, ডি ইত্যাদি নিয়ন্ত্রণ করার সময় A থেকে B এর সম্পর্কের অনুমান করছেন তাই স্যাম্পলিং ত্রুটির প্রভাবগুলি প্রচার করা হবে, এটি আমার বোধগম্যতার কারণেই এক সাধারণত বড় নমুনা চায়। আপনার ক্ষেত্রে, আপনি নমুনা ত্রুটির চেয়ে সম্ভাব্যতর ধরণের ত্রুটি পেয়েছেন কারণ আপনার এলোমেলো নমুনা নেই। সুতরাং আপনার প্রাপ্ত ফলাফলের চারপাশে আপনাকে একটি খুব বড় বিশ্বাসযোগ্য অন্তর আঁকতে হবে।
Rolando2

উত্তর:


4

একটি বক্তব্য: "বেসিক প্রশ্ন" বলে কোনও জিনিস নেই, আপনি কেবল জানেন যা আপনি জানেন, এবং যা জানেন না তা নয়। একটি প্রশ্ন জিজ্ঞাসা প্রায়শই এটির একমাত্র উপায়।

আপনি যখনই ছোট নমুনাগুলি দেখেন, আপনি খুঁজে পেতে পারেন যে তাদের মডেলগুলিতে সত্যই "বিশ্বাস" আছে এবং কে না। আমি এটি বলি কারণ ছোট নমুনাগুলি সাধারণত যেখানে মডেলগুলির সবচেয়ে বেশি প্রভাব থাকে।

একজন উত্সাহী (সাইকো?) মডেলার নিজেই, আমি বলি এর জন্য যান! দেখে মনে হচ্ছে আপনি একটি সতর্ক দৃষ্টিভঙ্গি গ্রহণ করছেন এবং আপনি ছোট নমুনার কারণে সম্ভাব্য পক্ষপাত ইত্যাদি স্বীকার করেছেন। ছোট ডেটাতে ফিটিং মডেলগুলির সাথে একটি জিনিস মনে রাখবেন তা হল আপনার 12 ভেরিয়েবল রয়েছে। এখন আপনার চিন্তা করা উচিত - 12 টি ভেরিয়েবল সহ কোনও মডেল 42 টি পর্যবেক্ষণ দ্বারা নির্ধারণ করা যেতে পারে? আপনার যদি 42 ভেরিয়েবল থাকে, তবে যে কোনও মডেল সেই 42 টি পর্যবেক্ষণের সাথে পুরোপুরি ফিট হতে পারে (আলগাভাবে কথা বলার জন্য), সুতরাং আপনার ক্ষেত্রে খুব নমনীয় হওয়ার থেকে খুব বেশি দূরে নয়। আপনার মডেলটি খুব নমনীয় হলে কী হবে? এটি শব্দের সাথে খাপ খায় - এটি হ'ল সম্পর্কগুলি যা আপনি অনুমান করা বাদে অন্য কিছু দ্বারা নির্ধারিত হয়।

ভবিষ্যতের 10-20 নমুনাগুলি কী হবে আপনার মডেল থেকে কী হবে তা ভবিষ্যদ্বাণী করে যেখানে আপনার মডেলটি রয়েছে সেখানে আপনার অহং রাখারও সুযোগ রয়েছে। আমি অবাক হয়েছি যে আপনার সমালোচকরা তথাকথিত "ডজি" মডেলটির সাথে কী প্রতিক্রিয়া জানাবে যা সঠিক ভবিষ্যদ্বাণী দেয়। মনে রাখবেন যে আপনার মডেল যদি ডেটাটি ভালভাবে পূর্বাভাস না দেয় তবে আপনি অনুরূপ "আমি আপনাকে তাই বলেছিলাম" পেয়ে যাবেন।

আপনার ফলাফলটি নির্ভরযোগ্য যে আপনি নিজেকে নিশ্চিত করতে পারার অন্য উপায়টি হ'ল চেষ্টা করে তা ভেঙে দেওয়া। আপনার আসল ডেটা অক্ষুণ্ন রেখে একটি নতুন ডেটা সেট তৈরি করুন এবং দেখুন আপনার এসএম ফলাফলকে হাস্যকর মনে করার জন্য আপনাকে এই নতুন ডেটা সেটটিতে কী করতে হবে তা দেখুন। তারপরে আপনার কী করতে হবে তা দেখুন এবং বিবেচনা করুন: এটি কি যুক্তিসঙ্গত দৃশ্যাবলী? আমার "হাস্যকর" ডেটা কি সত্যিকারের সম্ভাবনার সাথে মিলে যায়? হাস্যকর ফলাফলগুলি তৈরি করতে যদি আপনার উপাত্তকে হাস্যকর অঞ্চলে নিয়ে যেতে হয় তবে এটি কিছুটা আশ্বাস দেয় (তাত্পর্যপূর্ণ, প্রথাগত নয়) আপনার পদ্ধতিটি সুদৃ .়।


1

মূল সমস্যাটি যা আমি এটি দিয়ে দেখছি তা পাওয়ারের অভাব of কনফার্মেটরি ফ্যাক্টর এবং এসইএম টেস্টিং নালটি স্বীকার করার জন্য চেহারা - আপনি একটি অ-উল্লেখযোগ্য পি-মান দেখতে চান - তাই পাওয়ারের অভাব সমস্যা হতে পারে। পরীক্ষার শক্তি নমুনার আকার (42) এবং স্বাধীনতার ডিগ্রিগুলির উপর নির্ভর করে। এএমওএস আপনাকে স্বাধীনতার ডিগ্রি দেয়। আপনি এটি উদ্ধৃত করেন নি তবে এই ক্ষেত্রে এটি বড় হবে না। 12 ভেরিয়েবলের সাহায্যে আপনি 66 ডিএফ দিয়ে শুরু করুন এবং প্রতিটি অনুমানের অনুমান অনুযায়ী 1 টি বিয়োগ করুন। আমি জানি না যে এটি কতটা হবে তবে আপনি বলে থাকেন যে বিভিন্ন কনস্ট্রাক্টের মধ্যে আপনার বেশ কয়েকটি কারণ এবং পারস্পরিক সম্পর্ক রয়েছে।

আমি রোল্যান্ডো 2 এর সাথে পুরোপুরি একমত নই। এসইএম-এ, আপনি প্রচুর পরিমাণে ভেরিয়েবল পেয়ে লাভ করেন, ধরে নিলেন যে এগুলি অন্তর্নিহিত নির্মাণগুলির নির্ভরযোগ্য সূচক। সুতরাং ভেরিয়েবলের সংখ্যা হ্রাস করবেন না। একই কারণে, আমি সম্পূর্ণরূপে @ সম্ভাব্যতা সম্পর্কিত ব্লগের সাথে একমত নই। SEM এ, আপনি 42 টি পর্যবেক্ষণ সহ 12 ভেরিয়েবল মডেল করার চেষ্টা করছেন না। আপনি 42 টি প্রতিলিপি দ্বারা শক্তিশালী 12 সূচকের মাধ্যমে কনস্ট্রাকশনগুলির মডেল করার চেষ্টা করছেন। খুব সাধারণ ফ্যাক্টর মডেল - 12 টি সূচকযুক্ত 1 ফ্যাক্টর - সম্ভবত 42 জনের সাথে পরীক্ষা করা যেতে পারে।

আরএমএসইএ এবং ফিটনেসগুলির অন্যান্য ধার্মিকতাগুলি আপনাকে মডেলটির স্যাচুরেশনের কাছাকাছি আসার সাথে সাথে উন্নতি করতে পারে, তাই আবার আপনি একটি বিভ্রান্তিমূলক ফলাফলের ঝুঁকি চালান।

বলা হচ্ছে, আমি দেখেছি ছোট ডেটা সেটগুলি একটি ফ্যাক্টর মডেলকে প্রত্যাখ্যান করে। এটি সম্ভবত এমন কিছু বোঝায় যা ফিটটি ভাল বলে মনে হয়।

দ্রষ্টব্য: আপনি একটি SEM মডেলের অবশিষ্টাংশও পরীক্ষা করতে পারেন। এগুলি অনুমানের কোভারিয়েন্স ম্যাট্রিক্স এবং মডেল কোভারিয়েন্স ম্যাট্রিক্সের মধ্যে পার্থক্য। আপনি যদি অনুরোধ করেন তবে এএমওএস সেগুলি আপনাকে দেবে। অবশিষ্টাংশগুলির পরীক্ষাটি ইঙ্গিত দিতে পারে যে তারা সমানভাবে বিতরণ করা হয়েছে, বা যদি কিছু নির্দিষ্ট গোষ্ঠী খুব খারাপভাবে লাগানো থাকে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.