যখন আরও বেশি উপাদান উপস্থিত থাকে তখন তাদের কী সরানো ভাল?


11

প্রধান উপাদান বিশ্লেষণের বিপরীতে, গুণক বিশ্লেষণ মডেলগুলির সমাধানগুলি অগত্যা নেস্টেড হয় না। অর্থাৎ প্রথম ফ্যাক্টরের জন্য লোডিংগুলি (উদাহরণস্বরূপ) অগত্যা অভিন্ন হবে না যখন কেবল প্রথম দুটি ফ্যাক্টর যখন বনাম প্রথম দুটি বের করা হয়।

এটি মাথায় রেখে, এমন একটি ক্ষেত্রে বিবেচনা করুন যেখানে আপনার কাছে ম্যানিফেস্ট ভেরিয়েবলগুলির একটি সেট রয়েছে যা অত্যন্ত সংযুক্ত এবং (তাদের বিষয়বস্তুর তাত্ত্বিক জ্ঞান দ্বারা) কোনও একক কারণ দ্বারা চালিত হওয়া উচিত। কল্পনা করুন যে অনুসন্ধানকারী ফ্যাক্টর বিশ্লেষণ করে (আপনি যে কোনও মেট্রিক পছন্দ করেন: সমান্তরাল বিশ্লেষণ, স্ক্রি প্লট, ইগেন মানগুলি> 1 ইত্যাদি) দৃ strongly়ভাবে প্রস্তাব দেয় যে কারণ রয়েছে: একটি বৃহত প্রাথমিক উপাদান এবং একটি ছোট মাধ্যমিক গুণক secondary আপনি প্রথম ফ্যাক্টরের জন্য অংশগ্রহণকারীদের মানগুলি ম্যানিফেস্ট ভেরিয়েবলগুলি এবং অনুমানের ফ্যাক্টর সমাধান ব্যবহার করতে আগ্রহী (অর্থাত্ ফ্যাক্টর স্কোরগুলি পান) participants এই পরিস্থিতিতে, এটি আরও ভাল হবে:2

  1. মাত্র ফ্যাক্টর এক্সট্র্যাক্ট করার জন্য একটি ফ্যাক্টর মডেল ফিট করুন এবং ফ্যাক্টর স্কোর (ইত্যাদি) পান, বা1
  2. উভয় উপাদানগুলি নিষ্কাশনের জন্য একটি ফ্যাক্টর মডেল ফিট করুন , কারণগুলির জন্য ফ্যাক্টর স্কোর পাবেন, কিন্তু দ্বিতীয় ফ্যাক্টরের জন্য স্কোরগুলি উপেক্ষা / উপেক্ষা করুন?

যার জন্য সর্বোত্তম অনুশীলন, কেন? এই বিষয়ে কোন গবেষণা আছে?


নিষ্কাশনের কারণগুলির সংখ্যা নির্বাচন করার সময় কারও কেবল প্রাক-বিশ্লেষণমূলক হিউরিস্টিক ডিভাইসের উপর নির্ভর করা উচিত নয়। পারস্পরিক সম্পর্কের প্রজনন (আপনি যদি 1 এর পরিবর্তে 2 টি উপাদান বের করেন তখন এটি কতটা ভাল?) কীভাবে সম্পর্কযুক্ত অবশিষ্টাংশগুলি এবং এই সমাধানগুলিতে বিতরণ করা হয়? (এগুলি সাধারণত ইউনিফর্ম বা সাধারণ সম্পর্কে হওয়া উচিত, দীর্ঘ / ফ্যাট ডান লেজ নেই)। যদি ডেটা স্বাভাবিক থাকে, তবে লোডিংয়ের ফিট এবং স্টেটারের পরীক্ষাগুলি গণনাযোগ্য (এমএল এক্সট্রাকশন সহ)। এই সমস্ত প্লাস ব্যাখ্যার ভিত্তিতে, কেউ সিদ্ধান্ত নিতে পারে যে বর্তমান ক্ষেত্রে (1) বা (2) উপায় ভাল কিনা better
ttnphns

(অবিরত) শেষ পর্যন্ত, কেবলমাত্র নতুন নমুনা / নিশ্চিতকরণকারী এফএই শেষ পর্যন্ত দ্বিধাদ্বন্দ্ব করতে পারে। তবে একটি ধারণা। যদি ২ য় ফ্যাক্টরটি সত্যিই দুর্বল হয় (এক্সট্রাকশনের পরে ছোট এসএস লোডিং) তবে আমি আশা করি না যে দুটি সমাধান (এবং তাই ফ্যাক্টর 1 এর ফ্যাক্টর স্কোর) খুব আলাদা হবে। (আমি এটি খুব বেশি আত্মবিশ্বাস ছাড়াই বলছি কারণ আমি ওভারহল ছাড়াই মন্তব্য করছি But তবে, যুক্তিযুক্তভাবে, যদি ফ্যাক্টর প্লেনটি লাইনের অধঃপতনের জন্য প্রস্তুত হয়, তবে ফলাফলগুলি কেবল লাইন হিসাবে প্রায় হওয়া উচিত ...)
টিটিএনফএনস

কিউ শিরোনাম Is is always better to extract more factors when they exist?খুব পরিষ্কার নয়। যতটা আছে সেখানে থেকে উত্তোলন করা সর্বদা ভাল। আপনার উল্লিখিত বিশ্লেষণের মাল্টিভিয়ারেট এবং অ-নেস্টেড প্রকৃতির কারণে আন্ডারফিটিং বা ওভারফিটিং উভয়ই "সত্য" সুপ্ত কাঠামোকে বিকৃত করে। সমস্যাটি হ'ল আমাদের ডেটাতে ঠিক কতগুলি কারণ রয়েছে তা আমরা জানি না। এবং এই তথ্যগুলির জনসংখ্যার যতটা আছে তা আছে কিনা।
ttnphns

1
@ এনটিএনএফএনএস, আপনার শেষ মন্তব্যটি প্রশ্নটির কেন্দ্রবিন্দুতে পৌঁছেছে বলে আমি মনে করি। আপনি যে পদ্ধতিগুলি নিশ্চিত করতে চান তা অবশ্যই ধরুন যে 2 টি কারণ রয়েছে যার মধ্যে 1 টি প্রায় সব ভাগ করে নেওয়া বৈকল্পিকের জন্য রয়েছে, যার মধ্যে একটি সিএফএ সহ একটি নতুন স্যাম্পল রয়েছে। ফিট W / 2 উপেক্ষিতভাবে আরও ভাল, তবে আরও ভাল। ইস্যুটি হাইলাইট করার স্বার্থে এটি একটি জাল ও স্বীকৃত উদাহরণ। অন্তর্নিহিত সমস্যাটি কেবল 5 এর মধ্যে 2 ব্যবহার করতে পারে
গং - মোনিকা পুনরায় স্থাপন করুন

1
প্রশ্নটি হল, যেহেতু সমাধানগুলি নেস্টেড নয়, কোন পদ্ধতির সাহায্যে আপনাকে প্রতিটি অংশগ্রহণকারীর সুপ্ত পরিবর্তনশীলের স্কোরের আরও ভাল অনুমান দেওয়া যায় এবং কেন? কেবলমাত্র 1 টি পক্ষপাতদুষ্ট ব্যবহার করছে, এটি কি সত্যের মান বা উভয় থেকে আলাদা হয়? এটি কি ঘটায় কারণ কেবল 1 টি ব্যবহার করা "আন্ডারফাইটিং"? এর আসল অর্থ কি? বিকৃতির প্রকৃতির বৈশিষ্ট্যটি কি সম্ভব? বিকল্পভাবে, আমি আশা করতে পেরেছিলাম যে কেবল 1 টি উত্তোলন বিশ্লেষণকে তার 1 তম ডিগ্রি যতটা সম্ভব যথাযথভাবে পাওয়ার বিষয়ে স্বাধীনতার সমস্ত ডিগ্রিগুলিকে ফোকাস করার অনুমতি দেয়।
গুং - মনিকা পুনরায়

উত্তর:


5

আপনি যে ইস্যুটির ইঙ্গিত দিচ্ছেন তা হ'ল 'আনুমানিক ইউনিডিমাইন্যালিটি' বিষয়টি যখন মনস্তাত্ত্বিক পরীক্ষার যন্ত্রগুলি নির্মাণ করছেন, যা 80 এর দশকে লিটারেচারে বেশ খানিকটা আলোচিত হয়েছিল। অতীতে অনুপ্রেরণা বিদ্যমান ছিল কারণ অনুশীলনকারীরা তাদের আইটেমগুলির জন্য traditionalতিহ্যবাহী আইটেম রেসপন্স থিওরি (আইআরটি) মডেলগুলি ব্যবহার করতে চেয়েছিলেন এবং সেই সময় এই আইআরটি মডেলগুলি একচেটিয়াভাবে একক মাত্রা পরিমাপের মধ্যে সীমাবদ্ধ ছিল। সুতরাং, পরীক্ষার বহুমাত্রিকতাটি এমন একটি উপদ্রব বলে আশা করা হয়েছিল যা (আশাকরি) এড়ানো বা উপেক্ষা করা যেতে পারে। এটিও কারণ যা অণু বিশ্লেষণে সমান্তরাল বিশ্লেষণ কৌশল তৈরি করেছিল (ড্র্যাসগো এবং পার্সনস, 1983) এবং আবিষ্কার পদ্ধতিগুলি।

অতিরিক্ত বৈশিষ্ট্য / কারণগুলি উপেক্ষা করার পরিণতিগুলি, ডেটাগুলিতে স্পষ্টতই ভুল মডেলটিকে ফিট করা ছাড়া (যেমন, সম্ভাব্য মডেলের ভুল সম্পর্কে তথ্য উপেক্ষা করা; যদিও এটি তুচ্ছ হতে পারে), প্রভাবশালী ফ্যাক্টরের বৈশিষ্ট্য অনুমানগুলি পক্ষপাতদুষ্ট হয়ে যাবে এবং অতএব কম দক্ষ এই উপসংহারগুলি অবশ্যই অতিরিক্ত বৈশিষ্ট্যের বৈশিষ্ট্যগুলির উপর নির্ভর করে (উদাহরণস্বরূপ, তারা প্রাথমিক মাত্রার সাথে সম্পর্কিত হয়, তাদের শক্তিশালী লোডিং রয়েছে, কত ক্রস-লোডিং রয়েছে ইত্যাদি ইত্যাদি) তবে সাধারণ থিমটি মাধ্যমিক অনুমান প্রাথমিক বৈশিষ্ট্য অর্জনের জন্য কম কার্যকর হবে। মিস-ফিটযুক্ত ইউনিফাইমেনশনাল মডেল এবং দ্বি-গুণক মডেলের মধ্যে তুলনার জন্য এখানে প্রযুক্তিগত প্রতিবেদনটি দেখুন ; প্রযুক্তিগত প্রতিবেদনটি ঠিক আপনি পরে যা করছেন বলে মনে হচ্ছে।

ব্যবহারিক দৃষ্টিকোণ থেকে, সর্বাধিক অনুকূল মডেল নির্বাচন করার সময় তথ্যের মানদণ্ড ব্যবহার করা সহায়ক হতে পারে, পাশাপাশি সাধারণভাবে মডেল-ফিট পরিসংখ্যান (আরএমএসইএ, সিএফআই, ইত্যাদি) কারণ বহুমাত্রিক তথ্য উপেক্ষা করার ফলাফল ডেটাতে সামগ্রিক ফিটকে নেতিবাচকভাবে প্রভাবিত করবে । তবে অবশ্যই, সামগ্রিক মডেল ফিট হ'ল ডেটার জন্য অনুপযুক্ত মডেলটি ব্যবহার করার একমাত্র ইঙ্গিত; এটি সম্পূর্ণরূপে সম্ভব যে অনুচিত ফাংশনাল ফর্মগুলি ব্যবহার করা হয়, যেমন অ-রৈখিকতা বা একঘেয়েমিটির অভাব, তাই সম্পর্কিত আইটেম / ভেরিয়েবলগুলি সর্বদা পাশাপাশিও পরিদর্শন করা উচিত।

আরও দেখুন :

ড্র্যাসগো, এফ এবং পার্সনস, সিকে (1983)। একক মাত্রিক আইটেম প্রতিক্রিয়া থিয়োরি মডেলগুলি বহুমাত্রিক তথ্যগুলিতে প্রয়োগ। ফলিত মনস্তাত্ত্বিক পরিমাপ, 7 (2), 189-199।

ড্র্যাসগো, এফ। ও লিসাক, আরআই (1983)। পরিবর্তিত সমান্তরাল বিশ্লেষণ: দ্বৈতভাবে স্কোর করা আইটেম প্রতিক্রিয়াগুলির সুপ্ত-মাত্রিকতা পরীক্ষা করার জন্য একটি পদ্ধতি। ফলিত মনোবিজ্ঞান জার্নাল, 68, 363-373।

লেভেন্ট কিরিসি, তসে চি হু, এবং লিফা ইউ (2001)। একক মাত্রা এবং সাধারণতার অনুমানের জন্য আইটেম প্যারামিটার অনুমান কর্মসূচির দৃust়তা। ফলিত মনস্তাত্ত্বিক পরিমাপ, 25 (2), 146-162।


এটি যুক্ত করার জন্য আপনাকে ধন্যবাদ। এটি আমি ঠিক পরে যা মনে হচ্ছে।
গুং - মনিকা পুনরায়

আমি কি সঠিকভাবে বুঝতে পারি যে শিরোনাম প্রশ্নের আপনার উত্তরটি "হ্যাঁ"?
অ্যামিবা

2
@ আমেবা সাধারণতঃ, আমি হ্যাঁ বলব, বা অতিরিক্ত তথ্য সহ কঠোর একতরফাজনিততা চাপিয়ে দেওয়ার চেয়ে ভাল বা আরও ভাল করা উচিত। জ্ঞাত বহুমাত্রিকতা উপেক্ষা করা খুব সমস্যাযুক্ত হতে পারে তবে অবশ্যই বেশ কয়েকটি কারণ এতে অবদান রাখবে। কাঠামো সম্পর্কে অতিরিক্ত তথ্য সহ কেবলমাত্র সময়টিই খারাপ হতে পারে যখন অতিরিক্ত পরামিতিগুলির স্থায়িত্বের সাথে নমুনার আকার খুব ছোট হয়; সুতরাং, পক্ষপাত-দক্ষতা বাণিজ্য বন্ধ। তবে, যদি নমুনার আকার কোনও ইস্যুটির বেশি না হয় তবে আমি বলব অতিরিক্ত তথ্য অন্তর্ভুক্ত করা থেকে হারাতে খুব সামান্যই আছে (তবে না থাকলে অনেকটাই হারাতে হবে)।
ফিলাচালাররা

1

আপনি যদি সত্যিই দ্বিতীয় ফ্যাক্টরটি ব্যবহার করতে না চান তবে আপনার কেবল একটি ফ্যাক্টর মডেল ব্যবহার করা উচিত। তবে আমি আপনার মন্তব্যে আশ্চর্য হয়েছি যে আপনি দ্বিতীয় ফ্যাক্টরটি ব্যবহার করলে প্রথম ফ্যাক্টরের লোডিংগুলি পরিবর্তন হবে।

প্রথমে সেই বিবৃতিটি মোকাবেলা করি। আপনি যদি উপাদানগুলি বের করার জন্য প্রধান উপাদানগুলি ব্যবহার করেন এবং ফ্যাক্টর রোটেশন ব্যবহার না করেন, তবে লোডগুলি পরিবর্তন হবে না - সম্ভবত স্কেলিংয়ের সাপেক্ষে (বা সম্পূর্ণ উল্টানো: যদি একটি উপাদান হয়, তবে এটি হিসাবে প্রকাশ করার বৈধ উপায় আমরা হব). আপনি যদি সর্বাধিক সম্ভাবনা নিষ্কাশন এবং / অথবা ফ্যাক্টর ঘূর্ণন ব্যবহার করেন, তবে লোডিংগুলি আপনি যে পরিমাণ উপাদানগুলি উত্তোলন করেছেন তার উপর নির্ভর করে।- xxx

পরবর্তী, আবর্তনের প্রভাবগুলির ব্যাখ্যার জন্য। আমি আঁকার পক্ষে ভাল নই, তাই আমি আপনাকে শব্দ ব্যবহার করে বোঝানোর চেষ্টা করব। আমি ধরে নেব যে আপনার ডেটা (প্রায়) সাধারণ, যাতে ফ্যাক্টর স্কোরগুলিও প্রায় স্বাভাবিক থাকে। আপনি যদি একটি ফ্যাক্টর নিষ্কাশন করেন তবে আপনি একটি মাত্রিক সাধারণ বিতরণ পাবেন, আপনি যদি দুটি কারণ বের করেন তবে আপনি একটি দ্বিবিভক্ত স্বাভাবিক বিতরণ পাবেন।

দ্বিখণ্ডিত বিতরণের ঘনত্ব মোটামুটি টুপিয়ের মতো বলে মনে হয় তবে সঠিক আকারটি স্কেলিংয়ের পাশাপাশি পারস্পরিক সম্পর্ক সহগের উপরও নির্ভর করে। সুতরাং ধরা যাক যে দুটি উপাদান প্রতিটি ইউনিট বৈকল্পিক আছে। নিরবিচ্ছিন্ন ক্ষেত্রে, আপনি চেনাশোনাগুলির মতো দেখতে লেভেল কার্ভগুলির সাথে একটি দুর্দান্ত সোমব্রেরো পান। একটি ছবি এখানে আছে । সহযোগিতা টুপিটি "স্কোয়াশেস" করে, যাতে এটি আরও নেপোলিয়নের টুপি বলে মনে হয়

আসুন ধরে নেওয়া যাক আপনার আসল ডেটা সেটটির তিনটি মাত্রা ছিল এবং আপনি এর বাইরে দুটি উপাদান বের করতে চান। আসুন স্বাভাবিকতাও বদ্ধ থাকি। এই ক্ষেত্রে ঘনত্ব একটি চার-মাত্রিক বস্তু, তবে স্তর বক্ররেখা ত্রিমাত্রিক এবং কমপক্ষে দৃশ্যমান হতে পারে। অসামঞ্জস্যিত ক্ষেত্রে স্তরের বক্ররেখাগুলি গোলাকার (সকার বলের মতো)। পারস্পরিক সম্পর্কের উপস্থিতিতে স্তরের বক্ররেখাগুলি আবার বিকৃত হয়ে একটি ফুটবলে পরিণত হবে, সম্ভবত একটি আন্ডারফ্ল্যাটেড, যাতে সিমের পুরুত্ব অন্য দিকগুলির বেধের চেয়ে ছোট হয়।

আপনি যদি পিসিএ ব্যবহার করে দুটি কারণ বের করেন তবে আপনি ফুটবলটিকে পুরোপুরি একটি উপবৃত্তে সমতল করুন (এবং আপনি উপবৃত্তের বিমানে প্রতিটি ডেটা পয়েন্ট প্রজেক্ট করবেন)। অরক্ষিত প্রথম ফ্যাক্টরটি উপবৃত্তের দীর্ঘ অক্ষের সাথে মিলে যায়, দ্বিতীয় ফ্যাক্টরটি এটি লম্ব হয় (অর্থাত্ সংক্ষিপ্ত অক্ষ)। এরপরে আবর্তন কিছু অন্যান্য সহজ মানদণ্ডকে সন্তুষ্ট করতে এই উপবৃত্তের মধ্যে একটি সমন্বিত সিস্টেম বেছে নেয় ।

যদি আপনি কেবল একটি একক ফ্যাক্টর বের করেন তবে ঘূর্ণন অসম্ভব তবে আপনাকে গ্যারান্টিযুক্ত যে নিষ্কাশিত পিসিএ ফ্যাক্টরটি উপবৃত্তের দীর্ঘ অক্ষের সাথে মিলে যায়।


2
আমি এই উত্তরটি দেখে হতবাক হয়েছি প্রধান উপাদান উপাদান বিশ্লেষণের বিপরীতে প্রশ্নটি স্পষ্টভাবে ফ্যাক্টর বিশ্লেষণ সম্পর্কে জিজ্ঞাসা করে ।
অ্যামিবা

উপাদানগুলি আহরণের দুটি উপায় রয়েছে: প্রধান উপাদান বা সর্বাধিক সম্ভাবনা। আমি এ সম্পর্কে কোনও পরিসংখ্যান করি নি, তবে আমি বিশ্বাস করি যে মূল উপাদানটি আরও বেশি ব্যবহৃত হয়।
ব্যবহারকারী3697176

3
প্রচুর বিভিন্ন পদ্ধতি রয়েছে, দু'টিরও বেশি। অধ্যক্ষ অক্ষ, এমএল, মিনার, ওজন সর্বনিম্ন স্কোয়ার এবং আরও অনেক কিছু - আমি এখানে বিশেষজ্ঞ নই। পিসিএ সম্ভবত কখনও কখনও (খুব কমই!) ফ্যাক্টর আহরণের একটি পদ্ধতিও বিবেচিত হয়, তবে এটি বেশ আঠালো - এটি আসলে হওয়া উচিত নয়। এটি একটি ভিন্ন মডেল ফিট করে।
অ্যামিবা

আপনার 1 ম বাক্যটি আমার প্রশ্নটিকে সম্বোধন করে that সে সম্পর্কে আরও শুনে ভাল লাগবে এবং কেন এটি সঠিক হতে পারে। উপাদানগুলি আহরণের পদ্ধতি সম্পর্কে, @ অ্যামিবা ঠিক: পিসিএ এবং পিএএফ সাধারণ বিষয় ছিল যখন অন্যান্য অ্যালগরিদমগুলি তত উন্নত বা বাস্তবায়ন করা শক্ত ছিল না। তারা এখন ব্যাপকভাবে নিকৃষ্ট বলে বিবেচিত হয়। আর এর fa()উদাহরণগুলি বছরের পর বছর ধরে এগুলি ব্যবহার করে না। অন্যান্য পদ্ধতিগুলি অ-নেস্টেড সমাধানগুলি দেবে, যা ডাব্লু / সফ্টওয়্যার এবং একটি এফএ ডেটাসেট যাচাই করা সহজ। তুলনামূলকতার স্বার্থে, আপনি উভয় সমাধানকেই অরক্ষিত বিবেচনা করতে পারেন। এফডাব্লুআইডাব্লু, আমি গোলাকার এবং উপবৃত্তাকার এমভিএন বিতরণগুলির ধারণা / ড।
গুং - মনিকা পুনরায়

1
@ গুং, একটি মন্তব্য পিএএফ পদ্ধতিটি অনাবৃত সমাধানও দেয়। এটি একটি জঘন্য এফএ পদ্ধতি (পদ্ধতি হিসাবে পিসিএ ভিত্তিক যদিও) এবং, আমার ধারণা, এখনও এটি ব্যাপকভাবে ব্যবহৃত হয়।
ttnphns

1

দুটি মডেল চালানোর জন্য আপনি লাভান বা এমপি্লাসের মতো কিছু কেন ব্যবহার করবেন না (একক মাত্রা মডেল এবং একটি দ্বিমাত্রিক মডেল আপনার EFA ফলাফলের সাথে সংযুক্ত) এবং বিভিন্ন মডেলের আপেক্ষিক এবং পরম ফিট ইনডেক্সগুলির তুলনা করুন (অর্থাত্, তথ্যের মানদণ্ড - এআইসি এবং বিআইসি, আরএমএসইএ, এসআরএমআর, সিএফআই / টিএলআই)? নোট করুন যে আপনি যদি এই রাস্তায় নামেন তবে আপনি EFA এর জন্য পিসিএ ব্যবহার করতে চাইবেন না, বরং মূল কারণগুলি principal পরিমাপের সাথে সত্যই সংশ্লিষ্ট কেউ সিএফএকে একটি সম্পূর্ণ কাঠামোগত সমীকরণ মডেলটিতে এম্বেড করবে।

সম্পাদনা করুন: আমি আপনাকে যে পদ্ধতির বিষয়ে বিবেচনা করতে বলছি তা হ'ল আরও কতগুলি সুপ্ত ভেরিয়েবল আইটেমগুলির সেটটি ব্যাখ্যা করে তা নির্ধারণের বিষয়ে। আপনি যদি বৃহত্তর ফ্যাক্টরের সর্বোত্তম অনুমান পেতে চান তবে আমি সিএফএ মডেল থেকে যেটিই হোক না কেন আরও ভাল ফিট করে ফ্যাক্টর স্কোরগুলি ব্যবহার করার পক্ষে ভোট দেব।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.