বাইনারি ডেটাতে প্রধান উপাদান বিশ্লেষণ বা ফ্যাক্টর বিশ্লেষণ করা


30

বিপুল সংখ্যক হ্যাঁ / না প্রতিক্রিয়া সহ আমার একটি ডেটাসেট রয়েছে। আমি কি এই জাতীয় ডেটার জন্য প্রধান উপাদান (পিসিএ) বা অন্য কোনও ডেটা হ্রাস বিশ্লেষণ (যেমন ফ্যাক্টর বিশ্লেষণ) ব্যবহার করতে পারি? এসপিএসএস ব্যবহার করে কীভাবে আমি এটি করতে যাচ্ছি দয়া করে পরামর্শ দিন।


1
কী আপনাকে পিসিএকে বিশেষত বৈষম্যমূলক বিশ্লেষণের বিরোধী হিসাবে বিবেচনা করেছে?
ক্রিস সিমোক্যাট

1
আরও দেখুন: stats.stackexchange.com/a/186026/3277
ttnphns

উত্তর:


39

পিসিএ বা ফ্যাক্টর বিশ্লেষণে দ্বিধাত্বক বা বাইনারি পরিবর্তনশীলগুলির প্রশ্ন চিরন্তন। "এটি অবৈধ" থেকে "এটি ঠিক আছে" এর মত পোলার মতামত রয়েছে, "আপনি এটি করতে পারেন তবে আপনি অনেকগুলি কারণ পেয়ে যাবেন" something আমার নিজের বর্তমান মতামত নিম্নরূপ। প্রথমত, আমি মনে করি যে বাইনারি পর্যবেক্ষণ পরিবর্তনশীল হ'ল ডিজিট্রেট এবং এটি যে কোনওভাবেই ধারাবাহিক হিসাবে আচরণ করা অনুচিত। এই পৃথক পরিবর্তনশীল কি ফ্যাক্টর বা প্রধান উপাদানকে জন্ম দিতে পারে?

  • ফ্যাক্টর বিশ্লেষণ (এফএ)। সংজ্ঞা অনুসারে ফ্যাক্টর একটি অবিচ্ছিন্ন সুপ্ত যা পর্যবেক্ষণযোগ্য ভেরিয়েবলগুলি লোড করে ( 1 , 2 )। ফলস্বরূপ, পরেরটি কেবল অবিচ্ছিন্ন হতে পারে না (বা বিরতি, আরও ব্যবহারিকভাবে বলতে গেলে) যখন পর্যাপ্ত পরিমাণে লোড হয়। এছাড়াও, এফএ, এর রৈখিক প্রতিরোধমূলক প্রকৃতির কারণে ধরে নিয়েছে যে বাকী - লোড নয় - অংশ, যাকে ইউনিফিক্স বলা হয়, তা হয় নিরন্তর, এবং তাই এটি পর্যবেক্ষণযোগ্য ভেরিয়েবলগুলি সামান্য লোড হওয়ার পরেও অবিচ্ছিন্ন হওয়া উচিত। সুতরাং, বাইনারি ভেরিয়েবলগুলি এফএতে নিজেকে আইন করতে পারে না। তবে, কমপক্ষে দুটি উপায় রয়েছে: (ক) ডাইকোটমিজগুলি ধরে নিন কারণ রাউজেনডগুলি অন্তর্নিহিত চলকগুলি অব্যাহত রাখে এবং পিয়ারসনের পরিবর্তে টেট্রাকোরিকের সাথে এফএ করুন - পারস্পরিক সম্পর্ক; (খ) ধরে নিন যে ফ্যাক্টর লিনিয়ারলি নয় বরং লজিস্টিকভাবে একটি দ্বিধাত্বক ভেরিয়েবল লোড করে এবং রৈখিক এফএ এর পরিবর্তে ল্যাটেন্ট ট্রেইট অ্যানালাইসিস (ওরফে আইটেম রেসপন্স তত্ত্ব) করেন do আরও পড়ুন

  • অধ্যক্ষ উপাদান উপাদান বিশ্লেষণ (পিসিএ)। এফএর সাথে অনেক মিল রয়েছে, পিসিএ কোনও মডেলিং নয়, কেবল একটি সংক্ষিপ্তকরণ পদ্ধতি। উপাদানগুলি লোকে ভেরিয়েবলগুলির মতো একই ধারণাগত অর্থে ভেরিয়েবলগুলি লোড করে না। পিসিএতে উপাদানগুলি ভেরিয়েবল এবং ভেরিয়েবল লোড উপাদান লোড করে। এই প্রতিসাম্যতা হ'ল প্রতি সেমি পিসিএ কেবল স্থানের পরিবর্তনশীল-অক্ষগুলির আবর্তন। বাইনারি ভেরিয়েবলগুলি তাদের নিজের দ্বারা কোনও উপাদানটির সত্যিকারের ধারাবাহিকতা সরবরাহ করে না - যেহেতু তারা অবিচ্ছিন্ন নয়, তবে সিউডোকন্টিনিউটি পিসিএ-রোটেশনের কোণ দ্বারা সরবরাহ করা যেতে পারে যা কোনও প্রদর্শিত হতে পারে। সুতরাং, পিসিএতে এবং এফএ এর বিপরীতে, আপনি খাঁটি বাইনারি ভেরিয়েবল (অরোটেটেড অক্ষ) দিয়ে আপাতদৃষ্টিতে ধারাবাহিক মাত্রা (ঘোরানো অক্ষ) পেতে পারেন - কোণ ধারাবাহিকতার কারণ1

    (0,0)2

বাইনারি তথ্যগুলির এফএ বা পিসিএ সম্পর্কিত কিছু সম্পর্কিত প্রশ্ন: 1 , 2 , 3 , 4 , 5 , 6 । সেখানে উত্তরগুলি সম্ভবত আমার থেকে পৃথক মতামত প্রকাশ করতে পারে।


1স্তর সত্তা - পয়েন্ট হিসাবে বিন্যাস বা বিভাগ হিসাবে পয়েন্ট হিসাবে - মূল অক্ষ অক্ষের তাদের স্থানাঙ্কগুলি বৈধভাবে সত্যই মান স্কেল করে। তবে বাইনারি ডেটার ডেটা পয়েন্টগুলির জন্য (ডেটা কেসগুলি) নয়, - তাদের "স্কোরগুলি" সিউডো ক্রমাগত মানগুলি: অভ্যন্তরীণ পরিমাপ নয়, কেবল কয়েকটি ওভারলে স্থানাঙ্ক।


21

বাইনারি ডেটার উদাহরণ (দুটি ভেরিয়েবলের কেবল একটি সাধারণ ক্ষেত্রে):

এখানে চিত্র বর্ণনা লিখুন

নীচের স্ক্যাটারপ্লটগুলি কিছুটা প্যাটারযুক্ত (ফ্রিকোয়েন্সি রেন্ডার করতে) পয়েন্টগুলি প্রদর্শন করে এবং মূল উপাদানগুলির অক্ষগুলি ত্রিভুজরেখাগুলি দেখায় যেগুলি তাদের উপর উপাদান স্কোর বহন করে [সেই স্কোরগুলি, আমার দাবি অনুসারে সিউডো অবিচ্ছিন্ন মানগুলি]। প্রতিটি চিত্রের বাম প্লট উত্স থেকে "কাঁচা" বিচ্যুতির ভিত্তিতে পিসিএ প্রদর্শন করে, এবং ডান প্লট এটি থেকে ছোট (তির্যক = ইউনিট) বিচ্যুতির ভিত্তিতে পিসিএ প্রদর্শন করে।

1) ditionতিহ্যবাহী পিসিএ (0,0)উত্সটিকে ডেটা মানে (সেন্ট্রয়েড) এ রাখে । বাইনারি ডেটার জন্য, গড় কোনও সম্ভাব্য ডেটা মান নয়। এটি তবে মহাকর্ষের শারীরিক কেন্দ্র। পিসিএ এ সম্পর্কে সর্বাধিক পরিবর্তনশীল।

(এটিও ভুলে যাবেন না যে, বাইনারি ভেরিয়েবলের গড় এবং বৈকল্পিকগুলি কঠোরভাবে এক সাথে আবদ্ধ থাকে, তাই তারা বলতে হয়, "একটি জিনিস"। বাইনারি ভেরিয়েবলগুলি মানিককরণ / স্কেলিং করা, এটি পিসিএ করণীয়ের ভিত্তিতে নয়, কোভেরিয়েন্স নয় বর্তমান উদাহরণটির অর্থ হ'ল আপনি আরও সুষম ভেরিয়েবলের প্রতিবন্ধকতা সৃষ্টি করেন - অধিকতর বৈসাদৃশ্য থাকা - আরও স্কিউ ভেরিয়েবলের চেয়ে বেশি পিসিএকে প্রভাবিত করতে))

এখানে চিত্র বর্ণনা লিখুন

২) আপনি ননসেন্টারযুক্ত ডেটাতে পিসিএ করতে পারেন, অর্থ উত্সটি লোকেশনটিতে (0,0)যেতে দিন (0,0)। এটি এমএসসিপি ( X'X/n) ম্যাট্রিক্সে বা কোসাইন মিলের ম্যাট্রিক্সে পিসিএ । পিসিএ নো-অ্যাট্রিবিউট রাষ্ট্র থেকে প্রোটিউরেবিলিটি সর্বাধিক করে তোলে।

এখানে চিত্র বর্ণনা লিখুন

3) আপনি (0,0)ম্যানহাটনের দূরত্বের ক্ষুদ্রতম যোগফলের ডেটা পয়েন্টে এটি থেকে অন্য সমস্ত ডেটা পয়েন্টের কাছে L1 মিডয়েডের মধ্যে থাকতে পারেন। মেডিওড, সাধারণত, সবচেয়ে "প্রতিনিধি" বা "সাধারণ" ডেটা পয়েন্ট হিসাবে বোঝা যায়। অতএব, পিসিএ atypicality সর্বাধিক বৃদ্ধি করবে (ফ্রিকোয়েন্সি ছাড়াও) আমাদের ডেটাতে, এল 1 মেডয়েড (1,0)মূল স্থানাঙ্কে পড়েছে ।

এখানে চিত্র বর্ণনা লিখুন

4) বা (0,0)ডেটা স্থানাঙ্কগুলিতে উত্সটি রাখুন যেখানে ফ্রিকোয়েন্সি সর্বাধিক - মাল্টিভারিয়েট মোড। এটি (1,1)আমাদের উদাহরণের ডেটা সেল। পিসিএ জুনিয়র মোডকে সর্বাধিক করবে (চালিত করবে)।

এখানে চিত্র বর্ণনা লিখুন

৫) উত্তরের শরীরে এটি উল্লেখ করা হয়েছিল যে টেট্রাকোরিক পারস্পরিক সম্পর্কগুলি বাইনারি ভেরিয়েবলের জন্য ফ্যাক্টর বিশ্লেষণ করার জন্য একটি শক্ত বিষয়। পিসিএ সম্পর্কে একই কথা বলা যেতে পারে: আপনি টেট্রাকোরিক পারস্পরিক সম্পর্কের ভিত্তিতে পিসিএ করতে পারেন । যাইহোক, এর অর্থ আপনি বাইনারি ভেরিয়েবলের মধ্যে অন্তর্নিহিত অবিচ্ছিন্ন পরিবর্তনশীল মনে করছেন are


2
বাইনারি আইটেম এবং আইআরটি মডেলগুলির এফএর মধ্যে সংযোগ সম্পর্কে (1- এবং 2-পিএল), এখানে দুটি নিবন্ধ রয়েছে যা আকর্ষণীয় হতে পারে: তাকান এবং ডি লিউউ, আইটেম রেসপন্স তত্ত্ব এবং বিযুক্ত বৈকল্পিকগুলির ফ্যাক্টর বিশ্লেষণের মধ্যে সম্পর্কের বিষয়ে , সাইকোমেট্রিক ( 1987) 52 (3): 393; এবং আরও সাম্প্রতিক একটি, কামতা ও বাউয়ার, ফ্যাক্টর অ্যানালিটিক এবং আইটেম রেসপন্স থিওরি মডেলগুলির মধ্যে সম্পর্কিত সম্পর্কিত একটি নোট , এসইএম (২০০৮) 15: 136।
chl
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.