বিভিন্ন প্রধান উপাদান বা পিসিএ / এফএ থেকে বজায় রাখা উপাদানগুলি থেকে একটি সূচক তৈরি করা


15

আমি আমার গবেষণার জন্য প্রয়োজনীয় সূচক তৈরি করতে প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস (পিসিএ) ব্যবহার করছি। আমার প্রশ্ন হ'ল পিসিএর মাধ্যমে গণনা করা রক্ষণাবেক্ষণের মূল উপাদানগুলি ব্যবহার করে কীভাবে আমার একটি একক সূচক তৈরি করা উচিত।

উদাহরণস্বরূপ, আমি পিসিএ ব্যবহার করার পরে 3 টি মূল উপাদান ধরে রাখার সিদ্ধান্ত নিয়েছি এবং আমি এই 3 প্রধান উপাদানগুলির জন্য স্কোর গণনা করেছি। প্রতিটি উত্তরদাতাদের জন্য এই 3 টি স্কোরের মধ্যে একটি একক সূচক তৈরি করার উপযুক্ত উপায়গুলি কী?

  • যৌগিক মান পেতে 3 টি গণিত স্কোর যুক্ত করা কি প্রাসঙ্গিক?
  • নাকি গড়ে 3 টি স্কোর এরকম একটি মান আছে?
  • বা আমি কি কেবলমাত্র প্রথম প্রধান উপাদানটি (সবচেয়ে শক্তিশালী) রেখেছি এবং এর স্কোরকে সূচক হিসাবে ব্যবহার করব?

বিকল্পভাবে, কেউ ফ্যাক্টর অ্যানালাইসিস (এফএ) ব্যবহার করতে পারে তবে একই প্রশ্নটি রয়ে গেছে: বিভিন্ন ফ্যাক্টরের স্কোরের ভিত্তিতে একটি একক সূচক কীভাবে তৈরি করবেন?


4
পিসি সংজ্ঞা অনুসারে অসংযোজিত। সুতরাং, ভেরিয়েবল হিসাবে, তারা কোনওভাবে একে অপরের তথ্য নকল করে না। এর অর্থ হল যে এগুলির মধ্যে একটি একক মান (যৌগিক পরিবর্তনশীল) তৈরি করার কোনও কারণ নেই। বা, কখনও কখনও তাদের গুণ করা আগ্রহের হয়ে উঠতে পারে, সম্ভবত - তবে যোগফল বা গড় গড় হয় না।
ttnphns

3
আমি @ttnphns এর সাথে একমত: আপনার প্রথম দুটি বিকল্প খুব একটা বোঝায় না এবং তিনটি পিসিকে একটি সূচকে "সংযুক্ত" করার পুরো প্রচেষ্টাটি বিপথগামী বলে মনে হয়। আপনার সূচক হিসাবে প্রথম পিসি নিন বা সম্পূর্ণ আলাদাভাবে কিছু পদ্ধতির ব্যবহার করুন।
অ্যামিবা বলেছেন মনিকাকে

2
@ttnphns নিরবিচ্ছিন্ন, স্বতন্ত্র নয়। কেবলমাত্র রৈখিকভাবে নয়, পিসি জুড়ে অপ্রয়োজনীয় তথ্য পুনরাবৃত্তি হতে পারে।
অনুমানগুলি

1
@ আমেবা এই অনুস্মারকটির জন্য আপনাকে ধন্যবাদ। আমি ট্যাগ এবং এর সংক্ষিপ্তসার stats.stackexchange.com/tags/valuation/info এ সংস্করণের খসড়া তৈরি করেছি
হোয়বার

1
@ttnphns আপনি কি আপনার উপরের মন্তব্যের ভিত্তিতে একটি উত্তর পোস্ট করার বিষয়টি বিবেচনা করবেন? আমি এখনই এখানে একটি অনুগ্রহ শুরু করেছি কারণ এই প্রশ্নের বিভিন্নতা উপস্থিত হতে থাকে এবং আমরা সদৃশ হিসাবে এগুলি বন্ধ করতে পারি না কারণ কোথাও কোনও সন্তোষজনক উত্তর নেই।
অ্যামিবা বলেছেন মোনিকা

উত্তর:


11

এই উত্তরটি ইচ্ছাকৃতভাবে অ-গাণিতিক এবং অ-পরিসংখ্যানবিদ মনোবিজ্ঞানী (বলুন) এর দিকে দৃষ্টিভঙ্গি করা হয়েছে যিনি প্রতিটি উত্তরদাতার জন্য একটি "সংমিশ্রিত সূচক" স্কোর অর্জনের জন্য বিভিন্ন কারণগুলির গড় / গড় ফ্যাক্টর স্কোরগুলি যোগ করতে পারেন কিনা তা অনুসন্ধান করে।

কিছু ভেরিয়েবলের স্কোরের সমষ্টি বা গড় গড় ধরে নেওয়া যায় যে ভেরিয়েবলগুলি একই মাত্রার সাথে সম্পর্কিত এবং এটি ছত্রাকযুক্ত পদক্ষেপ। (প্রশ্নে, "ভেরিয়েবল" হ'ল উপাদান বা ফ্যাক্টর স্কোর , যা জিনিস পরিবর্তন করে না, যেহেতু তারা ভেরিয়েবলের উদাহরণ।)

এখানে চিত্র বর্ণনা লিখুন

সত্যই (চিত্র 1), উত্তরদাতাদের 1 এবং 2 সমান তাত্ত্বিক হিসাবে দেখা যেতে পারে (অর্থাত্ 0 থেকে বিচ্যুত হওয়া, ডেটা সেন্টারের লোকস বা স্কেল উত্সের লোকস), উভয়ই একই গড় স্কোর এবং ( 1.2 + .4 ) / 2 = .8X + Y নির্মানের জন্য X এবং Y এর মতোই নিখুঁততার পরিধি হিসাবে মান .8 কার্যকর(.8+.8)/2=.8(1.2+.4)/2=.8.8X+YXYআলাদাভাবে। সমান্তরাল ভেরিয়েবলগুলি, একই এক মাত্রার প্রতিনিধিত্ব করে, একই বৈশিষ্ট্যের পুনরাবৃত্তি পরিমাপ এবং এলোমেলো ত্রুটি হিসাবে তাদের স্কোরের পার্থক্য বা অ-সমতা হিসাবে দেখা যেতে পারে। সুতরাং এলোমেলো ত্রুটিগুলি একে অপরকে স্পে- তে বাতিল করে দেবে বলে প্রত্যাশার কারণে এটি স্কোরের সমষ্টি / গড়ের জন্য ওয়ারেন্ডারড ।

এবং ওয়াই একই "মাত্রা" দেখা যথেষ্ট পরিমাণে পারস্পরিক সম্পর্ক না রাখলে তা হয় না । তারপরে, কোনও উত্তরদাতার বিচ্যুতি / নৈমিত্তিকতা উত্স থেকে ইউক্লিডিয়ান দূরত্ব দ্বারা জানানো হয় (চিত্র 2)।XY

এখানে চিত্র বর্ণনা লিখুন

উত্তরদাতাদের 1 এবং 2: distance এর জন্য এই দূরত্বটি আলাদা এবং.82+.821.131.22+.421.26X=.8Y=.8X=0Y=0

wXXi+wYYiXYwXwYসমস্ত উত্তরদাতাদের জন্য স্থির থাকে I, যা ত্রুটির কারণ। কোনও উত্তরদাতার দ্বিবিভক্ত বিচ্যুতি সম্পর্কিত - একটি বৃত্ত বা উপবৃত্তে - তার স্কোরের উপর নির্ভরশীল ওজনগুলি প্রবর্তন করতে হবে; ইউক্লিডিয় দূরত্ব আগে বিবেচিত হয় আসলে মান উপর নির্ভরশীল ওজন দিয়ে এত ভরযুক্ত সমষ্টি একটি উদাহরণ। এবং যদি আপনার পক্ষে ভেরিয়েবলের অসম বৈকল্পিকগুলি অন্তর্ভুক্ত করা হয় (উদাহরণস্বরূপ মূল উপাদানগুলির যেমন প্রশ্নে) আপনি ভারিত ইউক্যালিডিয়ান দূরত্বটি গণনা করতে পারেন, বৃত্তটি দীর্ঘায়িত হওয়ার পরে চিত্রের মধ্যে যে দূরত্বটি পাওয়া যাবে। 2

|.8|+|.8|=1.6|1.2|+|.4|=1.6X=.8Y=.81.60

(আপনি "আমি ম্যানহাটেন দূরত্বকে বেছে নিয়েছি বলে ভাল বিবেক দিয়ে আমি সমস্ত ডেটা স্কোরকে ইতিবাচক এবং গণনা সমষ্টি (বা গড়) করব বলে মন্তব্য করতে পারি", তবে দয়া করে মনে করুন - আপনি কি অবাধে উত্সকে সরানোর অধিকারী? মূল উপাদান বা উপাদান, উদাহরণস্বরূপ, ডেটাটিকে কেন্দ্র করে ডেটাটিকে এই অবস্থার অধীনে উত্তোলন করা হয় যা ভাল ধারণা দেয় makes অন্য উত্সটি অন্যান্য স্কোর সহ অন্যান্য উপাদান / উপাদান তৈরি করে। না, বেশিরভাগ সময় আপনি উত্সের সাথে না খেলেন - লোকস "সাধারণ উত্তরদাতা" বা "শূন্য-স্তরের বৈশিষ্ট্য" - যেমনটি আপনি খেলতে আগ্রহী)

যোগফল , যদি যৌগিক নির্মাণের উদ্দেশ্যটি উত্তরদাতাদের কিছু কিছু "শূন্য" বা সাধারণ লোকাসের সাথে সম্পর্কিত তবে ভেরিয়েবলগুলি খুব সহজেই সম্পর্কিত হতে পারে না, সেই উত্স থেকে কিছু স্থানিক দূরত্ব এবং গড় (বা যোগফল) নয় বা unweighted, চয়ন করা উচিত।

ওয়েল, পরিমাপের বিকল্পটি হিসাবে যদি আপনি (নিরবিচ্ছিন্ন) ভেরিয়েবলগুলি দেখার সিদ্ধান্ত নেন তবে গড় (যোগফল )টি বোধগম্য হবে একই জিনিসটি । আপনি ইচ্ছাকৃতভাবে ভেরিয়েবলের বিভিন্ন প্রকৃতি উপেক্ষা করছেন। অন্য কথায়, আপনি সচেতনভাবে চিত্র 2 এ চিত্রের পক্ষে রেখে দিন 1: আপনি "ভুলে গেছেন" যে ভেরিয়েবলগুলি স্বাধীন। তারপরে - যোগফল বা গড় করুন। উদাহরণস্বরূপ, "উপাদান কল্যাণ" এবং "সংবেদনশীল কল্যাণ" এর উপর ভিত্তি করে স্কোর গড়ে নেওয়া যেতে পারে, একইভাবে "স্থানিক আইকিউ" এবং "মৌখিক আইকিউ" তেও স্কোর পাওয়া যায়। খাঁটি ব্যবহারিক এই ধরণেরঅনুমোদিত নয়, তাত্ত্বিকভাবে সম্মিলিত সংস্থাগুলিকে ব্যাটারি সূচকগুলি বলা হয় (পরীক্ষাগুলি বা প্রশ্নপত্রগুলির সংকলন যা সম্পর্কহীন জিনিসগুলি বা পারস্পরিক সম্পর্কযুক্ত জিনিসগুলি পরিমাপ করে যার সম্পর্কগুলি আমরা উপেক্ষা করি তাকে "ব্যাটারি" বলা হয়)। ব্যাটারি সূচকগুলি কেবল তখনই বোঝা যায় যখন স্কোরগুলির একই দিক থাকে (যেমন ধন এবং মানসিক স্বাস্থ্য উভয়ই "আরও ভাল" মেরু হিসাবে দেখা হয়)। সংকীর্ণ অ্যাডহক সেটিংসের বাইরে তাদের উপকারিতা সীমিত।

যদি ভেরিয়েবলগুলি আন্তঃসম্পর্কীয় সম্পর্কের মধ্যে থাকে - তবে তারা একে অপরের নকল, বিকল্প হিসাবে দেখতে যথেষ্ট দৃlated়রূপে এখনও সংযুক্ত হয় না, তবে আমরা প্রায়শই তাদের মানগুলিকে ভারিত পদ্ধতিতে যোগ (বা গড়) করি। তারপরে এই ওজনগুলি যত্ন সহকারে ডিজাইন করা উচিত এবং এগুলি বা সেভাবে পারস্পরিক সম্পর্কগুলি প্রতিফলিত করা উচিত। এটি আমরা যা করি, উদাহরণস্বরূপ, পিসিএ বা ফ্যাক্টর বিশ্লেষণের মাধ্যমে (এফএ) যেখানে আমরা বিশেষভাবে গণনা করি উপাদান / গুণক স্কোর । যদি আপনার ভেরিয়েবলগুলি নিজেরাই ইতিমধ্যে উপাদান বা ফ্যাক্টর স্কোর হয় (যেমন ওপি প্রশ্ন এখানে বলে) এবং সেগুলি পরস্পর সম্পর্কিত হয় (তির্যিক ঘূর্ণনের কারণে), তবে আপনি তাদের (বা সরাসরি লোডিং ম্যাট্রিক্স) দ্বিতীয় আদেশের পিসিএ / এফএ অনুসন্ধান করতে পারেন ওজন পান এবং দ্বিতীয়-ক্রমের পিসি / ফ্যাক্টর পান যা আপনার জন্য "সম্মিলিত সূচক" পরিবেশন করবে।

তবে যদি আপনার উপাদান / ফ্যাক্টর স্কোরগুলি অনিয়ন্ত্রিত বা দুর্বলভাবে সম্পর্কযুক্ত হয় তবে এগুলি ভোঁতাভাবে বা অনুমানকৃত ওজনের মাধ্যমে পরিসংখ্যানের কোনও পরিসংখ্যানিক কারণ নেই। পরিবর্তে কিছু দূরত্ব ব্যবহার করুন। দূরত্বের সমস্যাটি হ'ল এটি সর্বদা ইতিবাচক: আপনি বলতে পারেন কোনও উত্তরদাতা কতটা কমনীয় তবে তিনি "উপরে" বা "নীচে" থাকলে বলতে পারবেন না। তবে একাধিক বৈশিষ্ট্যের স্থান থেকে একক সূচি দাবি করার জন্য আপনাকে এই মূল্যটি দিতে হবে। আপনি যদি উভয় বিচ্যুতি চান এবং এই জাতীয় জায়গায় সাইন ইন করতে চান তবে আমি বলব যে আপনি খুব প্রখর।

শেষ পয়েন্টে, ওপিতে জিজ্ঞাসা করা হয়েছে যে কেবলমাত্র একটির স্কোর নেওয়া ঠিক হবে, তার বৈকল্পিকতার ক্ষেত্রে সবচেয়ে শক্তিশালী পরিবর্তনশীল - এই সূচকটির 1 ম প্রধান উপাদান - "সূচক" এর জন্য একমাত্র প্রক্সি হিসাবে। এটি যদি পিসি বাকি পিসিগুলির তুলনায় অনেক শক্তিশালী হয় তবে তা বোধগম্য হয় । যদিও কেউ তখন জিজ্ঞাসা করতে পারে "এটি যদি আরও শক্তিশালী হয় তবে কেন আপনি কেবল এটি সরিয়ে / ধরে রাখেননি?"।


0

সময় সিরিজের লিঙ্কগুলি থেকে http://www.cup.ualberta.ca/wp-content/uploads/2013/04/SEICUPWebsite_10April13.pdf- তে পিসিএ ব্যবহার করে যৌগিক সূচক তৈরি করা

পৃষ্ঠার ১৯ পৃষ্ঠায় নিবন্ধে, লেখকগণ প্রতিটি কারণ দ্বারা নির্বাচিত উপাদানগুলির দ্বারা বর্ণিত সামগ্রিক প্রকরণের দ্বারা বর্ণিত ভিন্নতার অনুপাত ব্যবহার করে একটি অ-মানক সূচক (এনএসআই) তৈরির একটি উপায় উল্লেখ করেছেন। এই এনএসআই তখন স্বাভাবিক করা হয়েছিল।


6
১৯ পৃষ্ঠার এই বিভাগটি ঠিক সেই প্রশ্নবিদ্ধ, সমস্যাযুক্ত আপেল এবং কমলা যুক্ত করেছে যা উপরের মন্তব্যে অ্যামিবা এবং আমার বিরুদ্ধে সতর্ক করা হয়েছিল। একটি সূচকে অনিয়ন্ত্রিত ভেরিয়েবলের সংমিশ্রনের কোনও পরিসংখ্যানগত অর্থই কমই রয়েছে ।
ttnphns

1
কখনও কখনও আমরা কনস্ট্রাক্টস / স্কেল / টেস্ট যুক্ত করি যা নিরবিচ্ছিন্ন এবং বিভিন্ন জিনিস পরিমাপ করে। এটি ব্যাটারি সূচক (পরীক্ষাগুলি যেগুলি একেবারে পৃথক / অমীমাংসিত বলে বিবেচিত হয় "ব্যাটারি" বলা হয়)। পূর্ববর্তী মন্তব্যে যেমন বলা হয়েছে, কোনও ব্যাটারি সূচক কিছু স্থানীয় বাস্তববাদী জ্ঞান থাকতে পারে যদিও এটির প্রায় একটি পরিসংখ্যানগত অর্থ নেই ।
ttnphns

এছাড়াও প্রশ্ন দেখতে পাবেন stats.stackexchange.com/q/236786/3277
ttnphns

-১ যা উপরে লেখা হয়েছে তার কারণে।
অ্যামিবা বলেছেন মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.