ডেটা হ্রাসের জন্য আমি বারবার ব্যবস্থা করতে পিসিএ করতে পারি?


13

2 টি প্রসঙ্গে প্রতিটি 87 টি প্রাণীর উপর আমার 3 টি ট্রায়াল রয়েছে (কিছু অনুপস্থিত ডেটা; অনুপস্থিত ডেটা নেই = 64 প্রাণী)। একটি প্রেক্ষাপটে মধ্যে, আমি অনেক নির্দিষ্ট পরিমাপ করে (সময় প্রবেশ করতে, আশ্রয় ফিরে যতবার, ইত্যাদি) তাই আমি (তাদের কল 2 থেকে 3 যৌগিক আচরণ স্কোর যে প্রেক্ষাপটে আচরণ বর্ণনা বিকাশ করতে চান, C1, C2, C3)। আমি C1তিনটি ট্রায়াল এবং ৮ 87 টি প্রাণীর মধ্যে একই জিনিসটির অর্থ চাই , যাতে আমি বয়স, লিঙ্গ, বংশ ও আচরণের উপর পৃথক প্রাণীর প্রভাব পরীক্ষা করতে একটি রিগ্রেশন করতে পারি। তারপরে আমি পরীক্ষা করতে চাই C1যে নির্দিষ্ট বয়সের মধ্যে অন্যান্য প্রসঙ্গে আচরণের স্কোরগুলির সাথে কীভাবে সম্পর্কিত। (1 বছর বয়সে, প্রসঙ্গে 1 এর ক্রিয়াকলাপ 2 এর প্রসঙ্গে কীভাবে দৃ pred়তার পূর্বাভাস দেয়?)

যদি এর পুনরাবৃত্তি ব্যবস্থা না করা হয়, একটি পিসিএ ভালভাবে কাজ করবে - একটি প্রসঙ্গে একাধিক পদক্ষেপের জন্য একটি পিসিএ করুন, তারপরে পিসি 1 এবং পিসি 1 (বা 2 বা 2 বা পিসি 1) এর মধ্যে সম্পর্ক (স্পিয়ারম্যান পারস্পরিক সম্পর্ক) পরীক্ষা করতে পিসি 1, পিসি 2 ইত্যাদি ব্যবহার করুন 3) অন্যান্য প্রসঙ্গে। সমস্যা হ'ল পুনরাবৃত্তি ব্যবস্থা, যা সিউডোরপ্লিকেশনে পড়ে। আমার কাছে একটি পর্যালোচক স্পষ্টভাবে নো গো-এ গিয়ে বলেছিলেন, তবে ডেটা হ্রাস করার সময় এটি সমস্যাযুক্ত কিনা তা নিয়ে আমি কোনও পরিষ্কার রেফারেন্স পাই না।

আমার যুক্তি ভালো যায়: পুনরাবৃত্তি পদক্ষেপ, একটা সমস্যা হয় না কারণ আমি পিসিএ মধ্যে করছি বিশুদ্ধরূপে হয় বর্ণনামূলক সামনাসামনি মূল পরিমাপ করে। যদি আমি ফিয়াট দ্বারা ঘোষণা করেছিলাম যে আমি 1 এর প্রসঙ্গে 1 "সাহসী" পদক্ষেপ হিসাবে আখড়াতে প্রবেশের জন্য সময়টি ব্যবহার করছি, তবে আমার কাছে একটি প্রসঙ্গ 1 সাহসিকতার পরিমাপ হবে যা সমস্ত বয়সে সমস্ত ব্যক্তির মধ্যে তুলনীয় ছিল এবং কেউই চোখে পড়বে না। যদি আমি ফিয়াট দ্বারা ঘোষণা করি যে আমি টাইম-টু- এন্ট্রি + \ 0.5 \ সিডট টাইম-টু-এন্ড-এন্ড ব্যবহার করব, তবে একই রকম হয়। সুতরাং যদি আমি reductive উদ্দেশ্যে বিশুদ্ধরূপে পিসিএ ব্যবহার করছি, কেন এটা হতে পারে না PC1 (যে হতে পারে 0.28 \ cdot লিখুন + + \ 0.63 \ cdot ফিনিস + + \ 0.02 \ cdot+ 0.5 0.28 + 0.63 + 0.02 0.5+ 0.50.28+ 0.63+ 0.02 মোট সময় ...), যা প্রবেশের সময়টি অনুমান করার পরিবর্তে আমার একাধিক পদক্ষেপের দ্বারা কমপক্ষে অবহিত হওয়া একটি সাধারণ তথ্যমূলক এবং প্রতিনিধি বৈশিষ্ট্য?

(উল্লেখ্য আমি না ব্যবস্থা অন্তর্নিহিত কাঠামো আগ্রহী ... আমার প্রশ্ন আমরা কি ব্যাখ্যা প্রসঙ্গে-নির্দিষ্ট আচরণ হতে হয়। "যদি আমি প্রসঙ্গ 1 ব্যবহার করা হয় এবং এই সিদ্ধান্তে আসেন যে হ্যারি অন্যান্য পশুদের তুলনায় সক্রিয় থাকার সময় আমি দেখতে কি হ্যারি প্রসঙ্গ 2 এ সক্রিয়? তিনি বড় হওয়ার সাথে সাথে 1 এর প্রসঙ্গে আমরা ক্রিয়াকলাপ হিসাবে যেটিকে ব্যাখ্যা করি সেটি যদি তিনি পরিবর্তন করেন তবে তিনিও কি তার প্রসঙ্গে 2 ক্রিয়াকলাপ পরিবর্তন করেন?)

আমি পারফ্যাকের দিকে নজর রেখেছি এবং এসইএম-এর দিকে নজর রেখেছি, এবং আমি নিশ্চিত নই যে এই পদ্ধতির কোনওটিই আমার নমুনা আকারের জন্য ভাল বা বেশি উপযুক্ত। কেউ কি ওজন করতে পারেন? ধন্যবাদ।


আমি কী বুঝতে পেরেছি যে আপনার 2 বিষয়-বিষয়গুলির মধ্যে রয়েছে: 1) প্রসঙ্গ, যা কিছু পরীক্ষামূলক শর্ত দ্বারা পৃথক হয় (উদাহরণস্বরূপ অভ্যন্তরীণ পরীক্ষা বনাম বহিরঙ্গন পরীক্ষা), 2) ট্রায়াল, যা কেবল একটি পুনরাবৃত্তি, একটি প্রচেষ্টা, পরীক্ষার। এবং আপনি প্রতিটি শর্তে একটি পিসিএ করতে চান, তবে এটি আপনাকে থামিয়ে দেয় যে আপনি একটি না করে পরীক্ষার কয়েকটি পরীক্ষা করেছেন।
ttnphns

দুটি প্রসঙ্গে দুটি পৃথক পরীক্ষা এবং প্রতিটিটিতে নেওয়া ব্যবস্থাগুলি পৃথক different বলেছিল, হ্যাঁ, আপনি আমার পরিস্থিতি বুঝতে পারেন।
লায়ান

তিনটি ট্রায়াল জুড়ে সমস্যার পাশ দিয়ে যাওয়া এবং পিসিএ চালানোর বিষয়ে কী?
গালা

উত্তর:


7

আপনি একাধিক ফ্যাক্টর বিশ্লেষণ সন্ধান করতে পারেন । এটি আর ফেসবুকেআরআরআর প্রয়োগ করা যেতে পারে।

হালনাগাদ:

বিস্তারিতভাবে বলার জন্য, লেয়ান প্রস্তাব দিচ্ছিল - তবে বহু আগে - বারবার ব্যবস্থা নিয়ে একটি ডেটাসেটে পিসিএ করার জন্য। যদি আমি তার ডেটাসেটের কাঠামোটি সঠিকভাবে বুঝতে পারি তবে প্রদত্ত 'প্রসঙ্গের' জন্য তার একটি প্রাণী x'নির্দিষ্ট মাপকাঠি' (প্রবেশের সময়, আশ্রয়ে ফিরে আসার সংখ্যা ইত্যাদি) ছিল ম্যাট্রিক্স mat Animals৪ টি প্রাণীর প্রত্যেককে (যারা নিখরচায় মিস করেনি) তাদের তিনবার অনুসরণ করা হয়েছিল। ধরুন সে 10 'নির্দিষ্ট পরিমাপ করে' ছিল যাক, তাই সে তখন পশুদের আচরণ তিনটি 64 × 10 ম্যাট্রিক্স হবে (আমরা ম্যাট্রিক্স কল করতে পারেন X1, X2, X3)। এক সাথে তিনটি ম্যাট্রিকের জন্য একটি পিসিএ চালাতে, তাকে তিনটি ম্যাট্রিককে 'রো আবদ্ধ' করতে হবে (উদাঃPCA(rbind(X1,X2,X3)))। তবে এটি প্রথম এবং th৪ তম পর্যবেক্ষণ একই প্রাণীর উপরে রয়েছে তা উপেক্ষা করে। এই সমস্যাটি থেকে বাঁচতে, তিনি তিনটি ম্যাট্রিককে 'কলামটি বাঁধতে' এবং একাধিক ফ্যাক্টর বিশ্লেষণের মাধ্যমে এগুলি চালাতে পারেন। এমএফএ হ'ল একই সময়ে ব্যক্তি বা বস্তুগুলিতে বিভিন্ন পয়েন্টে একাধিক সেট ভেরিয়েবল বিশ্লেষণের একটি দরকারী উপায়। তিনি এমফএ থেকে নীতিগত উপাদানগুলি পিসিএর মতোই বের করতে সক্ষম হবেন তবে প্রতিটি প্রাণীর জন্য একটি একক স্থানাঙ্ক থাকবে। তার তিনটি পর্যবেক্ষণ দ্বারা প্রাণীজ সামগ্রীগুলি আপস-বিহীন সমঝোতার স্থানে স্থাপন করা হবে।

তিনি আর-তে ফ্যাকটোমাইনআর প্যাকেজ ব্যবহার করে বিশ্লেষণ সম্পাদন করতে সক্ষম হবেন উদাহরণ কোডটি দেখতে এরকম কিছু দেখতে পাবে:

df=data.frame(X1, X2, X3)
mfa1=MFA(df, group=c(10, 10, 10), type=c("s", "s", "s"), 
 name.group=c("Observation 1", "Observation 2", "Observation 3")) 
 #presuming the data is quantitative and needs to be scaled to unit variance

এছাড়াও, এমএফএ থেকে প্রথম তিনটি উপাদান বের করার এবং সেগুলি একাধিক নিপীড়নের মধ্য দিয়ে রাখার পরিবর্তে তিনি তার ব্যাখ্যামূলক পরিবর্তনশীলগুলি সরাসরি এমপিএ-তে 'পরিপূরক সারণী' হিসাবে দেখানোর বিষয়ে ভাবতে পারেন (দেখুন ?FactoMineR)। আর একটি পদ্ধতি হ'ল এমএফএ (উদাহরণস্বরূপ dist1=vegdist(mfa1$ind$coord, "euc")) থেকে বস্তুর স্থানাঙ্কের ইউক্যালিডিয়ান দূরত্বের ম্যাট্রিক্স গণনা করা এবং এটি dist1প্রাণী নির্দিষ্ট নির্দিষ্ট ভেরিয়েবলের (যেমন rda(dist1~age+sex+pedigree)ভেজান প্যাকেজ ব্যবহার করে) একটি ফাংশন হিসাবে আরডিএর মাধ্যমে রাখে ।


2
হাই কাইল, আপনার উত্তরের জন্য ধন্যবাদ যাইহোক, যে উত্তরগুলি মূলত কোনও লিঙ্কের তুলনায় সামান্য বেশি থাকে, বা যেগুলি দৈর্ঘ্যের একটি বাক্য সম্পর্কে সাধারণত সাধারণত উত্তর হিসাবে বিবেচিত হয় না, তবে মন্তব্যগুলি। বিশেষত, লিঙ্ক-কেবল উত্তরগুলি লিংক-পচে ক্ষতিগ্রস্থ হয়, সুতরাং লিঙ্কটি আর কাজ না করে এমনকি উত্তরের জন্য দরকারী যথেষ্ট তথ্য থাকতে হবে। আপনি কি দয়া করে আপনার উত্তরটি আরও কিছুটা প্রসারিত করতে পারেন, সম্ভবত এটি কীসের একটি খুব সংক্ষিপ্ত রূপরেখা দিচ্ছেন / এটি আরও সাধারণভাবে ফ্যাক্টর বিশ্লেষণের সাথে কীভাবে সম্পর্কিত?
গ্লেন_বি -রিনস্টেট মনিকা

(+1) আমি বুঝতে পারি এটি একটি পুরানো পোস্ট, তবে এই উত্তরটি খুব কার্যকর! লিঙ্কটি মারা যাওয়ার ক্ষেত্রে রেফারেন্সটি সম্পূর্ণ যুক্ত করা উচিত: আব্বি হারভে, উইলিয়ামস লিন জে, ভ্যালেন্টিন ডোমিনিক। একাধিক ফ্যাক্টর বিশ্লেষণ: বহুগুণযোগ্য এবং মাল্টব্লক ডেটা সেটগুলির জন্য মূল উপাদান বিশ্লেষণ। তারের কমপ স্ট্যাটাস 2013, 5: 149-179। doi: 10.1002 / wics.1246
ফ্রান্সস

4

বারবার ব্যবস্থাগুলি বিশ্লেষণ করার সময় পিসিএ ব্যবহার করা সাধারণ বিষয় (উদাহরণস্বরূপ, এটি বিক্রয় ডেটা, স্টক মূল্য এবং বিনিময় হার বিশ্লেষণের জন্য ব্যবহৃত হয়) যুক্তিটি আপনি যেমন লেখেন ঠিক তেমনই (যেমন, ন্যায়সঙ্গততাটি হ'ল পিসিএ একটি ডেটা হ্রাস সরঞ্জাম একটি অনুমানমূলক সরঞ্জাম নয় )।

বেশ ভাল পরিসংখ্যানবিদ দ্বারা প্রকাশিত একটি হ'ল: ব্র্যাডলো, ইটি (2002)। " অধ্যক্ষ উপাদান বিশ্লেষণগুলি ব্যবহার করে মূল বৈশিষ্ট্যগুলির জন্য পুনরাবৃত্তি ব্যবস্থা ডেটা সেটগুলি অন্বেষণ করা " "বিপণনের গবেষণা জার্নাল 19: 167-179।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.