চিঠিপত্র বিশ্লেষণ বনাম মূল উপাদান বিশ্লেষণ ব্যবহার করে


9

আমি অন্তর্বর্তী সম্প্রদায়ের সম্পর্কিত একটি ডেটা সেট বিশ্লেষণ করছি। চতুষ্কোণগুলিতে ডেটা শতাংশ কভার (সামুদ্রিক শ্যাওলা, বার্নক্লেস, ঝিনুক ইত্যাদি)। প্রজাতির গণনাগুলির ক্ষেত্রে আমি চিঠিপত্র বিশ্লেষণ (সিএ) এবং রৈখিক পরিবেশগত (প্রজাতি নয়) প্রবণতাগুলির জন্য আরও কার্যকর কিছু হিসাবে নীতিগত উপাদান বিশ্লেষণ (পিসিএ) সম্পর্কে ভাবতে অভ্যস্ত। শতভাগ কভারের জন্য যদি পিসিএ বা সিএ আরও ভাল ফিট হয় (তবে কোনও কাগজপত্র খুঁজে পাচ্ছে না), এবং আমার ভাগ্য নির্ধারণ করার সত্যিই আমি ভাগ্য পাইনি এবং আমি নিশ্চিতও নই যে 100% পর্যন্ত কেপযুক্ত কিছু কীভাবে বিতরণ করা হবে? ?

আমি মোটামুটি গাইডলাইনটির সাথে পরিচিত যে যদি প্রথম অবক্ষয়যুক্ত চিঠিপত্র বিশ্লেষণের (ডিসিএ) অক্ষের দৈর্ঘ্য 2 এর চেয়ে বেশি হয়, তবে আপনি নিরাপদে ধরে নিতে পারেন যে সিএ ব্যবহার করা উচিত। ডিসিএ অক্ষ 1 এর দৈর্ঘ্য ছিল 2.17, যা আমি সহায়ক মনে করি না।


3
পিসিএ এবং সিএ উভয়ই সম্পর্কিত এবং উভয়ই এসভিডি অ্যালগরিদমের ভিত্তিতে তৈরি হতে পারে। মৌলিক আনুষ্ঠানিক পার্থক্য (@ গ্যাভিনের অন্যথায় গভীর উত্তরে উল্লেখ নেই) হ'ল পিসিএ কেবলমাত্র কলামগুলির মধ্যে সম্পর্কগুলি পচিয়ে দেয় (উদাহরণস্বরূপ তাদের কোভেরিয়েন্স ম্যাট্রিক্সকে ক্ষয় করে), সারিগুলিকে "কেস" হিসাবে বিবেচনা করে; ক্র্যাশ-ট্যাবুলেশন "বিভাগ" হিসাবে সিএ এক সাথে কলাম এবং সারিগুলিকে এক সাথে সংশ্লেষ করে সুতরাং পিসিএর পরে প্লট করা যেতে পারে সিএ এবং কোয়াসি-বিপ্লট (লোডিং + স্কোর) বাম বাইপ্লট ধারণাটি বেশ আলাদা তথ্য দেয়।
ttnphns

উত্তর:


9

পিসিএ সেই মানগুলিতে কাজ করে যেখানে সিএ হিসাবে আপেক্ষিক মানগুলিতে কাজ করে। আপনি যে ধরণের উল্লেখ করেছেন তার আপেক্ষিক প্রাচুর্যের ডেটা উভয়ই ভাল (একটি প্রধান সাবধানতার সাথে, পরে দেখুন)। % ডেটা সহ আপনার ইতিমধ্যে একটি আপেক্ষিক পরিমাপ রয়েছে তবে এখনও তফাত থাকবে। নিজেকে জিজ্ঞাসা করুন

  • আপনি কি প্রচুর প্রজাতি / ট্যাক্সায় (যেমন বড়% কভার সহ একটি) বা প্যাটার্নটিতে জোর দিতে চান?
  • আপনি কি আপেক্ষিক রচনার ধরণগুলিতে মনোনিবেশ করতে চান?

প্রাক্তন হলে, পিসিএ ব্যবহার করুন। পরে যদি সিএ ব্যবহার করে। দুটি প্রশ্নের দ্বারা আমি যা বোঝাতে চাইছি তা আপনি চাইবেন

A = {50, 20, 10}
B = { 5,  2,  1}

আলাদা বা একই বিবেচনা করা? Aএবং Bদুটি নমুনা এবং মানগুলি তিনটি করের% কভার দেখানো হয়। (এই উদাহরণটি খুব খারাপভাবে রূপান্তরিত হয়েছে, ধরে নিন যে খালি স্থল রয়েছে!

এখানে বড় ক্যাভিয়েট হ'ল ডেটার বদ্ধ গঠনমূলক প্রকৃতি। যদি আপনার কয়েকটি গোষ্ঠী থাকে (উদাহরণস্বরূপ বালু, পলি, কাদামাটি) যার সমষ্টি 1 (100%) হয় তবে উভয়ই সঠিক নয় এবং আপনি আইচিসনের লগ-রেশিও পিসিএর মাধ্যমে আরও উপযুক্ত বিশ্লেষণে যেতে পারেন যা বন্ধ রচনাটির জন্য ডিজাইন করা হয়েছিল ডেটা। (আইআইআরসি এটি করার জন্য আপনাকে সারি এবং কলামগুলি কেন্দ্র করে লগ এবং ডেটা ট্রান্সফর্ম করতে হবে)) অন্যান্য পন্থাগুলিও রয়েছে। আপনি যদি আর ব্যবহার করেন, তবে একটি বই যা কার্যকর হবে তা হ'ল আর এর সাথে কম্পোজিশনাল ডেটা বিশ্লেষণ


সর্বদা হিসাবে, একটি সত্যিই চমৎকার উত্তর গ্যাভিন। ধন্যবাদ! এটি বিষয়গুলিকে অনেক স্পষ্ট করে এবং আমি তখন পিসিএ ব্যবহার করব। আন্তঃদেশীয় সম্প্রদায়টি ত্রি-মাত্রিক, প্রদত্ত জীবগুলি একে অপরের উপরে বেড়ে ওঠার পরে কিছু ক্ষেত্রে বাস্তবে শতকরা 100% ছিল। আপনি যে কথাটি বলছেন এটি বন্ধ হওয়া রচনাগত রূপ নয়, তাই না?
এইচএফব্রাউনিং

না এটি সে কথা বলছে না। বন্ধ করে আমি বিশ্বাস করি যে তিনি এমন একটি সিস্টেম যার মধ্যে তিনটি প্রজাতি এ, বি, সি রয়েছে, আপনার কাছে% সি = 100% -% বি -% এ
পেরিটিনা

এবং ডিসিএ সম্পর্কে কি?
ডারউইন পিসি

ডিসিএ হ'ল সিএ-র একটি মেসড আপ সংস্করণ তাই একই সাধারণ নীতিগুলি এতে প্রয়োগ হয়। ডিসিএ ডেটা নিয়ে কিছু অদ্ভুত অত্যাচার করছে এবং আমি মনে করি না যে আমাদের আজ আমাদের টুলবক্সে একটি পদ্ধতি হিসাবে এটি নিয়ে মাথা ঘামানোর দরকার আছে, তবে অন্যের মতামত সে বিষয়ে আলাদা হবে।
গ্যাভিন সিম্পসন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.