সংক্ষেপে
উভয় একমুখী MANOVA এবং Lda বিভাগ মোট ছিটান ম্যাট্রিক্স decomposing দিয়ে শুরু মধ্যে ক্লাসের ছিটান ম্যাট্রিক্স মধ্যে ওয়াট মধ্যে ক্লাসের ছিটান ম্যাট্রিক্স বি , যেমন যে টি = ওয়াট + + বি । নোট যে এই সম্পূর্ণরূপে কিভাবে একমুখী ANOVA বিশ্লিষ্ট হয়েছে মোট যোগফল অফ স্কোয়ার অনুরূপ টি মধ্যে ক্লাসের মধ্যে ক্লাসের অঙ্কের-বর্গের মধ্যে: টি = বি + + ডব্লিউ । আনোভাতে একটি অনুপাত বি / ডাব্লু এর পরে গণনা করা হয় এবং পি-মানটি সন্ধান করতে ব্যবহৃত হয়: এই অনুপাতটি যত বড়, পি-মানটি তত কম। মানোভা এবং এলডিএ একটি বহুভুজ পরিমাণ ডাব্লু - 1 রচনা করেটিওয়াটবিটি = ডাব্লু + বিটিটি= বি + ডাব্লুবি / ডাব্লু ।ওয়াট- 1বি
এখান থেকে এগুলি আলাদা। মানোভার একমাত্র উদ্দেশ্য পরীক্ষা করা হ'ল যদি সমস্ত গোষ্ঠীর মাধ্যম একই হয়; এই নাল হাইপোথিসিসের অর্থ হ'ল ডাব্লু এর সাথে একই আকারের হওয়া উচিত । সুতরাং মানোভা ডাব্লু - 1 বি এর একটি ইজেনডিকম্পোজিশন সম্পাদন করে এবং এর ইজেনভ্যালুগুলি খুঁজে পায় λ i । তারা এখন নাল প্রত্যাখ্যান করার জন্য যথেষ্ট বড় কিনা তা পরীক্ষা করে দেখার জন্য। ইগেনভ্যালুগুলির পুরো সেটটির বাইরে একটি স্কেলার পরিসংখ্যান গঠনের চারটি সাধারণ উপায় রয়েছে λ i । একটি উপায় হ'ল সমস্ত ইগেনভ্যালুগুলির যোগফল নেওয়া। আরেকটি উপায় হ'ল সর্বাধিক ইগন্যালু নেওয়া। প্রতিটি ক্ষেত্রে, নির্বাচিত পরিসংখ্যান যদি যথেষ্ট বড় হয় তবে নাল অনুমানটি বাতিল হয়ে যায় isবিওয়াটওয়াট- 1বিλআমিλআমি
বিপরীতে, এলডিএ ইজেনডিকম্পোজেশন সম্পাদন করে এবং ইগেনভেেক্টরগুলিতে (ইগেনভ্যালু নয়) দেখায়। এই আইজেনভেেক্টরগুলি চলক স্থানের দিকনির্দেশকে সংজ্ঞায়িত করে এবং তাদেরকে বৈষম্যমূলক অক্ষ বলে । প্রথম বৈষম্যমূলক অক্ষের উপর ডেটা প্রকাশের ক্ষেত্রে সর্বোচ্চ শ্রেণি বিচ্ছেদ রয়েছে ( বি / ডাব্লু হিসাবে পরিমাপ করা হয় ); দ্বিতীয় একের উপর - দ্বিতীয় সর্বোচ্চ; ইত্যাদি যখন এলডিএটি মাত্রিকতা হ্রাসের জন্য ব্যবহৃত হয়, তখন ডেটা প্রজেক্ট করা যেতে পারে যেমন প্রথম দুটি অক্ষের উপর, এবং বাকীগুলি বাতিল করা হয়।ওয়াট- 1বিবি / ডাব্লু
অন্য একই থ্রেডে অন্য একটি থ্রেডে @ttnphns দ্বারা একটি দুর্দান্ত উত্তরও দেখুন ।
উদাহরণ
আসুন আমরা নির্ভরশীল ভেরিয়েবল এবং কে = 3 টি পর্যবেক্ষণের গ্রুপগুলির (যেমন তিনটি স্তরের একটি ফ্যাক্টর) সাথে একমুখী কেস বিবেচনা করি । আমি সুপরিচিত ফিশারের আইরিস ডেটাসেট নেব এবং কেবল সেপালের দৈর্ঘ্য এবং সেপালের প্রস্থ (এটি দ্বি-মাত্রিক করতে) বিবেচনা করব। এখানে ছড়িয়ে পড়া প্লটটি রয়েছে:এম= 2কে = 3
আমরা পৃথকভাবে sepal দৈর্ঘ্য / প্রস্থ উভয় সঙ্গে ANOVA গণনা দিয়ে শুরু করতে পারেন। এক্স এবং ওয়াই অক্ষের উপর উলম্ব বা অনুভূমিকভাবে উপস্থাপিত ডেটা পয়েন্টগুলি কল্পনা করুন এবং তিনটি গ্রুপের একই উপায়ে রয়েছে কিনা তা পরীক্ষার জন্য 1-দিকের ANOVA সম্পাদিত হয়েছিল। আমরা সিপাল দৈর্ঘ্যের জন্য এবং পি = 10 - 31 এবং সিপাল প্রস্থের জন্য এফ 2 , 147 = 49 এবং পি = 10 - 17 পাই। ঠিক আছে, সুতরাং আমার উদাহরণটি বেশ খারাপ কারণ দুটি উপায়ে হাস্যকর পি-মানগুলির সাথে তিনটি গ্রুপ উল্লেখযোগ্যভাবে পৃথক, তবে আমি যাইহোক এটির সাথে আটকে থাকব।এফ2 , 147= 119পি = 10- 31এফ2 , 147= 49পি = 10- 17
এখন আমরা একটি অক্ষ খুঁজে পেতে এলডিএ সঞ্চালন করতে পারি যা সর্বাধিক তিনটি ক্লাস্টারকে পৃথক করে। উপরে বর্ণিত হিসাবে, আমরা পরিপূর্ণ স্ক্যাটার ম্যাট্রিক্স , শ্রেণিবদ্ধ স্ক্যাটার ম্যাট্রিক্স ডাব্লু এবং শ্রেণির স্ক্যাটার ম্যাট্রিক্স বি = টি - ডাব্লু এর মধ্যে গণনা করব এবং ডাব্লু - 1 বি এর ইগেনভেেক্টর খুঁজে পাই । আমি একই স্ক্যাটারপ্লোতে উভয় ইগেনভেেক্টর প্লট করতে পারি:টিওয়াটবি = টি - ডাব্লুওয়াট- 1বি
ড্যাশযুক্ত লাইনগুলি বৈষম্যমূলক অক্ষ। আমি তাদের নির্বিচারে দৈর্ঘ্যের সাথে চক্রান্ত করেছি, তবে দীর্ঘ অক্ষগুলি ইগেনভেেক্টরকে বৃহত্তর ইগেনভ্যালু (4.1) এবং সংক্ষিপ্ততর --- একটি ছোট ইগেনুয়ালু (0.02) সহ একটি দেখায়। লক্ষ্য করুন যে এগুলি অরথোগোনাল নয়, তবে এলডিএর গণিত গ্যারান্টি দেয় যে এই অক্ষগুলির উপরের অনুমানগুলি শূন্যের সাথে সম্পর্কযুক্ত have
এফ= 305পি = 10- 53পি = 10- 5
ওয়াট- 1বিবি / ডাব্লুএফ= বি / ডাব্লু⋅ ( এন- কে ) / ( কে - 1 ) = 4.1 ⋅ 147 / 2=305এন= 150কে = 3
λ1= 4.1λ2= 0.02পি = 10- 55
এফ( 8 , 4 )
পি = 10- 55পি = 0.26পি = 10- 54। 5পি ≈ 0.05পি
মানোভা বনাম এলডিএ মেশিন লার্নিং বনাম পরিসংখ্যান হিসাবে
এটি এখন বিভিন্ন মেশিন লার্নিং সম্প্রদায় এবং পরিসংখ্যান সম্প্রদায় কীভাবে একই জিনিসটির কাছে পৌঁছায় তার অন্যতম অনুকরণীয় কেস আমার কাছে মনে হয়। মেশিন লার্নিংয়ের প্রতিটি পাঠ্যপুস্তকে এলডিএকে অন্তর্ভুক্ত করা হয়েছে, দুর্দান্ত ছবি ইত্যাদি দেখানো হয়েছে তবে এটি কখনও মানোভা (যেমন বিশপ , হাস্টি এবং মারফি ) এর উল্লেখ করবে না । সম্ভবত কারণ লোকেদের এলডিএ শ্রেণিবদ্ধকরণের নির্ভুলতায় বেশি আগ্রহী (যা প্রায়শই প্রভাবের আকারের সাথে মিলে যায়), এবং গ্রুপ পার্থক্যের পরিসংখ্যানিক তাত্পর্যটিতে কোনও আগ্রহ নেই । অন্যদিকে, মাল্টিভারিয়েট বিশ্লেষণের পাঠ্যপুস্তকগুলি মানোভা অ্যাড বমি বমি ভাব নিয়ে আলোচনা করবে, প্রচুর ট্যাবুলেটেড ডেটা সরবরাহ করবে (অ্যারেগ) তবে খুব কমই এলডিএ এবং এমনকি বিরল উল্লেখ করে কোনও প্লট দেখায় (উদাঃঅ্যান্ডারসন , বা হ্যারিস ; তবে রেনচার ও ক্রিস্টেনসেন এবং হুবার্টি ও ওলেজনিককে এমনকি "মানোভা এবং বৈষম্যমূলক বিশ্লেষণ" বলা হয়)।
কারখানা মানোভা AN
ফ্যাক্টরিয়াল মানোভা অনেক বেশি বিভ্রান্তিকর, তবে এটি বিবেচনা করা আকর্ষণীয় কারণ এটি এলডিএ থেকে পৃথক পৃথক পৃথকভাবে এমন একটি অর্থে যে "ফ্যাক্টরিয়াল এলডিএ" সত্যই বিদ্যমান নেই, এবং ঘটনাকারী মানোভা সরাসরি কোনও "সাধারণ এলডিএ" এর সাথে মিলে যায় না।
3 ⋅ 2 = 6
এই চিত্রটিতে সমস্ত ছয় "কোষ" (আমি তাদের "গ্রুপ" বা "শ্রেণি "ও বলব) ভালভাবে পৃথক করা হয়েছে, যা অবশ্যই বাস্তবে খুব কমই ঘটে। মনে রাখবেন যে এখানে উভয় কারণের গুরুত্বপূর্ণ মুখ্য প্রভাব রয়েছে এবং এটি উল্লেখযোগ্য ইন্টারঅ্যাকশন প্রভাবও রয়েছে (কারণ উপরের-ডান দলটি ডানদিকে স্থানান্তরিত হয়েছে; যদি আমি এটির "গ্রিড" পজিশনে স্থানান্তরিত করি, তবে সেখানে কিছুই থাকবে না) মিথস্ক্রিয়া প্রভাব)।
এই ক্ষেত্রে মানোভা কম্পিউটেশন কীভাবে কাজ করবে?
ওয়াটবিএকজনবিএকজনওয়াট- 1বিএকজন
বিবিবিক খ
টি = বিএকজন+ বিবি+ বিক খ+ ডাব্লু ।
বিতিনটি ফ্যাক্টর অবদানের যোগফলকে অনন্যভাবে পচন করা যায় না কারণ কারণগুলি আর অর্থেগোনাল নয়; এটি আনোভাতে টাইপ I / II / III এসএসের আলোচনার অনুরূপ]]
বিএকজনওয়াটএকজন= টি - বিএকজন
ওয়াট- 1বিএকজন