আপনি শ্রেণিবিন্যাসে এলডিএর পরিবর্তে পিসিএ কখন ব্যবহার করবেন?


10

আমি এই নিবন্ধটি মূল উপাদান উপাদান বিশ্লেষণ এবং একাধিক বৈষম্য বিশ্লেষণ (লিনিয়ার বৈষম্য বিশ্লেষণ) এর মধ্যে পার্থক্য নিয়ে পড়ছি এবং আমি কেন এমডিএ / এলডিএর চেয়ে পিসিএ ব্যবহার করবে তা বোঝার চেষ্টা করছি।

ব্যাখ্যাটির সংক্ষিপ্তসার নিম্নরূপ:

মোটামুটি পিসিএ ভাষায় আমরা সর্বোচ্চ বৈকল্পের অক্ষগুলি সন্ধান করার চেষ্টা করছি যেখানে ডেটা সর্বাধিক ছড়িয়ে পড়ে (একটি শ্রেণীর মধ্যে, যেহেতু পিসিএ পুরো ডেটা সেটটিকে একটি শ্রেণি হিসাবে বিবেচনা করে) এবং এমডিএতে আমরা অতিরিক্তভাবে ক্লাসের মধ্যে ছড়িয়ে পড়া সর্বাধিকতর করে চলেছি।

আপনি কি সর্বদা উভয়ই বৈষম্যকে সর্বাধিকতর করতে এবং ক্লাসগুলির মধ্যে ছড়িয়ে পড়া সর্বাধিক করতে চান না?


1
দুঃখিত, আমি একাধিক বৈষম্যমূলক বিশ্লেষণ বোঝাতে চাইছি বলে মনে হয় যে এটি একাধিক লিনিয়ার বৈষম্যমূলক বিশ্লেষণও বলা হয়
chris

1
আপনার আপনার প্রশ্নটি স্পষ্ট করা উচিত, কারণ এখন পর্যন্ত এটি নগণ্য: আপনার ডেটাতে কোনও শ্রেণিবিভক্ত হওয়ার জন্য কোনও ক্লাস না থাকলে এমডিএর চেয়ে আপনার পিসিএ পছন্দ করা উচিত। আমি মনে করি আপনার এটি নির্দিষ্ট করা উচিত প্রশ্নে শ্রেণিবিন্যাস সম্পর্কে।
ফায়ারব্যাগ

1
এমডিএর তুলনায় এলডিএ অনেক বেশি সাধারণ শব্দ। "একাধিক রৈখিক" বলার দরকার নেই, "লিনিয়ার" যথেষ্ট।
অ্যামিবা

উত্তর:


11

আপনি আরও গভীর কিছু অনুপস্থিত: পিসিএ কোনও শ্রেণিবদ্ধকরণ পদ্ধতি নয়।

মেশিন লার্নিংয়ে পিসিএ বৈশিষ্ট্য ইঞ্জিনিয়ারিং পদ্ধতি হিসাবে বিবেচিত হয়। আপনি যখন আপনার ডেটাতে পিসিএ প্রয়োগ করেন আপনি গ্যারান্টি দিচ্ছেন ফলাফল বৈশিষ্ট্যগুলির মধ্যে কোনও সম্পর্ক নেই corre অনেক শ্রেণিবিন্যাস অ্যালগরিদম এতে উপকার করে।

আপনার সবসময় মাথায় রাখতে হবে আলগোরিদিমগুলির ডেটাতে অনুমানগুলি থাকতে পারে এবং যদি এই ধরণের অনুমানগুলি ধরে না রাখে তবে তারা সম্ভবত দক্ষতা অর্জন করবে না।

এলডিএ অবশ্যই ডেটা প্রজেক্ট করার জন্য একটি কোভরিয়েন্স ম্যাট্রিক্স ইনভার্সন গণনা করতে হবে (এই থ্রেড এবং উত্তরগুলি পরীক্ষা করুন: আমার শ্রেণিবদ্ধকরণের আগে পিসিএ করা উচিত? এবং পিসিএ এবং এলডিএকে একত্রিত করার অর্থ কি বোঝায়? )। আপনার যদি কয়েকটি ডেটা থাকে, তবে এটি অস্থির এবং আপনার ডেটা পয়েন্টগুলির পক্ষে উত্সাহিত প্রजेসেশনগুলি পাওয়া যায়, অর্থাত্ শ্রেণির কোভেরিয়েন্স ম্যাট্রিক্সের মধ্যে একটি একক। পিসিএ সাধারণত এটি এড়াতে ব্যবহৃত হয়, সমস্যার মাত্রিকতা হ্রাস করে।

সুতরাং উত্তরটি হ'ল আপনি কখনও শ্রেণিবদ্ধকরণের জন্য পিসিএ ব্যবহার করেন না, তবে আপনি এলডিএর কার্যকারিতা উন্নত করার চেষ্টা করতে এটি ব্যবহার করতে পারেন।


7

ফায়ারব্যাগের পূর্ববর্তী উত্তরগুলি যেখানে সঠিক, আমি অন্য দৃষ্টিকোণটি যুক্ত করতে চাই:

নিরীক্ষণ করা বনাম বনাম তদারকি করা শেখা:

এলডিএ হ'ল মাত্রাগুলি খুঁজে বের করতে খুব কার্যকর যা ক্লাস্টারকে আলাদা করার লক্ষ্য করে, সুতরাং আপনাকে আগে ক্লাস্টারগুলি জানতে হবে। এলডিএ প্রয়োজনীয়ভাবে শ্রেণিবদ্ধ নয়, তবে এটি হিসাবে ব্যবহৃত হতে পারে। সুতরাং এলডিএ কেবল তত্ত্বাবধানে শিক্ষায় ব্যবহৃত হতে পারে

পিসিএ হ'ল নিন্দনমাত্রিকতা হ্রাস করার জন্য একটি সাধারণ পদ্ধতির এবং তদারকি শিক্ষায় শ্রেণিবদ্ধ লেবেলের মতো আরও কোনও তথ্যের প্রয়োজন হয় না। অতএব এটি নিরীক্ষণযোগ্য শেখার ক্ষেত্রে ব্যবহার করা যেতে পারে।


2
+1 টি, বিশেষ করে এর জন্য LDA is not neccesarily a classifier। একটি পাঠককে (ওপিও) এই সম্পর্কিত প্রশ্নটি পড়ার জন্যও সুপারিশ করা হয়: এলডিএ, একটি শ্রেণিবদ্ধকরণ কৌশল কীভাবে পিসিএর মতো মাত্রিকতা হ্রাস কৌশল হিসাবে কাজ করে
ttnphns

এবং উত্তরগুলি এখানে আউটপুট এবং এলডিএ এবং পিসিএর প্লটগুলিকে ম্লান হিসাবে তুলনা করে। হ্রাস।
ttnphns

(+1) এলডিএ আসলেই একটি মাত্রা হ্রাস কৌশল, ফিশারের লিনিয়ার বৈষম্যের একটি সাধারণীকরণ, যা লোকেরা সাধারণত শ্রেণিবিন্যাসের মানদণ্ড হিসাবে বিবেচনা করে।
ফায়ারব্যাগ

2

এলডিএ বহুমাত্রিক স্থান তৈরিতে ব্যবহৃত হয়।

পিসিএ বহুমাত্রিক স্থান ধসের জন্য ব্যবহৃত হয়।

উদাহরণস্বরূপ: 3 ডি অবজেক্ট 2D শ্যাডো কাস্ট করে। পিসিএ প্রায়শই আমাদের শত শত স্থানিক মাত্রাকে মুষ্টিমেয় নিম্ন স্থানিক মাত্রার এক মুঠোয় ছড়িয়ে দিতে দেয় যখন 70% থেকে 90% গুরুত্বপূর্ণ তথ্য সংরক্ষণ করে।

এর ছায়া থেকে আমি কীভাবে আপনার হাতের আকার এবং আকারটি দেখতে পাচ্ছি। আমি আপনার হাতের আকৃতি সম্পর্কে সবকিছু বলতে পারি না। তবে অনুকূল পরিচিত কোণগুলি থেকে 3 বা 4 ছায়ার আ আ সংগ্রহ করে। তারপরে আমি আপনাকে হাতের আকার এবং আকার সম্পর্কে বেশিরভাগ জিনিস বলতে পারি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.