তদারক মাত্রিকতা হ্রাস


13

আমার কাছে 15 কে লেবেলযুক্ত নমুনা (10 টি গোষ্ঠী) নিয়ে একটি ডেটা সেট রয়েছে। আমি মাত্রিকতা হ্রাস 2 টি মাত্রায় প্রয়োগ করতে চাই, এটি লেবেলের জ্ঞানের বিবেচনায় নেবে।

আমি যখন পিসিএর মতো "স্ট্যান্ডার্ড" অব্যবহৃত ত্রিমাত্রিকতা হ্রাস কৌশলগুলি ব্যবহার করি, তখন স্ক্যাটার প্লটটির পরিচিত লেবেলের সাথে কোনও সম্পর্ক নেই বলে মনে হয়।

আমি যা খুঁজছি তার একটি নাম আছে? আমি সমাধানের কিছু উল্লেখ পড়তে চাই।


3
আপনি যদি লিনিয়ার পদ্ধতিগুলি সন্ধান করছেন, তবে লিনিয়ার ডিস্টিফর্যান্ট এনালাইসিস (এলডিএ) আপনাকে ব্যবহার করা উচিত।
অ্যামিবা বলেছেন

@ আমেবা: ধন্যবাদ আমি এটি ব্যবহার করেছি এবং এটি আরও ভাল অভিনয় করেছে!
রায়

খুশি যে এটি সাহায্য করেছিল। আমি আরও কিছু রেফারেন্স সহ একটি সংক্ষিপ্ত উত্তর সরবরাহ করেছি।
অ্যামিবা

1
প্রথম সম্ভাবনাটি হ'ল প্রথমে শ্রেণি সেন্ট্রয়েডগুলিকে বিস্তৃত নয়-মাত্রিক স্থানকে হ্রাস করা এবং তারপরে পিসিএ ব্যবহার করে আরও দুটি মাত্রায় কমাতে হবে।
এ ডন্ডা

সম্পর্কিত: stats.stackexchange.com / জিজ্ঞাসা / 16305 (সম্ভবত নকল, যদিও অন্যভাবে রাউন্ড। আমি নীচে আমার উত্তর আপডেট করার পরে আমি এই ফিরে আসতে হবে।)
অ্যামিবা বলছেন পুনরায় ইনস্টল মনিকা

উত্তর:


27

তত্ত্বাবধানের মাত্রিকতা হ্রাসের সবচেয়ে স্ট্যান্ডার্ড লিনিয়ার পদ্ধতিটিকে লিনিয়ার বৈষম্যমূলক বিশ্লেষণ (এলডিএ) বলা হয়। এটি নিম্ন-মাত্রিক প্রক্ষেপণ সন্ধানের জন্য ডিজাইন করা হয়েছে যা শ্রেণি বিচ্ছেদকে সর্বাধিক করে তোলে। আপনি আমাদের ট্যাগের অধীনে এবং যেকোন মেশিন লার্নিং পাঠ্যপুস্তকে যেমন নিখরচায়ভাবে পরিসংখ্যানগত শিক্ষার উপাদানসমূহ অবলম্বন করতে পারেন সে সম্পর্কে আপনি প্রচুর তথ্য পেতে পারেন ।

এখানে একটি ছবি যা আমি এখানে দ্রুত গুগল অনুসন্ধানের সাথে পেয়েছি ; এটি যখন ডেটাসেটে দুটি শ্রেণি রয়েছে (উত্সাহ আমার দ্বারা যুক্ত করা হয়েছে) তখন এটি একটি মাত্রিক পিসিএ এবং এলডিএ অনুমান দেখায়:

পিসিএ বনাম এলডিএ

আর একটি পদ্ধতির নাম আংশিক সর্বনিম্ন স্কোয়ার (পিএলএস)। ডামি ভেরিয়েবল এনকোডিং গ্রুপ লেবেলের সাথে সর্বাধিক পারস্পরিক সম্পর্ক থাকার প্রক্ষেপণের সন্ধানের জন্য এলডিএকে ব্যাখ্যা করা যেতে পারে (এই অর্থে এলডিএকে ক্যানোনিকাল পারস্পরিক সম্পর্ক বিশ্লেষণের একটি বিশেষ ক্ষেত্রে হিসাবে দেখা যেতে পারে)। বিপরীতে, পিএলএস গ্রুপ লেবেলের সাথে সর্বাধিক সমবায় থাকার অনুমানগুলির সন্ধান করে। যেখানে এলডিএ কেবলমাত্র দুটি গ্রুপের ক্ষেত্রে 1 অক্ষ উত্পন্ন করে (উপরের চিত্রের মতো), পিএলএস হ্রাসমান কোভেরিয়েন্সের দ্বারা অর্ডারযুক্ত অনেকগুলি অক্ষ খুঁজে পাবে। মনে রাখবেন যে ডেটাসেটে যখন দুটিরও বেশি গোষ্ঠী উপস্থিত রয়েছে, তখন পিএলএসের বিভিন্ন "স্বাদ" রয়েছে যা কিছুটা আলাদা ফলাফল আনবে।

আপডেট (2018)

এই উত্তরটি প্রসারিত করার জন্য আমার সময় পাওয়া উচিত; এই থ্রেডটি জনপ্রিয় বলে মনে হচ্ছে তবে উপরে আমার মূল উত্তরটি খুব সংক্ষিপ্ত এবং যথেষ্ট বিশদ নয়।

এর মধ্যে আমি নেবুরহুড উপাদান বিশ্লেষণ উল্লেখ করব - একটি লিনিয়ার পদ্ধতি যা প্রজেকশনকে সর্বাধিক করে -নিকটস্থ-প্রতিবেশীদের শ্রেণিবদ্ধকরণের নির্ভুলতা খুঁজে পায় । নিউরাল নেটওয়ার্কগুলি ব্যবহার করে একটি অনৈখিক জেনারালাইজেশন রয়েছে, ক্লাস নেবারহুড স্ট্রাকচার সংরক্ষণ করে একটি ননলাইনার এম্বেডিং শেখা দেখুন । কেউ বাটলনেকের সাথে নিউরাল নেটওয়ার্ক শ্রেণিবদ্ধও ব্যবহার করতে পারেন, তদারকি করা মাত্রা হ্রাসে ডিপ বোতলেনেক ক্লাসিফায়ারগুলি দেখুন ।k


1
সুন্দর গ্রাফিক, অনেক কিছু ব্যাখ্যা করে
টাইটু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.