পিসিএ একটি মেশিন লার্নিং অ্যালগরিদম হিসাবে বিবেচনা করা হয়?


10

আমি বুঝতে পেরেছি যে মূল উপাদান বিশ্লেষণটি একটি মাত্রিক হ্রাস কৌশল ie

এটি PCAনিজেই একটি শেখার অ্যালগরিদম হিসাবে বিবেচিত হয় বা এটি ডেটা প্রাক প্রক্রিয়াকরণ পদক্ষেপ।

উত্তর:


9

কারও পক্ষে এটি নিরীক্ষণযোগ্য কৌশল হিসাবে লেবেল করা অস্বাভাবিক নয়। আপনি ইগেনভেেক্টরগুলির উপর কিছু বিশ্লেষণ করতে পারেন এবং এটি ডেটার আচরণের ব্যাখ্যা করতে সহায়তা করে। স্বাভাবিকভাবে যদি আপনার রূপান্তরটির এখনও অনেকগুলি বৈশিষ্ট্য থাকে তবে এই প্রক্রিয়াটি বেশ শক্ত হতে পারে। তবুও এটি সম্ভব এইভাবে আমি এটি মেশিন লার্নিং বিবেচনা করি।

সম্পাদনা:

যেহেতু আমার উত্তরটি নির্বাচিত হয়েছিল (কেন জানি না) আমি আরও বুঝতে পেরেছি যে আমি আরও বিশদ যুক্ত করব।

পিসিএ দুটি কাজ করে যা সমতুল্য। প্রথমত, এবং যা সাধারণত উল্লেখ করা হয়, এটি বৈকল্পিকগুলি সর্বাধিক করে তোলে। দ্বিতীয়ত, এটি জোড়-সংযুক্ত দূরত্ব দেখে পুনর্গঠন ত্রুটি হ্রাস করে।

ইগেনভেেক্টর এবং ইগেনভ্যালুগুলি দেখে, কোন ভেরিয়েবল এবং বৈশিষ্ট্যগুলি বৈকল্পিকতায় অবদান রাখছে এবং কীভাবে বিভিন্ন ভেরিয়েবলগুলি অন্যের সাথে মিলিত হয় তা নির্ধারণ করা বরং সহজ হয়ে যায়।

শেষ পর্যন্ত, এটি কীভাবে আপনি "শেখার" সংজ্ঞা দেন তা নির্ভর করে। পিসিএ একটি নতুন বৈশিষ্ট্য স্থান শিখেছে যা আসল জায়গার বৈশিষ্ট্যগুলি ক্যাপচার করে। আমি অর্থবোধক হতে পারে বলে মনে হয়।

এটা জটিল? না, আসলেই নয়, তবে এটি কি অ্যালগরিদম হিসাবে হ্রাস পাবে? না আমি তাই মনে করি না।


3
আমি মনে করি এই উত্তরটি নিখুঁত মতামত এবং কোনও যুক্তি উপস্থাপন করে না। অন্যদের করা পয়েন্টগুলি বিস্তৃত, অন্তর্ভুক্ত এবং স্বীকৃতি জানাতে পারে।
হবিস

15

পিসিএ আসলে কেবল একটি ঘূর্ণন। মারাত্মকভাবে, এগুলি: এটি একটি নতুন ভিত্তিতে ডেটা স্পিন করার একটি চতুর উপায়। এই ভিত্তিতে এমন বৈশিষ্ট্য রয়েছে যা বিভিন্ন পদ্ধতির প্রাক-প্রক্রিয়াজাতকরণ পদক্ষেপ হিসাবে এটি কার্যকর করে।

  1. ভিত্তি অরথনরমাল । এটি অবিশ্বাস্যরূপে কার্যকর যদি আপনার বৈশিষ্ট্যগুলি বহুবিধ বর্ণ প্রদর্শন করে (দুই বা ততোধিক বৈশিষ্ট্য লাইন নির্ভর করে): পিসিএ প্রয়োগ করা আপনাকে এমন ভিত্তি দেওয়ার গ্যারান্টিযুক্ত যেখানে এটি আর সমস্যা নয়। এই পদ্ধতিটি মূল উপাদানগুলির রিগ্রেশন হিসাবে পরিচিত

  2. ভিত্তি ভেক্টর ডাটা বিস্তার থেকে সম্মান সঙ্গে অর্থপূর্ণ আছেন: তারা eigenvectors এর সহভেদাংক ম্যাট্রিক্স । এই দ্বিতীয় সম্পত্তিটি পিসিএর বিখ্যাত ইউটিলিটিকে একটি মাত্রিকতা হ্রাস কৌশল হিসাবে জন্ম দেয়: তথ্য ঘোরার পরে, সম্পূর্ণ বৈকল্পের একটি উল্লেখযোগ্য অংশের সাথে যুক্ত বেসর ভেক্টরগুলির উপসেটে ডেটা প্রজেক্ট করার পরে একটি নিম্ন মাত্রিক উপস্থাপনা পাওয়া যায় (প্রায়শই) ধরে রাখে ( বেশিরভাগ) ডেটার (আকর্ষণীয়) কাঠামোগত বৈশিষ্ট্য।


সুতরাং: এটি একটি শেখার অ্যালগরিদম? এটি একটি দার্শনিক প্রশ্নের ধরণ। কোন কিছু একটি শেখার অ্যালগরিদম তৈরি করে? অবশ্যই পিসিএ কোনও "তদারকি" শেখার অ্যালগরিদম নয় যেহেতু আমরা এটি টার্গেট ভেরিয়েবলের সাথে বা না করেই করতে পারি এবং আমরা সাধারণত ক্লাস্টারিংয়ের সাথে "অকার্যকর" কৌশলগুলি যুক্ত করি।

হ্যাঁ, পিসিএ একটি প্রাকপ্রসেসিং পদ্ধতি। তবে আপনি এটি কিছু "শেখার" হিসাবে সম্পূর্ণরূপে লেখার আগে, আমি আপনাকে নিম্নলিখিতগুলি বিবেচনা করতে চাই: পিসিএ আক্ষরিকভাবে কোভেরিয়েন্স ম্যাট্রিক্সের ইগেনভেেক্টর গ্রহণ করে গণনা করা যেতে পারে, তবে সাধারণত এটি বাস্তবে এটি করা হয় না। একটি সংখ্যার সমতুল্য এবং আরও বেশি গণনামূলক দক্ষ পদ্ধতি হ'ল ডেটাটির এসভিডি নেওয়া । সুতরাং, পিসিএ কেবল এসভিডি-র একটি নির্দিষ্ট অ্যাপ্লিকেশন, সুতরাং পিসিএ একটি লার্নিং অ্যালগরিদম কিনা তা জিজ্ঞাসা করে সত্যই জিজ্ঞাসা করছে যে এসভিডি একটি লার্নিং অ্যালগরিদম কিনা।

এখন, যদিও আপনি পিসিএটি লেখার অ্যালগরিদম হিসাবে লিখতে স্বাচ্ছন্দ্য বোধ করতে পারেন তবে এসভিডির সাথে আপনার একই রকম করা কম কেন করা উচিত তা: বিষয় মডেলিং এবং সহযোগী ফিল্টারিংয়ের জন্য এটি আশ্চর্যজনকভাবে শক্তিশালী একটি পদ্ধতি । এসভিডি এর বৈশিষ্ট্য যা এই অ্যাপ্লিকেশনগুলির জন্য এটি দরকারী করে তোলে ঠিক একই বৈশিষ্ট্য যা এটি মাত্রিকতা হ্রাস (যেমন পিসিএ) জন্য দরকারী করে।

এসভিডি হ'ল আইজেন্ডেকম্পোজিশনের একটি সাধারণীকরণ, এবং এটি এসভিডির একটি সীমাবদ্ধ সংস্করণ হিসাবেও অত্যন্ত শক্তিশালী। আপনি সংলগ্ন ম্যাট্রিক্সের ইগেনভেেক্টরগুলিকে দেখে গ্রাফটিতে সম্প্রদায় সনাক্তকরণ সম্পাদন করতে পারেন , বা ট্রানজিশন ম্যাট্রিক্সের ইগেনভেেক্টরগুলিকে দেখে একটি মার্কভ মডেলের স্থির-রাষ্ট্রীয় সম্ভাবনাগুলি নির্ধারণ করতে পারেন , যা কাকতালীয়ভাবে পেজর্যাঙ্ক কীভাবে গণনা করা হয় তাও মূলত ।

ফণা অধীনে, পিসিএ একটি সাধারণ লিনিয়ার বীজগণিত অপারেশন করছে। তবে, এটি ঠিক একই অপারেশন যা প্রচুর অ্যাপ্লিকেশনগুলিকে অন্তর্ভুক্ত করে যা বেশিরভাগ লোক "মেশিন লার্নিং" লেবেলটি প্রয়োগ করার বিষয়ে প্রশ্ন করেন না। এই শ্রেণীর অ্যালগরিদমগুলিকে ম্যাট্রিক্স ফ্যাক্টরাইজেশন বলা হয় এবং এমনকি ওয়ার্ড 2vec এর মতো পরিশীলিত কৌশলগুলিতেও প্রসারিত : আসলে আপনি আক্ষরিকভাবে কেবল একটি শব্দ সহ-ঘটনামূলক ম্যাট্রিক্সে পিসিএ প্রয়োগ করে ওয়ার্ড 2vec- জাতীয় ফলাফল পেতে পারেন । আবার সাধারণকরণ করা, পিসিএ ফলাফলের জন্য আরেকটি শব্দ একটি এম্বেডিং । ওয়ার্ড 2vec সম্ভবত একটি এম্বেডিংয়ের সর্বাধিক বিখ্যাত উদাহরণ, তবে এম্বেডিংগুলি তৈরি করা (মধ্যস্থতাকারী হিসাবে) এছাড়াও আরএনএন -তে ব্যবহৃত এনকোডার-ডিকোডার আর্কিটেকচারের একটি গুরুত্বপূর্ণ উপাদান isএবং জিএএনএস , যা এই মুহুর্তে এমএল গবেষণার রক্তপাত প্রবাহ edge


সুতরাং আপনার প্রশ্নে ফিরে: পিসিএ একটি "মেশিন লার্নিং অ্যালগরিদম?" ঠিক আছে, যদি তা না হয় তবে আপনাকে সহযোগী ফিল্টারিং, টপিক মডেলিং, সম্প্রদায় সনাক্তকরণ, নেটওয়ার্ক কেন্দ্রীয়তা এবং এমবেডিং মডেলগুলির বিষয়েও একই কথা বলতে প্রস্তুত থাকতে হবে।

এটি সহজ লিনিয়ার বীজগণিতের অর্থ হ'ল এটি যাদুও নয়।


6

অবশ্যই, এটি কোনও শিক্ষার অ্যালগরিদম নয়, কারণ আপনি পিসিএতে কিছু শিখেন না। তবে এটি বাস্তবের আরও ভাল পারফরম্যান্সে পৌঁছানোর জন্য বিভিন্ন লার্নিং অ্যালগরিদমগুলিতে ব্যবহার করা যেতে পারে, অন্যান্য মাত্রা হ্রাস পদ্ধতিগুলি সবচেয়ে পছন্দ করে।


4

অপ্রয়োজনীয় বৈশিষ্ট্যগুলি অপসারণ করতে পিসিএ ব্যবহার করা হয়। এটা তোলে কোন ডেটা অত্যন্ত মধ্যে বিতরণ করা হয় দিকনির্দেশ খুঁজে বের করে। এটা, ডাটা লেবেল সম্পর্কে গ্রাহ্য না করে কারণ এটি একটি অনুমান যা প্রতিনিধিত্ব করে তথ্য অন্তত-বর্গক্ষেত্র অর্থে। একাধিক বৈষম্যমূলক বিশ্লেষণ, উপাত্তগুলি MDAসর্বোত্তমভাবে পৃথক করে এমন अनुमानগুলি সন্ধান করার চেষ্টা করুন। পরেরটি লেবেলটিকে বিবেচনা করে এবং দিকনির্দেশগুলি সন্ধান করে যে ডেটা সর্বাধিক পৃথক করা যায়, যদিও এটির সিদ্ধান্তের ধরণের সম্পর্কে কিছু বিশদ রয়েছে। গুটিয়ে রাখা, PCAশেখার অ্যালগরিদম নয়। এটি কেবল দিকনির্দেশনা অনুসন্ধানের চেষ্টা করে যা সম্পর্কিত তথ্যগুলিকে মুছে ফেলার জন্য কোন ডেটা অত্যন্ত বিতরণ করা হয়। MDAডেটা শ্রেণিবদ্ধ করার জন্য দিকনির্দেশ খোঁজার চেষ্টা করার মতো অনুরূপ পন্থা । যদিও MDAঅনেক ভালো লেগেছেPCA, তবে পূর্ববর্তীটি শ্রেণিবদ্ধকরণের জন্য ব্যবহৃত হয়, এটি লেবেলগুলিকে বিবেচনা করে তবে পরবর্তীকটি সরাসরি শ্রেণিবদ্ধকরণের জন্য ব্যবহৃত হয় না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.