উত্তর:
কারও পক্ষে এটি নিরীক্ষণযোগ্য কৌশল হিসাবে লেবেল করা অস্বাভাবিক নয়। আপনি ইগেনভেেক্টরগুলির উপর কিছু বিশ্লেষণ করতে পারেন এবং এটি ডেটার আচরণের ব্যাখ্যা করতে সহায়তা করে। স্বাভাবিকভাবে যদি আপনার রূপান্তরটির এখনও অনেকগুলি বৈশিষ্ট্য থাকে তবে এই প্রক্রিয়াটি বেশ শক্ত হতে পারে। তবুও এটি সম্ভব এইভাবে আমি এটি মেশিন লার্নিং বিবেচনা করি।
সম্পাদনা:
যেহেতু আমার উত্তরটি নির্বাচিত হয়েছিল (কেন জানি না) আমি আরও বুঝতে পেরেছি যে আমি আরও বিশদ যুক্ত করব।
পিসিএ দুটি কাজ করে যা সমতুল্য। প্রথমত, এবং যা সাধারণত উল্লেখ করা হয়, এটি বৈকল্পিকগুলি সর্বাধিক করে তোলে। দ্বিতীয়ত, এটি জোড়-সংযুক্ত দূরত্ব দেখে পুনর্গঠন ত্রুটি হ্রাস করে।
ইগেনভেেক্টর এবং ইগেনভ্যালুগুলি দেখে, কোন ভেরিয়েবল এবং বৈশিষ্ট্যগুলি বৈকল্পিকতায় অবদান রাখছে এবং কীভাবে বিভিন্ন ভেরিয়েবলগুলি অন্যের সাথে মিলিত হয় তা নির্ধারণ করা বরং সহজ হয়ে যায়।
শেষ পর্যন্ত, এটি কীভাবে আপনি "শেখার" সংজ্ঞা দেন তা নির্ভর করে। পিসিএ একটি নতুন বৈশিষ্ট্য স্থান শিখেছে যা আসল জায়গার বৈশিষ্ট্যগুলি ক্যাপচার করে। আমি অর্থবোধক হতে পারে বলে মনে হয়।
এটা জটিল? না, আসলেই নয়, তবে এটি কি অ্যালগরিদম হিসাবে হ্রাস পাবে? না আমি তাই মনে করি না।
পিসিএ আসলে কেবল একটি ঘূর্ণন। মারাত্মকভাবে, এগুলি: এটি একটি নতুন ভিত্তিতে ডেটা স্পিন করার একটি চতুর উপায়। এই ভিত্তিতে এমন বৈশিষ্ট্য রয়েছে যা বিভিন্ন পদ্ধতির প্রাক-প্রক্রিয়াজাতকরণ পদক্ষেপ হিসাবে এটি কার্যকর করে।
ভিত্তি অরথনরমাল । এটি অবিশ্বাস্যরূপে কার্যকর যদি আপনার বৈশিষ্ট্যগুলি বহুবিধ বর্ণ প্রদর্শন করে (দুই বা ততোধিক বৈশিষ্ট্য লাইন নির্ভর করে): পিসিএ প্রয়োগ করা আপনাকে এমন ভিত্তি দেওয়ার গ্যারান্টিযুক্ত যেখানে এটি আর সমস্যা নয়। এই পদ্ধতিটি মূল উপাদানগুলির রিগ্রেশন হিসাবে পরিচিত
ভিত্তি ভেক্টর ডাটা বিস্তার থেকে সম্মান সঙ্গে অর্থপূর্ণ আছেন: তারা eigenvectors এর সহভেদাংক ম্যাট্রিক্স । এই দ্বিতীয় সম্পত্তিটি পিসিএর বিখ্যাত ইউটিলিটিকে একটি মাত্রিকতা হ্রাস কৌশল হিসাবে জন্ম দেয়: তথ্য ঘোরার পরে, সম্পূর্ণ বৈকল্পের একটি উল্লেখযোগ্য অংশের সাথে যুক্ত বেসর ভেক্টরগুলির উপসেটে ডেটা প্রজেক্ট করার পরে একটি নিম্ন মাত্রিক উপস্থাপনা পাওয়া যায় (প্রায়শই) ধরে রাখে ( বেশিরভাগ) ডেটার (আকর্ষণীয়) কাঠামোগত বৈশিষ্ট্য।
সুতরাং: এটি একটি শেখার অ্যালগরিদম? এটি একটি দার্শনিক প্রশ্নের ধরণ। কোন কিছু একটি শেখার অ্যালগরিদম তৈরি করে? অবশ্যই পিসিএ কোনও "তদারকি" শেখার অ্যালগরিদম নয় যেহেতু আমরা এটি টার্গেট ভেরিয়েবলের সাথে বা না করেই করতে পারি এবং আমরা সাধারণত ক্লাস্টারিংয়ের সাথে "অকার্যকর" কৌশলগুলি যুক্ত করি।
হ্যাঁ, পিসিএ একটি প্রাকপ্রসেসিং পদ্ধতি। তবে আপনি এটি কিছু "শেখার" হিসাবে সম্পূর্ণরূপে লেখার আগে, আমি আপনাকে নিম্নলিখিতগুলি বিবেচনা করতে চাই: পিসিএ আক্ষরিকভাবে কোভেরিয়েন্স ম্যাট্রিক্সের ইগেনভেেক্টর গ্রহণ করে গণনা করা যেতে পারে, তবে সাধারণত এটি বাস্তবে এটি করা হয় না। একটি সংখ্যার সমতুল্য এবং আরও বেশি গণনামূলক দক্ষ পদ্ধতি হ'ল ডেটাটির এসভিডি নেওয়া । সুতরাং, পিসিএ কেবল এসভিডি-র একটি নির্দিষ্ট অ্যাপ্লিকেশন, সুতরাং পিসিএ একটি লার্নিং অ্যালগরিদম কিনা তা জিজ্ঞাসা করে সত্যই জিজ্ঞাসা করছে যে এসভিডি একটি লার্নিং অ্যালগরিদম কিনা।
এখন, যদিও আপনি পিসিএটি লেখার অ্যালগরিদম হিসাবে লিখতে স্বাচ্ছন্দ্য বোধ করতে পারেন তবে এসভিডির সাথে আপনার একই রকম করা কম কেন করা উচিত তা: বিষয় মডেলিং এবং সহযোগী ফিল্টারিংয়ের জন্য এটি আশ্চর্যজনকভাবে শক্তিশালী একটি পদ্ধতি । এসভিডি এর বৈশিষ্ট্য যা এই অ্যাপ্লিকেশনগুলির জন্য এটি দরকারী করে তোলে ঠিক একই বৈশিষ্ট্য যা এটি মাত্রিকতা হ্রাস (যেমন পিসিএ) জন্য দরকারী করে।
এসভিডি হ'ল আইজেন্ডেকম্পোজিশনের একটি সাধারণীকরণ, এবং এটি এসভিডির একটি সীমাবদ্ধ সংস্করণ হিসাবেও অত্যন্ত শক্তিশালী। আপনি সংলগ্ন ম্যাট্রিক্সের ইগেনভেেক্টরগুলিকে দেখে গ্রাফটিতে সম্প্রদায় সনাক্তকরণ সম্পাদন করতে পারেন , বা ট্রানজিশন ম্যাট্রিক্সের ইগেনভেেক্টরগুলিকে দেখে একটি মার্কভ মডেলের স্থির-রাষ্ট্রীয় সম্ভাবনাগুলি নির্ধারণ করতে পারেন , যা কাকতালীয়ভাবে পেজর্যাঙ্ক কীভাবে গণনা করা হয় তাও মূলত ।
ফণা অধীনে, পিসিএ একটি সাধারণ লিনিয়ার বীজগণিত অপারেশন করছে। তবে, এটি ঠিক একই অপারেশন যা প্রচুর অ্যাপ্লিকেশনগুলিকে অন্তর্ভুক্ত করে যা বেশিরভাগ লোক "মেশিন লার্নিং" লেবেলটি প্রয়োগ করার বিষয়ে প্রশ্ন করেন না। এই শ্রেণীর অ্যালগরিদমগুলিকে ম্যাট্রিক্স ফ্যাক্টরাইজেশন বলা হয় এবং এমনকি ওয়ার্ড 2vec এর মতো পরিশীলিত কৌশলগুলিতেও প্রসারিত : আসলে আপনি আক্ষরিকভাবে কেবল একটি শব্দ সহ-ঘটনামূলক ম্যাট্রিক্সে পিসিএ প্রয়োগ করে ওয়ার্ড 2vec- জাতীয় ফলাফল পেতে পারেন । আবার সাধারণকরণ করা, পিসিএ ফলাফলের জন্য আরেকটি শব্দ একটি এম্বেডিং । ওয়ার্ড 2vec সম্ভবত একটি এম্বেডিংয়ের সর্বাধিক বিখ্যাত উদাহরণ, তবে এম্বেডিংগুলি তৈরি করা (মধ্যস্থতাকারী হিসাবে) এছাড়াও আরএনএন -তে ব্যবহৃত এনকোডার-ডিকোডার আর্কিটেকচারের একটি গুরুত্বপূর্ণ উপাদান isএবং জিএএনএস , যা এই মুহুর্তে এমএল গবেষণার রক্তপাত প্রবাহ edge
সুতরাং আপনার প্রশ্নে ফিরে: পিসিএ একটি "মেশিন লার্নিং অ্যালগরিদম?" ঠিক আছে, যদি তা না হয় তবে আপনাকে সহযোগী ফিল্টারিং, টপিক মডেলিং, সম্প্রদায় সনাক্তকরণ, নেটওয়ার্ক কেন্দ্রীয়তা এবং এমবেডিং মডেলগুলির বিষয়েও একই কথা বলতে প্রস্তুত থাকতে হবে।
এটি সহজ লিনিয়ার বীজগণিতের অর্থ হ'ল এটি যাদুও নয়।
অপ্রয়োজনীয় বৈশিষ্ট্যগুলি অপসারণ করতে পিসিএ ব্যবহার করা হয়। এটা তোলে কোন ডেটা অত্যন্ত মধ্যে বিতরণ করা হয় দিকনির্দেশ খুঁজে বের করে। এটা, ডাটা লেবেল সম্পর্কে গ্রাহ্য না করে কারণ এটি একটি অনুমান যা প্রতিনিধিত্ব করে তথ্য অন্তত-বর্গক্ষেত্র অর্থে। একাধিক বৈষম্যমূলক বিশ্লেষণ, উপাত্তগুলি MDA
সর্বোত্তমভাবে পৃথক করে এমন अनुमानগুলি সন্ধান করার চেষ্টা করুন। পরেরটি লেবেলটিকে বিবেচনা করে এবং দিকনির্দেশগুলি সন্ধান করে যে ডেটা সর্বাধিক পৃথক করা যায়, যদিও এটির সিদ্ধান্তের ধরণের সম্পর্কে কিছু বিশদ রয়েছে। গুটিয়ে রাখা, PCA
শেখার অ্যালগরিদম নয়। এটি কেবল দিকনির্দেশনা অনুসন্ধানের চেষ্টা করে যা সম্পর্কিত তথ্যগুলিকে মুছে ফেলার জন্য কোন ডেটা অত্যন্ত বিতরণ করা হয়। MDA
ডেটা শ্রেণিবদ্ধ করার জন্য দিকনির্দেশ খোঁজার চেষ্টা করার মতো অনুরূপ পন্থা । যদিও MDA
অনেক ভালো লেগেছেPCA
, তবে পূর্ববর্তীটি শ্রেণিবদ্ধকরণের জন্য ব্যবহৃত হয়, এটি লেবেলগুলিকে বিবেচনা করে তবে পরবর্তীকটি সরাসরি শ্রেণিবদ্ধকরণের জন্য ব্যবহৃত হয় না।