নিম্ন স্তরের আনুমানিকতা নিয়ে কেন বিরক্ত করবেন?


20

আপনার যদি এন সারি এবং এম কলামগুলির সাথে ম্যাট্রিক্স রয়েছে তবে আপনি প্রদত্ত ম্যাট্রিক্সের নিম্ন-স্তরের আনুমানিক গণনা করতে এসভিডি বা অন্যান্য পদ্ধতি ব্যবহার করতে পারেন ।

তবে, নিম্ন র‌্যাঙ্কের আনুমানিককরণে এখনও এন সারি এবং এম কলাম থাকবে। আপনি একই সংখ্যক বৈশিষ্ট্য রেখে গেছেন, তবে মেশিন শেখার এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণের জন্য কীভাবে নিম্ন-স্তরের-অনুমানগুলি কার্যকর হতে পারে?


2
তাদের সাধারণত বিরল উপস্থাপনা থাকে - কম র‌্যাঙ্কের আনুমানিকতার জন্য আপনার সংখ্যা সংরক্ষণ করার দরকার নেই । উদাহরণস্বরূপ, র‌্যাঙ্ক 1 এর প্রায় অনুমানের জন্য n + m সংখ্যা প্রয়োজন। মিএনএন+ +মি
সম্ভাব্যতা ব্লগ

উত্তর:


16

কম র্যাঙ্ক পড়তা এক্স এর এক্স যেমন একটি ম্যাট্রিক্স বর্গমূল করা যায় পচে জি = ইউ R λ 1এক্স^এক্সযেখানে eigen পচানিএক্সহয়ইউλইউটিফলে যার দ্বারা প্রতিনিধিত্ব করা যাবে বৈশিষ্ট্য নম্বর, হ্রাসজিযেমন র্যাঙ্ক-R পড়তা উপর ভিত্তি করেএক্স=জিজিটি। নোট করুন যে সাবস্ক্রিপ্টআর আনুমানিকভাবে ব্যবহৃত ইগেন-ভেক্টর এবং ইগেন-মানগুলির সংখ্যা উপস্থাপন করে। সুতরাং, এটি ডেটা উপস্থাপনের জন্য বৈশিষ্ট্যগুলির সংখ্যা হ্রাস করে না does কয়েকটি উদাহরণে নিম্ন-স্তরের আনুমানিকতাগুলি অরথোগোনালিটি, অ-নেতিবাচকতা (অ-নেতিবাচক ম্যাট্রিক্স ফ্যাক্টেরাইজেশন) ইত্যাদির মতো বিশেষ সীমাবদ্ধতার অধীনে মূল তথ্যগুলির ভিত্তি বা সুপ্ত পরিবর্তনশীল (অভিধান) ভিত্তিক বিস্তৃতি হিসাবে বিবেচিত হয় etc.জি=ইউRλR12এক্সইউλইউটিজিএক্স^=জিজিটিR


5

নিম্ন-স্তরের আনুমানিক পয়েন্টটি মাত্র মাত্রা হ্রাস সম্পাদন করার জন্য প্রয়োজনীয় নয়।

ধারণাটি এই যে ডোমেন জ্ঞানের উপর ভিত্তি করে, ম্যাট্রিক্সের ডেটা / এন্ট্রিগুলি কোনওভাবে ম্যাট্রিক্সকে নিম্ন স্তরের করে তুলবে। তবে এটি আদর্শ ক্ষেত্রে যেখানে এন্ট্রিগুলি শব্দ, দুর্নীতি, অনুপস্থিত মান ইত্যাদির দ্বারা প্রভাবিত হয় না The পর্যবেক্ষিত ম্যাট্রিক্স সাধারণত উচ্চতর পদমর্যাদায় থাকবে।

নিম্ন-র‌্যাঙ্কের আনুমানিকতা এইভাবে "মূল" ("আদর্শ" ম্যাট্রিক্সটি শোরগোল ইত্যাদির দ্বারা গণ্ডগোল করার আগে) পুনরুদ্ধার করার উপায় low বর্তমান ম্যাট্রিক্স সহ এবং নিম্ন-পদমর্যাদার যাতে এটি আদর্শ ম্যাট্রিক্সের সান্নিধ্য হিসাবে ব্যবহার করা যায়। এই ম্যাট্রিক্সটি পুনরুদ্ধার করার পরে, আমরা এটিকে শোরগোলের সংস্করণের বিকল্প হিসাবে ব্যবহার করতে পারি এবং আশা করি আরও ভাল ফলাফল পাবেন।


4

এখনও দুটি উল্লেখ করা হয়নি আরও:

  1. কোলিনারিটি হ্রাস করা হচ্ছে। আমি বিশ্বাস করি যে এই কৌশলগুলির বেশিরভাগই কোলিনারিটি সরিয়ে দেয়, যা ফলো-অন প্রক্রিয়াজাতকরণের জন্য সহায়ক হতে পারে।

  2. আমাদের কল্পনাগুলি নিম্ন-স্তরের, সুতরাং এটি নিম্ন-স্তরের সম্পর্কগুলি অন্বেষণের জন্য সহায়ক হতে পারে।


3

একবার আপনি আনুমানিকের র‌্যাঙ্ক স্থির করে নিন (বলুন R<মি), আপনি কেবল এটি ধরে রাখতে পারবেন R ভবিষ্যতের ব্যবহারের জন্য ভিত্তি ভেক্টরগুলি (বলুন, কোনও রিগ্রেশন বা শ্রেণিবিন্যাস সমস্যার ক্ষেত্রে ভবিষ্যদ্বাণী হিসাবে) এবং আসল নয় মি


1

"আধুনিক মাল্টিভারিয়েট স্ট্যাটিস্টিকাল টেকনিকস (ইজেনম্যান)" অনুসারে হ্রাস র‌্যাঙ্কের রেগ্রেশন পিসিএ, ফ্যাক্টর অ্যানালাইসিস, ক্যানোনিকাল ভ্যারিয়েট এবং পারস্পরিক সম্পর্ক বিশ্লেষণ, এলডিএ এবং চিঠিপত্র বিশ্লেষণ সহ বিশেষ কিছু মামলা হিসাবে আকর্ষণীয় কয়েকটি পদ্ধতি কভার করে covers

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.