একক মান পচনের বিন্দু কী?


9

মাত্রা হ্রাস কেন গুরুত্বপূর্ণ তা আমি বুঝতে পারি না। কিছু ডেটা নেওয়ার এবং তাদের মাত্রা হ্রাস করে কী লাভ?


3
প্রশ্নের স্বর গঠনমূলক উত্তরগুলি আমন্ত্রণ করে না। আপনার প্রশ্নের পুনর্নির্মাণ বিবেচনা করুন।
সাশা

2
মূল বক্তব্য হ'ল নির্ভুলতার সামান্য ক্ষতি (যেমন জেপিইজি চিত্র সংক্ষেপণ) ব্যয় হিসাবে নির্দিষ্ট তথ্য সংরক্ষণের জন্য প্রয়োজনীয় ডেটার পরিমাণকে হ্রাস করা।
সাশা

2
আপনার মন্তব্যগুলির জন্য আপনাকে ধন্যবাদ, সাশা। এটি একটি যুক্তিসঙ্গত প্রশ্ন, তাই আমি মূল শব্দটির দ্বারা বোঝানো কট্টরতার ছাপ (অবশ্যই অজ্ঞাতীত) এড়াতে আমি একটি সামান্য সম্পাদনা করেছি।
হুবুহু


আপনি টপিক মডেলিংয়ের জন্য এসভিডি করেন যা সম্ভাব্য নয়। টপিক মডেলিংয়ের জন্য এটি সম্ভাব্য ব্যবহারের এলডিএ। আপনি যদি টপিক মডেলিং না করে থাকেন তবে পিসিএ ব্যবহার করুন।
ব্র্যাড

উত্তর:


18

একক মান ভলন (এসভিডি) তথ্যটির মাত্রা হ্রাস করার মতো নয়। এটি ম্যাট্রিক্সকে অন্যান্য ম্যাট্রিক্সে দ্রবীভূত করার একটি পদ্ধতি যার অনেকগুলি দুর্দান্ত বৈশিষ্ট্য রয়েছে যা আমি এখানে প্রবেশ করব না। এসভিডির আরও তথ্যের জন্য উইকিপিডিয়া পৃষ্ঠাটি দেখুন

আপনার ডেটার মাত্রিকতা হ্রাস কখনও কখনও খুব দরকারী। এটি হতে পারে যে আপনার কাছে পর্যবেক্ষণের তুলনায় অনেক বেশি পরিবর্তনশীল রয়েছে; জিনোমিক কাজের ক্ষেত্রে এটি অস্বাভাবিক নয়। এটি হতে পারে যে আমাদের বেশ কয়েকটি ভেরিয়েবল রয়েছে যা খুব সংযুক্ত থাকে যেমন, যখন তারা সংক্ষিপ্ত সংখ্যক অন্তর্নিহিত কারণগুলির দ্বারা প্রভাবিত হয় এবং আমরা অন্তর্নিহিত কারণগুলির সাথে কিছুটা সেরে উঠতে চাই। প্রধান উপাদান উপাদান বিশ্লেষণ, বহুমাত্রিক স্কেলিং এবং ক্যানোনিকাল ভ্যারিয়েট বিশ্লেষণের মতো মাত্রা-হ্রাস কৌশলগুলি আমাদের পর্যবেক্ষণ এবং / অথবা ভেরিয়েবলের মধ্যে সম্পর্কের অন্তর্দৃষ্টি দেয় যা আমরা অন্য কোনও উপায়ে পেতে সক্ষম না হতে পারি।

একটি দৃ concrete় উদাহরণ: কয়েক বছর আগে আমি একজন কর্মচারী সন্তুষ্টি জরিপটি বিশ্লেষণ করছিলাম যাতে এটিতে 100 টিরও বেশি প্রশ্ন ছিল। ঠিক আছে, কোনও ম্যানেজার কখনই ১০০+ উত্তর মূল্যের উত্তরগুলি দেখতে, সংক্ষিপ্তিত করতে এবং এর অর্থ কী তা অনুমান করার চেয়ে বেশি কিছু করতে সক্ষম হতে পারে না কারণ উত্তরগুলি কীভাবে সম্পর্কিত এবং সেগুলি কী চালাচ্ছে তা কে বলতে পারে? ? আমি ডেটাতে একটি ফ্যাক্টর বিশ্লেষণ সম্পাদন করেছি, যার জন্য আমার 10,000 টিরও বেশি পর্যবেক্ষণ ছিল এবং আমি পাঁচটি স্পষ্ট এবং স্বচ্ছলভাবে ব্যাখ্যাযোগ্য ফ্যাক্টর নিয়ে এসেছি যা ব্যবস্থাপক-নির্দিষ্ট স্কোরগুলি (প্রতিটি ফ্যাক্টরের জন্য একটি) বিকাশ করতে ব্যবহার করা যেতে পারে যা সম্পূর্ণতার সংক্ষিপ্ত বিবরণ দেয় would 100+ প্রশ্ন জরিপ। এক্সেল স্প্রেডশিট ডাম্পের চেয়ে আরও ভাল সমাধান যা ফলাফলগুলি রিপোর্ট করার পূর্বের পদ্ধতি ছিল!


মাত্রা হ্রাস করার জন্য "পাতলা এসভিডি" নামে একটি পদ্ধতি ব্যবহৃত হয়। এসভিডি তে উইকিপিডিয়া দেখুন।
সাইবার্গ

5

আপনার প্রশ্নের সেকেন্ড পয়েন্ট সম্পর্কিত, কোনও ডেটা সেটের জন্য মাত্রা হ্রাসের সুবিধাগুলি হতে পারে:

  • প্রয়োজনীয় স্টোরেজ স্পেস হ্রাস করুন
  • গণনার গতি বাড়ান (উদাহরণস্বরূপ মেশিন লার্নিং অ্যালগরিদমগুলিতে), কম মাত্রা মানে কম কমপিউটিং, কম মাত্রাও অ্যালগরিদমের ব্যবহারকে বৃহত সংখ্যার মাত্রার জন্য অযোগ্য বলে অনুমতি দিতে পারে
  • অপ্রয়োজনীয় বৈশিষ্ট্যগুলি সরিয়ে ফেলুন, উদাহরণস্বরূপ, বর্গমিটার এবং বর্গমাইল উভয় ক্ষেত্রে ভূখণ্ডের আকার সংরক্ষণ করার কোনও অর্থ নেই (সম্ভবত ডেটা সংগ্রহ করা ত্রুটিযুক্ত ছিল)
  • 2D বা 3 ডি তে কোনও তথ্যের মাত্রা হ্রাস করা আমাদের এটি প্লট করতে এবং কল্পনা করতে, হতে পারে নিদর্শনগুলি পর্যবেক্ষণ করতে, আমাদের অন্তর্দৃষ্টি দেয়

এটি ছাড়াও, পিসিএ ছাড়িয়ে এসভিডি'র সিগন্যাল প্রসেসিং, এনএলপি এবং আরও অনেক কিছুতে অ্যাপ্লিকেশন রয়েছে


2

আমার এই উত্তরটি একবার দেখুন । একবচনীয় মান পচন মূল উপাদান বিশ্লেষণের একটি মূল উপাদান যা একটি খুব দরকারী এবং খুব শক্তিশালী ডেটা বিশ্লেষণ কৌশল।

এটি প্রায়শই মুখের স্বীকৃতি অ্যালগরিদমগুলিতে ব্যবহৃত হয় এবং আমি হেজ ফান্ড বিশ্লেষক হিসাবে আমার দিনের চাকরিতে এটির ঘন ঘন ব্যবহার করি।


1
এসভিডি এবং পিসিএ (সম্পর্কিত থাকাকালীন) আলাদা পদ্ধতি নয়?
বি_মিনার

2
তুমি ঠিক. এসভিডি পিসিএ সমস্যার সমাধান পাওয়ার জন্য একটি পদ্ধতি।
বৈয়ার্জ

1
@ বি_মিনার হ্যাঁ - সে কারণেই আমি বলেছিলাম যে এসভিডি পিসিএর একটি মূল উপাদান । আমি পিসিএতে দৃষ্টি নিবদ্ধ রেখেছি কারণ প্রশ্নটি মাত্রা হ্রাস নিয়ে উদ্বেগ প্রকাশ করেছে (যার জন্য পিসিএ উপযুক্ত, এবং এসভিডি নয়)
ক্রিস টেলর

সম্ভবত এর শব্দ পছন্দ উপাদান কি সাময়িকভাবে @B_Miner ছুড়ে ফেলে বন্ধ ছিল। :)
কার্ডিনাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.