পিসিএ করার সময় কত মাত্রা কমাতে হবে?


12

কিভাবে পিসিএ জন্য কে নির্বাচন করবেন? কে হ'ল প্রজেক্টের সংখ্যা নীচে। একমাত্র প্রয়োজনীয়তা হল খুব বেশি তথ্য না হারাতে। আমি বুঝতে পারি এটি ডেটার উপর নির্ভর করে তবে কে বেছে নেওয়ার সময় কোন বৈশিষ্ট্যগুলি বিবেচনা করা উচিত সে সম্পর্কে একটি সাধারণ সাধারণ ওভারভিউয়ের জন্য আমি আরও সন্ধান করছি।


সহ্যযোগ্য ডেটা হ্রাস এবং সমস্যা বিবৃতিতেও নির্ভর করে!
দাওয়ানি 33

আমি নীচের দুটি উত্তর সাথে একমত। তবে, আপনি কি জানেন যে তথ্য ক্ষতির পরিমাণ নির্ধারণের একটি সহজ উপায় আছে, অর্থাত্ কোভেরিয়েন্স ম্যাট্রিক্সের এসভিডি এর তির্যক ব্যবহার করে?
ইউকিয়ান

উত্তর:


13

পিসিএ অ্যালগরিদম সম্পাদন করার পরে আপনি মূল উপাদানগুলি পান যেগুলি তাদের কাছে থাকা তথ্যের পরিমাণ অনুসারে বাছাই করা। আপনি যদি পুরো সেটটি রাখেন তবে কোনও তথ্যই হারাবে না। একে একে তাদের অপসারণ করা এবং তাদেরকে মূল জায়গাতে আবার প্রজেক্ট করা আপনি তথ্য ক্ষতির গণনা করতে পারেন। মুছে ফেলা মূল সংস্থাগুলির বিপরীতে আপনি এই তথ্য ক্ষতির পরিকল্পনা করতে পারেন এবং এটি কোনও 'কনুই' তৈরি করে কিনা তা বোঝার জন্য এটি তৈরি করতে পারেন। যদিও এটি আপনার ব্যবহারের ক্ষেত্রে অনেকগুলি নির্ভর করে।


(+1) হ্যাঁ, এর চেয়ে সহজ সরল :)
ডওয়ানি 33

3

আমি সাধারণত কে মান দ্বারা প্রাপ্ত তথ্যের শতাংশ শতাংশ পরীক্ষা করে দেখি। ধরা যাক 8 টি ক্ষেত্রের মধ্যে, 2 টির মধ্যে 90% তথ্য রয়েছে। তারপরে অন্য 6 বা 5 ক্ষেত্রগুলি সহ কোনও লাভ নেই। আপনি যদি n6868 ইনপুটগুলির বাইরে মনিস্ট ডেটা জানেন তবে আমি কেবল 250 ব্যবহার করেছি, যা আমার নির্ভুলতাটিকে 83 থেকে 96% পর্যন্ত ছড়িয়ে দিয়েছে। সত্যটি আরও মাত্রিকতা আরও সমস্যা নিয়ে আসে। সুতরাং তাদের কেটে দিন। আমি সাধারণত কেবলমাত্র কে নিয়ে যাই যিনি কেবল 90% তথ্য রাখেন, এবং এটি আমার পক্ষে কাজ করে।


হাই .. আমার একই ধরণের সমস্যা আছে যেখানে আমি x% তথ্য ব্যবহার করতে চাই এবং এটি কীভাবে করবেন তা নিশ্চিত নয়? আমি আইপিসিএ ব্যবহারের উদ্দেশ্যে এটি করার জন্য আমি n_comp घटक = কিছুই ছাড়তে পারি তবে আমি কীভাবে সিদ্ধান্ত নেব যে ডেটাগুলির x% রয়েছে সেগুলি কী কী?
আর্সেনাল ফ্যান্যাটিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.