শক্তিশালী পিসিএ বনাম শক্তিশালী মহালানোবিস দূরত্ব নির্ধারণকারী সনাক্তকরণের জন্য


17

শক্তসমর্থ পিসিএ (যেমন ক্যান্ডিস এট আল 2009 বা আরও উন্নততর নেত্রপল্লী এট আল 2014 দ্বারা বিকাশ করা হয়েছে ) মাল্টিভারিয়েট আউটলেট সনাক্তকরণের জন্য একটি জনপ্রিয় পদ্ধতি , তবে মহাওলোবিস দূরত্বও বহিরাগত সনাক্তকরণের জন্য ব্যবহার করা যেতে পারে কোভেরিয়েন্স ম্যাট্রিক্সের একটি দৃ rob় , নিয়মিত অনুমানের কারণে । আমি অন্য পদ্ধতিতে একটি পদ্ধতি ব্যবহারের (ডিস্ক) সুবিধাগুলি সম্পর্কে আগ্রহী।

আমার অন্তর্নিহিততা আমাকে বলেছে যে উভয়ের মধ্যে সর্বাধিক পার্থক্যটি হ'ল: ডেটা সেটটি যখন "ছোট" হয় (একটি পরিসংখ্যানগত দিক থেকে), তখন শক্তিশালী পিসিএ নিম্ন স্তরের কোভেরিয়েন্স দেয় যখন মজবুত কোভেরিয়েন্স ম্যাট্রিক্স অনুমানের পরিবর্তে একটি পূর্ণ- লেডোয়েট-ওল্ফ নিয়মিতকরণের কারণে র‌্যাঙ্কের সহজাততা। এটি কীভাবে আউটলেট সনাক্তকরণকে প্রভাবিত করে?


আকর্ষণীয় প্রশ্ন তবে আমি দেখতে পাচ্ছি না যে কোনও নির্দিষ্ট ব্যবহারের ক্ষেত্রে উত্তর ছাড়া কীভাবে অনুপ্রেরণা দেওয়া যায়। আপনার কি "গুরুতর কলুষিত পর্যবেক্ষণ" আছে ? আপনার কাছে কি সাধারণভাবে কোলাহলযুক্ত ডেটা থাকে? বেশ কয়েকটি আরপিসিএ বাস্তবায়ন হ'ল মজবুত কোভেরিয়েন্স অনুমানের কৌশলগুলি (জলিফের প্রিন্ট দেখুন see সুতরাং, আপনি যে দুটি পদ্ধতির উল্লেখ করেছেন তার মধ্যে পার্থক্যগুলি পরিষ্কার-পরিচ্ছন্নতা থেকে অনেক দূরে। সাধারণভাবে, একটি নির্দিষ্ট অ্যাপ্লিকেশনের প্রসঙ্গে স্বয়ংক্রিয় আউটলেট সনাক্তকরণ সফল।
usεr11852

1
"শোরগোলের তথ্য" সমস্যাটি বহিরাগত সনাক্তকরণ নয়। আমি মনে করি যে আউটলেট সনাক্তকরণ সমস্যাটি ব্যবহারের কেস ছাড়াই এই দুটি পদ্ধতির মধ্যে সাধারণ তুলনা করার অনুমতি দেওয়ার জন্য যথেষ্ট পরিমাণে সীমাবদ্ধ। এটি পদ্ধতি সম্পর্কিত একটি প্রশ্ন।
মোস্তফা এস আইসা

আমি খুব অল্প জায়গায় খুব বেশি কিছু বলার চেষ্টা করেছি, এর জন্য দুঃখিত। আমি যেদিকে দৃষ্টি আকর্ষণ করতে চাই তা হ'ল আপনি যে দুটি পদ্ধতির উল্লেখ করেছেন তা আলাদা নয়। আপনি একটি অভিক্ষেপ অনুসরণের পদ্ধতির (আপনি আরপিসিএ যাকে বলে) এবং একটি শক্তিশালী কোভেরিয়েন্স অনুমানের পদ্ধতির (যাকে আপনি মহালানবিস দূরত্ব বলে ডাকে) মধ্যে তুলনা করার দিকে আরও মনোনিবেশ করা বিবেচনা করা উচিত। নিজের মধ্যে শক্তিশালী কোভেরিয়েন্স অনুমানটি আরপিসিএ বাস্তবায়নের জন্য একদম কার্যকর বৈধ পদ্ধতি (যেমন গুগল "পিসিএ এম-অনুমান")। ভারী পিসিএ পদ্ধতির উপস্থিতি খুব বেশি উল্লেখ করবেন না যা আপনি কোনওভাবে আরপিসিএ প্রসঙ্গে উল্লেখ করেন না।
usεr11852

ক্ষমা চাওয়ার দরকার নেই :) দুটি পদ্ধতি খুব আলাদা, বিশেষত ছোট ডেটাসেটের ক্ষেত্রে। এগুলি যেভাবে আলাদা সেগুলির একটিতে আমার প্রশ্নের শেষে উল্লেখ করা হয়েছে। (শক্তিশালী) পিসিএটিকে প্রজেকশন সমস্যা হিসাবে দেখা যেতে পারে, তবে এটি একটি সমবায় অনুমানের সমস্যা হিসাবেও ব্যাখ্যা করা যেতে পারে, তাই প্রয়োগ এবং কার্য সম্পাদনের চেয়ে পরামিতি অনুমান পদ্ধতিতে পার্থক্য কম রয়েছে।
মোস্তফা এস আইসা

@ মোস্তফাএসইসা / চমৎকার প্রশ্ন! আমি মনে করি এটি পদ্ধতিগত ভিত্তিতে উত্তর দেওয়া যেতে পারে: বাস্তবে এটি আমার পিট শখগুলির মধ্যে একটি। আমি asap হিসাবে একটি অস্থায়ী উত্তর চেষ্টা করব। গড় সময়ে; আমি মনে করি এটি আরও সাধারণ শর্তে এটির কাছে যাওয়ার একটি কার্যকর উপায় হ'ল নেস্টেড তবে অসম গ্রুপের অদম্যতা সহ মডেলগুলি ব্যবহারের পরিণতিগুলি। আমি এখানে কিছুটা ভিন্ন প্রসঙ্গে করার চেষ্টা করি ।
ব্যবহারকারী 60

উত্তর:


7

এই কাগজটি এই অঞ্চলে কিছু পদ্ধতির তুলনা করে। তারা আপনাকে "পিসিপি" (মূল উপাদানগুলি অনুসরণ) এবং এম-এসেক্টর হিসাবে শক্তিশালী কোভেরিয়েন্স অনুমানের জন্য যে পদ্ধতিগুলির সাথে আপনি সংযুক্ত করেছেন তার পরিবার হিসাবে সংযুক্ত রবস্ট পিসিএ পদ্ধতির উল্লেখ করে।

তারা তর্ক করে

পিসিপি ডেটাগুলির অভিন্ন দূষিত স্থানাঙ্কগুলির জন্য তৈরি করা হয়েছে, পরিবর্তিত ডেটা পয়েন্টগুলির পরিবর্তে (যেমন, আউটলিয়ার), সুতরাং, পিসিপির সাথে তুলনা এই ধরণের ডেটার জন্য কিছুটা অন্যায্য

এবং দেখান যে পিসিপি (ওরফে শক্তিশালী পিসিএ) কিছু ক্ষেত্রে আউটলেট সনাক্তকরণে ব্যর্থ হতে পারে।

তারা তিন ধরণের "সাবস্পেস পুনরুদ্ধারের শত্রু", অর্থাত্ বিভিন্ন ধরণের আউটলিয়ারদের নিয়েও কথা বলে এবং কোন ধরণের পদ্ধতিগুলি প্রতিটিটির সাথে ডিল করার জন্য ভাল করতে পারে। এখানে আলোচিত তিন ধরণের "শত্রুদের" সাথে আপনার নিজস্ব বিনিয়োগকারীদের তুলনা করা আপনাকে একটি উপায় বেছে নিতে সহায়তা করতে পারে।


এই ডেভিডের জন্য ধন্যবাদ, আমি কাগজটি একবার দেখব। যাইহোক, শক্তিশালী পিসিএর একটি সংস্করণ রয়েছে যা স্থানাঙ্ক (যেমন ক্যান্ডস কেসে) হিসাবে জরিমানার পরিবর্তে ডেটাম (ডেটা ম্যাট্রিক্সের সারি )গুলিতে একটি ঘোরালোক-আক্রমণকারী জরিমানা আরোপ করে। থটস?
মোস্তফা এস আইসা

আমি নিশ্চিত না যে আমি আপনার প্রশ্নটি বুঝতে পেরেছি। আপনি কি আমাকে আপনার প্রশ্নে আলোচিত দুটি পদ্ধতির একটি আলাদা শক্ত পিসিএ পদ্ধতির সাথে তুলনা করতে বলছেন?
ডেভিড জে হ্যারিস

11

যদি আপনার উত্তরটি হয়, "না" এটি পুরোপুরি ঠিক আছে আমি ভাবছি।
মোস্তফা এস আইসা

আচ্ছা বুঝলাম. মহালানোবিস দূরত্বের এটি কি বিশেষ ঘটনা হবে?
ডেভিড জে হ্যারিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.