আইসিএর জন্য প্রথমে পিসিএ চালানো দরকার?


9

আমি একটি অ্যাপ্লিকেশন-ভিত্তিক কাগজ পর্যালোচনা করে বলেছিলাম যে আইসিএ প্রয়োগ করার আগে পিসিএ প্রয়োগ করা (ফাস্টিকা প্যাকেজ ব্যবহার করে)। আমার প্রশ্ন হ'ল, আইসিএ (ফাস্টিকা) প্রথমে পিসিএ চালানো দরকার?

এই কাগজ যে উল্লেখ

... এটি যুক্তিযুক্ত যে পিসিএ প্রাক প্রয়োগকারী আইসিএর কার্যকারিতা বৃদ্ধি করে (1) সাদা করার আগে ছোট ট্রিলিং ইগন্যাল্যগুলি বর্জন করে এবং (2) জোড়-ভিত্তিক নির্ভরতা হ্রাস করে গণনা জটিলতা হ্রাস করে। পিসিএ ইনপুট ডেটা সজ্জিত করে; অবশিষ্ট উচ্চতর অর্ডার নির্ভরতা আইসিএ দ্বারা পৃথক করা হয়।

এছাড়াও অন্যান্য কাগজপত্রগুলি আইসিএর আগে পিসিএ প্রয়োগ করছে, যেমন এটি

আইসিএর আগে পিসিএ চালানোর জন্য কি অন্য কোনও উপকারিতা এবং কনস রয়েছে? রেফারেন্স সহ তত্ত্ব প্রদান করুন।


এই প্রকাশিত কাজটি আইসিএ-তে পিসিএ-ভিত্তিক মাত্রিক হ্রাসের বিরূপ প্রভাব খুঁজে পায়।
বনোব

উত্তর:


9

ফাস্টিকএ পদ্ধতির একটি প্রাক-সাদা করার পদক্ষেপের প্রয়োজন: ডেটা প্রথমে পিসিএ ব্যবহার করে রূপান্তরিত হয় যা একটি তির্যক কোভেরিয়েন্স ম্যাট্রিক্সের দিকে পরিচালিত করে এবং তারপরে প্রতিটি মাত্রা এমনভাবে স্বাভাবিক করা হয় যে কোভেরিয়েন্স ম্যাট্রিক্স আইডেন্টিটি ম্যাট্রিক্সের (সাদা রঙের) সমান হয়।

তথ্যের অসীম রূপান্তর রয়েছে যার ফলস্বরূপ পরিচয় কোভরিয়েন্স ম্যাট্রিক্স হয় এবং যদি আপনার উত্সগুলি গাউসিয়ান হয় তবে আপনি সেখানে থামতেন (গাউসীয় মাল্টিভারিয়েট বিতরণগুলির জন্য, গড় এবং সমবায় যথেষ্ট পরিমাণের পরিসংখ্যান), অ গাউসীয় উত্সগুলির উপস্থিতিতে আপনি কিছুটা হ্রাস করতে পারেন ঝকঝকে ডেটার উপর নির্ভরতার পরিমাপ, অতএব আপনি স্বাদযুক্ত ডেটা ঘোরানোর জন্য সন্ধান করেন যা স্বাধীনতা সর্বাধিক করে তোলে। ফাস্টিকা তথ্য তাত্ত্বিক ব্যবস্থা এবং একটি নির্দিষ্ট পয়েন্ট পুনরাবৃত্তি স্কিম ব্যবহার করে এটি অর্জন করে।

আমি সমস্যার আরও গভীর ধারণা পেতে হাইভরিনেনের কাজের পরামর্শ দেব:

  • উ: হাইভুরিন স্বতন্ত্র উপাদান বিশ্লেষণের জন্য দ্রুত এবং দৃust় স্থির-পয়েন্ট অ্যালগরিদম। নিউরাল নেটওয়ার্কগুলিতে আইইইই লেনদেনগুলি 10 (3): 626-634, 1999।
  • এ। হাইভরিনেন, জে। করহুনেন, ই। ওজা, স্বতন্ত্র উপাদান বিশ্লেষণ, উইলি অ্যান্ড সন্স। 2001

দয়া করে নোট করুন যে পিসিএ করা এবং মাত্রা হ্রাস করা ঠিক একই জিনিস নয়: যখন আপনার সিগন্যালের চেয়ে বেশি পর্যবেক্ষণ (প্রতি সিগন্যাল) থাকে, আপনি বর্ণিত বৈকল্পিকতার 100% ধরে রেখে একটি পিসিএ করতে পারেন, এবং তারপরে হোয়াইটেনিং এবং নির্দিষ্ট পয়েন্ট পুনরাবৃত্তির সাথে চালিয়ে যেতে পারেন স্বাধীন উপাদানগুলির একটি অনুমান পেতে obtain আপনার মাত্রা হ্রাস করা উচিত কিনা তা অত্যন্ত প্রাসঙ্গিক নির্ভর এবং এটি আপনার মডেলিং অনুমান এবং ডেটা বিতরণের উপর ভিত্তি করে।


2
এটি একটি ভাল উত্তর, তবে যতদূর আমি জানি আপনার শেষ পয়েন্টটি আরও শক্তিশালী করা যেতে পারে: মাত্রিকতা হ্রাস করার জন্য পিসিএ পদক্ষেপটি ব্যবহার করা প্রায়শই একটি ভাল ধারণা (ডেটা সাদা করার পাশাপাশি)। আসলে, যদি মাত্রিক মাত্রা খুব বেশি হয় তবে আইসিএ সহজেই অনর্থক উপাদানগুলিকে উপস্থাপন করতে পারে এবং উত্পাদন করতে পারে। পিসিএর সাথে প্রাক-প্রক্রিয়াজাতকরণ প্রায়শই এই সমস্যাটি সমাধান করে (যেমনটি ওপিতে উদ্ধৃতি হিসাবে যুক্তিযুক্ত)।
অ্যামিবা

4

আপনার ডেটাতে পিসিএ প্রয়োগ করার ফলে মূল স্থানাঙ্ক অক্ষগুলি ঘোরানোর একমাত্র প্রভাব রয়েছে। এটি একটি লিনিয়ার রূপান্তর, ঠিক যেমন ফুরিয়ার রূপান্তর। সুতরাং এটি আপনার ডেটাতে আসলে কিছুই করতে পারে না।

তবে নতুন পিসিএ স্পেসে উপস্থাপিত ডেটার কিছু আকর্ষণীয় বৈশিষ্ট্য রয়েছে। পিসিএর সাথে সমন্বয় ঘূর্ণন অনুসরণ করে, আপনি প্রতিষ্ঠিত মানদণ্ডের উপর ভিত্তি করে কিছু মাত্রা বাতিল করতে পারেন যেমন নতুন অক্ষ দ্বারা ব্যাখ্যা করা মোট বৈকল্পিকের শতাংশের পরিমাণ। আপনার সিগন্যালের উপর নির্ভর করে আপনি এই পদ্ধতিটি দ্বারা যথেষ্ট পরিমাণে মাত্রিক হ্রাস অর্জন করতে পারেন এবং এটি অবশ্যই নিম্নলিখিত আইসিএর কার্যকারিতা বাড়িয়ে তুলবে। পিসিএর কোনও উপাদান বাদ দিয়ে আইসিএ করা নিচের আইসিএর ফলাফলের উপর কোনও প্রভাব ফেলবে না।

তদ্ব্যতীত, স্থানাঙ্ক অক্ষগুলির অরথোগোনালটির কারণে পিসিএ স্পেসে ডেটা সহজেই সাদা করা যায়। হাইটেনিংয়ের সমস্ত মাত্রা জুড়ে বৈচিত্র্য সমান করার প্রভাব রয়েছে। আমি যুক্তি দিয়ে বলব যে আইসিএ সঠিকভাবে কাজ করার জন্য এটি প্রয়োজনীয় is অন্যথায় বৃহত্তম বৈকল্পিকগুলি সহ কয়েকটি পিসিএ উপাদানই আইসিএ ফলাফলগুলিতে প্রভাব ফেলবে।

আইসিএর আগে পিসিএ ভিত্তিক প্রিপ্র্রোসেসিংয়ের জন্য আমি সত্যিই কোনও ত্রুটি দেখতে পাচ্ছি না।

জিয়ানকার্লো ইতিমধ্যে আইসিএর জন্য সর্বোত্তম রেফারেন্স উল্লেখ করেছেন ...


আপনার পুরো উত্তরটি এই ভিত্তিতে ভিত্তি করে তৈরি হয়েছে যে পিসিএ প্রয়োগ করা কেবল স্থানাঙ্ক অক্ষকে ঘোরানো হয়, তবে বাস্তবে "পিসিএ প্রয়োগ" করার মাধ্যমে লোকেরা সাধারণত মাত্রিকতা হ্রাস বোঝায় (অর্থাত পিসিগুলির কেবলমাত্র একটি উপসেট রাখা এবং বাকী অংশগুলি বাদ দেওয়া)।
অ্যামিবা

পিসিএ আপনাকে কোন মাত্রা বাতিল করতে হবে তা খুঁজে পেতে সহায়তা করে। আমি দেখতে পাচ্ছি না কীভাবে এটি আমার উত্তরটি সুর করে।
বনোবো

ইতিমধ্যে এই কাজটি প্রকাশিত হয়েছে, তারা দাবি করে যে পরবর্তী আইসিএর মানের উপর পিসিএ ভিত্তিক মাত্রিক হ্রাসের বিরূপ প্রভাব দেখায়।
বনোব

লিঙ্কের জন্য ধন্যবাদ। আমি বিমূর্তটি পড়েছি এবং সত্যি বলতে আমি সন্দেহবাদী। তবে আমি আইসিএ তে বিশেষজ্ঞ নই এবং সম্ভবত এই কাগজটি বিস্তারিতভাবে অধ্যয়ন করতে যাচ্ছি না।
অ্যামিবা

2

ফাস্টআইসিএ অ্যালগরিদমের উত্পন্নকরণের জন্য কেবলমাত্র একটি পদক্ষেপের জন্য সাদা করা প্রয়োজন। প্রথমত, আপনি পদক্ষেপের দিকটি বেছে নিন (গ্রেডিয়েন্ট বংশদ্ভুতের মতো) এবং এর জন্য সাদা রঙের ডেটা প্রয়োজন হয় না। তারপরে, আমাদের ধাপের আকারটি বাছাই করতে হবে, যা হেসিয়ানটির বিপরীতে নির্ভর করে। যদি ডেটা সাদা হয় তবে এই হেসিয়ানটি তির্যক এবং অবিচ্ছিন্ন ver

সুতরাং এটি প্রয়োজনীয়? আপনি যদি কেবলমাত্র ধাপের আকারটিকে একটি ধ্রুবক হিসাবে স্থির করেন (সুতরাং ঝকঝকে করার প্রয়োজন হয় না) আপনার স্ট্যান্ডার্ড গ্রেডিয়েন্ট বংশোদ্ভূত হবে। একটি নির্দিষ্ট ছোট পদক্ষেপের আকার সহ গ্রেডিয়েন্ট বংশোদ্ভূত সাধারণত একত্রিত হবে তবে সম্ভবত সম্ভবত মূল পদ্ধতির চেয়ে অনেক ধীর। অন্যদিকে, আপনার কাছে যদি একটি বড় ডেটা ম্যাট্রিক্স থাকে তবে হোয়াইটেনিং বেশ ব্যয়বহুল হতে পারে। ঝকঝকে না করে আপনি যে ধীরে ধীরে ধীরে ধীরে কনভার্ভেশন পান তা থেকেও আপনি ভাল হতে পারেন।

কোনও সাহিত্যে এর উল্লেখ না দেখে আমি অবাক হয়েছি। একটি গবেষণামূলক সমস্যাটি নিয়ে আলোচনা করা হয়েছে: জিমিন ইয়ে এবং টিং হুয়াংয়ের পূর্বনির্ধারিত ছাড়াই অন্ধ উত্স পৃথককরণের জন্য নতুন ফাস্ট-আইসিএ অ্যালগরিদম

তারা সাদা করার জন্য কিছুটা সস্তা বিকল্পের পরামর্শ দেয়। আমি আশা করি তারা বেসলাইন হিসাবে হোয়াইট না করে কেবল আইসিএ চালানোর সুস্পষ্ট তুলনাটি অন্তর্ভুক্ত করেছিল, তবে তারা তা করেন নি। আরও একটি ডেটা পয়েন্ট হিসাবে আমি খেলনার সমস্যার ঝকঝকে না করে ফাস্টিকা চালানোর চেষ্টা করেছি এবং এটি দুর্দান্ত কাজ করেছে।

আপডেট করুন: আরেকটি চমৎকার রেফারেন্স অ্যাড্রেসিং ঝকঝকে এখানে: শক্তসমর্থ স্বাধীন উপাদান বিশ্লেষণ, Zaroso এবং Comon । তারা এমন অ্যালগরিদম সরবরাহ করে যা সাদা করার প্রয়োজন হয় না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.