আমার দুটি গ্রুপ, এ, এবং বি রয়েছে, যার প্রতিটি প্রায় 400 এর আকার এবং প্রায় 300 ভবিষ্যদ্বাণীকারী। আমার লক্ষ্য বাইনারি প্রতিক্রিয়া ভেরিয়েবলের জন্য পূর্বাভাস মডেল তৈরি করা। আমার গ্রাহক এ অন বি থেকে তৈরি মডেলটি প্রয়োগের ফলাফল দেখতে চান (তাঁর বই "রিগ্রেশন মডেলিং কৌশলগুলি", @ ফ্র্যাঙ্কহারেল উল্লেখ করেছেন যে দুটি ডাটা্যাসেট একত্রিত করা এবং তার উপর একটি মডেল তৈরি করা আরও ভাল, যেহেতু এটি যুক্ত করা হয়েছে শক্তি এবং নির্ভুলতা --- পৃষ্ঠাটি 90 দেখুন, বাহ্যিক বৈধতা I আমার কাছে যে ধরণের ডেটা রয়েছে তা সংগ্রহ করা খুব ব্যয়বহুল এবং সময়সাপেক্ষ considering বিবেচনা করে আমি তার সাথে একমত হতে চাই But তবে গ্রাহক কী চান সে সম্পর্কে আমার কোনও পছন্দ নেই ।) আমার অনেক ভবিষ্যদ্বাণীকারী অত্যন্ত সংযুক্ত এবং খুব স্কিউড। আমি আমার ভবিষ্যদ্বাণীমূলক মডেলটি তৈরি করতে লজিস্টিক রিগ্রেশন ব্যবহার করছি।
আমার ভবিষ্যদ্বাণীকারীরা মূলত যান্ত্রিক থেকে আসে। উদাহরণস্বরূপ, মোট সময় বিষয় একটি স্ট্রেস থ্রেশহোল্ড বেশী অধীন ছিল সময়ের জন্য [ T 1 , T 2 ] , বিভিন্ন মানের জন্য α > 0 এবং 0 ≤ টি 1 < T 2 । এটি স্পষ্ট যে কেবল তাদের সংজ্ঞা থেকেই এই মোট বেশিরভাগ সময় বীজগণিতভাবে একে অপরের সাথে সম্পর্কিত। বয়গণিতভাবে সম্পর্কিত না এমন অনেক পূর্বাভাসকারী তাদের প্রকৃতির কারণে সম্পর্কিত: যে বিষয়গুলি সময়কালে উচ্চ চাপের মধ্যে থাকে [ টি 1 , টি 2 ]সময় সময়কালে উচ্চ চাপের হতে থাকে , এমনকি যদি [ T 1 , T 2 ] ∩ [ T 3 , টি 4 ] = ∅ । তথ্যের মাত্রা হ্রাস করতে, আমি সম্পর্কিত ভবিষ্যদ্বাণীকারীদের একসাথে ক্লাস্টার করেছি (উদাহরণস্বরূপ, সমস্ত স্ট্রেসের সময় একসাথে) এবং প্রতিটি ক্লাস্টারের প্রতিনিধিত্ব করার জন্য মূল উপাদান বিশ্লেষণ ব্যবহার করেছি। ভেরিয়েবলগুলি স্কিউড হওয়ার কারণে আমি দুটি বিকল্প পথ চেষ্টা করেছিলাম:
- পিসিএ করার আগে, আমি ভেরিয়েবলগুলির স্কিউ হ্রাস করতে লোগারিদমিক ট্রান্সফর্মেশন ব্যবহার করি।
- আমি মিয়া হুবার্টের আরওবিপিসিএ অ্যালগরিদম ব্যবহার করেছি, যেমন দৃ ,় প্রধান উপাদানগুলি খুঁজে পেতে আর, (প্যাকএহবার্ট) প্যাকেজ আরসিআরভ দ্বারা প্রয়োগ করা হয়েছিল।
আমি আরওসি বক্ররেখার সামগ্রিক আকার, নির্ভুলতা-পুনর্বিবেচনা বক্ররের আকৃতি এবং আরওসি বক্ররেখার (এউসি) এর আওতাধীন অঞ্চলটিকে আমার পারফরম্যান্সের ব্যবস্থা হিসাবে ব্যবহার করছি এবং আমি এ এবং বি উভয় ডেটাসেটের জন্য একই রকম ফলাফল পেতে চাই like আমি দৃust় প্রধান উপাদানগুলি ব্যবহার করে আরও ভাল ফলাফল পাওয়ার প্রত্যাশা ছিলাম, তবে আমার অবাক করে দিয়েছি যে প্রথম পদ্ধতিটি আরও ভাল করেছে: ডেটাসেট এ এবং বি উভয়ের জন্য আরও ভাল এউসি মান, আরওসি বক্ররেখার মধ্যে আরও মিল এবং আরও অনুরূপ নির্ভুলতা-প্রত্যাহার রেখাচিত্র।
এর ব্যাখ্যা কী? এবং আমার ডেটাটিকে সাধারণ দেখানোর পরিবর্তে আমি কীভাবে শক্তিশালী প্রধান উপাদানগুলি ব্যবহার করতে পারি? আরওপিপিসিএর পরিবর্তে এমন কোনও শক্তিশালী পিসিএ পদ্ধতি রয়েছে যা আপনি সুপারিশ করবেন?