প্রকৃতপক্ষে, কোনও গ্যারান্টি নেই যে শীর্ষ প্রধান উপাদানগুলির (পিসি) কম ভেরিয়েন্সগুলির চেয়ে বেশি ভবিষ্যদ্বাণীপূর্ণ শক্তি রয়েছে।
বাস্তব-বিশ্বের উদাহরণগুলি পাওয়া যাবে যেখানে এটি নয় এবং এটি একটি কৃত্রিম উদাহরণ তৈরি করা সহজ যেখানে উদাহরণস্বরূপ কেবল ক্ষুদ্রতম পিসির সাথে কোনও সম্পর্ক রয়েছে ।y
এই বিষয়টি আমাদের ফোরামে প্রচুর আলোচনা করা হয়েছিল, এবং (দুর্ভাগ্যজনকভাবে) একটি স্পষ্টতই ক্যানোনিকাল থ্রেডের অনুপস্থিতিতে আমি কেবল কয়েকটি লিঙ্ক দিতে পারি যা একসাথে বিভিন্ন বাস্তব জীবন এবং কৃত্রিম উদাহরণ প্রদান করে:
এবং একই বিষয়, তবে শ্রেণিবিন্যাসের প্রসঙ্গে:
যাইহোক, বাস্তবে, শীর্ষ পিসিতে প্রায়ই না প্রায়ই কম ভ্যারিয়েন্স বেশী ভবিষ্যদ্বাণীপূর্ণ ক্ষমতা, এবং তাছাড়া শুধুমাত্র উপরের পিসিতে ব্যবহার সব পিসিতে ব্যবহার বেশী ভালো ভবিষ্যদ্বাণীপূর্ণ ক্ষমতা উত্পাদ পারেন।
অনেক ভবিষ্যদ্বাণীকারী এবং তুলনামূলকভাবে কয়েকটি ডেটা পয়েন্ট (যেমন যখন বা এমনকি ) থাকে এমন পরিস্থিতিতে সাধারণ রিগ্রেশন অতিরিক্ত উপায়ে যায় এবং এটি নিয়মিত করা দরকার। প্রিন্সিপাল কম্পোনেন্ট রিগ্রেশন (পিসিআর )টিকে রিগ্রেশন নিয়মিত করার এক উপায় হিসাবে দেখা যেতে পারে এবং উচ্চতর ফলাফল দেওয়ার প্রবণতা থাকবে। তদতিরিক্ত, এটি রিজ রিগ্রেশনটির সাথে ঘনিষ্ঠভাবে সম্পর্কিত, যা সঙ্কুচিত নিয়মিতকরণের একটি মানক উপায় way যেখানে রিজ রিগ্রেশন ব্যবহার করা সাধারণত একটি ভাল ধারণা, পিসিআর প্রায়শই যুক্তিসঙ্গতভাবে ভাল আচরণ করে। দেখুন কেন সংকোচন কাজ করে? পক্ষপাত-বৈকল্পিক ট্রেডঅফ এবং সংকোচন কীভাবে উপকারী হতে পারে সে সম্পর্কে সাধারণ আলোচনার জন্য।n p ≈ n p > npnp≈np>n
একটি উপায়ে, কেউ বলতে পারেন যে রিজ রিগ্রেশন এবং পিসিআর উভয়ই অনুমান করে যে সর্বাধিক তথ্য এর বৃহত পিসিগুলিতে রয়েছে এবং এই ধারণাটি প্রায়শই নিশ্চিত হয়।এক্সyX
কেন এই ধারণাটি প্রায়শই সুনিশ্চিত করা হয় (এবং এই আরও নতুন থ্রেড: মাত্রিক মাত্রা হ্রাস প্রায় সবসময় শ্রেণিবদ্ধের জন্য কার্যকর ? আরও কিছু মন্তব্যের জন্য) পরবর্তী আলোচনার জন্য @cbeleites (+1) এর পরবর্তী উত্তর দেখুন ।
হাসিটি এট আল। মধ্যে পরিসংখ্যানগত শিক্ষণ উপাদানসমূহ (অধ্যায় 3.4.1) শৈলশিরা রিগ্রেশন প্রেক্ষাপটে এই মন্তব্য:
[টি] তিনি ছোট একবাক্য মানগুলি [...] এর কলাম স্পেসের দিকের সাথে সামঞ্জস্যপূর্ণ এবং তারতম্যটি এই দিকগুলিকে সবচেয়ে সঙ্কুচিত করে। [...] রিজ রিগ্রেশন সংক্ষিপ্ত দিকগুলির অনুমানযুক্ত গ্রেডিয়েন্টগুলির সম্ভাব্য উচ্চতর বৈকল্পিকতা থেকে রক্ষা করে। অন্তর্নিহিত অনুমানটি হ'ল প্রতিক্রিয়াগুলি ইনপুটগুলির উচ্চতর বৈকল্পিকতার দিক থেকে সর্বাধিক পরিবর্তিত হয়। এটি প্রায়শই একটি যুক্তিসঙ্গত অনুমান, যেহেতু ভবিষ্যদ্বাণীকারীরা প্রায়শই অধ্যয়নের জন্য বেছে নেওয়া হয় কারণ প্রতিক্রিয়া পরিবর্তনের সাথে তারা পরিবর্তিত হয়, তবে সাধারণভাবে ধরে রাখার প্রয়োজন হয় না।X
বিশদগুলির জন্য নিম্নলিখিত উত্তরগুলিতে আমার উত্তরগুলি দেখুন:
শেষের সারি
উচ্চ-মাত্রিক সমস্যার জন্য, পিসিএর প্রাক প্রসেসিং (যার অর্থ মাত্রা হ্রাস করা এবং কেবল শীর্ষ পিসি রাখা) নিয়মিতকরণের এক উপায় হিসাবে দেখা যেতে পারে এবং প্রায়শই কোনও পরবর্তী বিশ্লেষণের ফলাফলগুলিতে উন্নতি করতে হবে, তা কোনও প্রতিক্রিয়া বা শ্রেণিবিন্যাস পদ্ধতি হতে পারে। তবে এটি কাজ করবে এমন কোনও গ্যারান্টি নেই এবং প্রায়শই আরও ভাল নিয়মিতকরণের পদ্ধতি রয়েছে।