ফরোয়ার্ড স্টেজওয়াইজ রিগ্রেশন অ্যালগরিদম কী?

সম্ভবত এটি কেবল ক্লান্ত হয়ে পড়েছি তবে ফরোয়ার্ড স্টেজওয়াইজ রিগ্রেশন অ্যালগরিদম বোঝার চেষ্টা করতে আমার সমস্যা হচ্ছে। থেকে "পরিসংখ্যানগত শিক্ষণ উপাদানসমূহ" পৃষ্ঠা 60:

ফরোয়ার্ড-স্টেজওয়্যার রিগ্রেশন (এফএস) ফরোয়ার্ড-স্টেপওয়াইজ রিগ্রেশন-এর চেয়েও বেশি বাধা। এটি শুরু হয় ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে পরিণত করা হয় না এবং কেন্দ্রিক পূর্বাভাসকারীদের শুরুতে সমস্ত 0 হয়।

প্রতিটি পদক্ষেপে অ্যালগরিদম সনাক্তকরণ - চলকটি বর্তমানের অবশিষ্টাংশের সাথে সর্বাধিক সম্পর্কিত। এরপরে এটি নির্বাচিত পরিবর্তনশীলটির অবলম্বনের সাধারণ লিনিয়ার রিগ্রেশন কো-সিএনটি গণনা করে, এবং তারপরে এটিকে চলকটির জন্য বর্তমান কো-ই-সিটিয়েন্টে যুক্ত করে। এটি চলমান অবধি অব্যাহত থাকবে যতক্ষণ না কোনও ভেরিয়েবলের অবশিষ্টাংশের সাথে সম্পর্ক থাকে — যেমন সর্বনিম্ন-বর্গক্ষেত্র N t যখন এন> পি হয়।

সুতরাং, এটি কি অ্যালগরিদম ?:

b[1]=mean(y)
b[2..n]=0
r=(y-X*b)
index, maxCorr = max(transpose(r)*X)
while(abs(maxCorr) > someThreshold)
  b[index]=b[index]+regress(r,X[1..n][index])
  r=(y-X*b)
  index, maxCorr = max(transpose(r)*X)

যেখানে বি সহগের একটি কলাম-ভেক্টর, এক্স ইনপুটগুলির একটি ম্যাট্রিক্স এবং y আউটপুটগুলির কলাম-ভেক্টর। অর্থাত y = এক্স * বি + ত্রুটি।

জিজ্ঞাসা করা হচ্ছে কারণ এই অ্যালগরিদমটি আমাকে ডেটাসেটটিতে পরীক্ষা করছে (থ্রেশহোল্ড = .0001 সহ) কেবলমাত্র কয়েকটি অ-শূন্য সহগ রয়েছে, এবং পূর্বাভাসের সঠিকতা মোটেই খুব ভাল নয়।

regression algorithms feature-selection

— ektrules
সূত্র

তারা লেখকরা তাদের বইয়ের অ্যালগরিদম ব্যাখ্যা করার জন্য একটি খারাপ কাজ করে। আপনি যদি তাদের কাগজে 1.6 এবং 1.7 সমীকরণগুলি দেখেন তবে এটি আরও স্পষ্ট হয়ে যায়। কাগজটির কিছুটা আলাদা গঠন রয়েছে (এটি গুণাগুণ ভেক্টরের পরিবর্তে অবশিষ্টাংশ তৈরি করে) তবে মূল বক্তব্যটি এটি খুব ছোট পদক্ষেপে খুব কম ফিট হয়ে যায় (এই কারণেই এই বইটিতে আলগোরিদিম উল্লেখ করা যেতে পারে "আরও অনেকগুলি নিতে পারে" "ধাপ শেষ" চেয়ে। আপনি "কিছুটা সংখ্যক সংখ্যার সাথে" (রিগ্রাস (...) "প্রতিস্থাপন করতে পারেন, বা আপনি 0.05 এর মতো কিছু দিয়ে এটি গুণতে পারেন। এটি নিয়ে চারপাশে খেলুন এবং দেখুন কী কাজ করে।

এছাড়াও, আপনার প্রান্তিকতা ছোট বলে মনে হচ্ছে। আর '* এক্স সংখ্যার আনুপাতিক তুলনায় তুলনামূলক তুলনায় তুলনামূলক তুলনামূলক তুলনামূলক তুলনামূলক তুলনা করে যা প্রকৃত সম্পর্কের তুলনায় অনেক বড় (যেমন কাগজে ডায়াবেটিসের তথ্যের জন্য পারস্পরিক সম্পর্ক ~ 70-900)।

— কেভিন
সূত্র