সম্ভবত এটি কেবল ক্লান্ত হয়ে পড়েছি তবে ফরোয়ার্ড স্টেজওয়াইজ রিগ্রেশন অ্যালগরিদম বোঝার চেষ্টা করতে আমার সমস্যা হচ্ছে। থেকে "পরিসংখ্যানগত শিক্ষণ উপাদানসমূহ" পৃষ্ঠা 60:
ফরোয়ার্ড-স্টেজওয়্যার রিগ্রেশন (এফএস) ফরোয়ার্ড-স্টেপওয়াইজ রিগ্রেশন-এর চেয়েও বেশি বাধা। এটি শুরু হয় ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে পরিণত করা হয় না এবং কেন্দ্রিক পূর্বাভাসকারীদের শুরুতে সমস্ত 0 হয়।
প্রতিটি পদক্ষেপে অ্যালগরিদম সনাক্তকরণ - চলকটি বর্তমানের অবশিষ্টাংশের সাথে সর্বাধিক সম্পর্কিত। এরপরে এটি নির্বাচিত পরিবর্তনশীলটির অবলম্বনের সাধারণ লিনিয়ার রিগ্রেশন কো-সিএনটি গণনা করে, এবং তারপরে এটিকে চলকটির জন্য বর্তমান কো-ই-সিটিয়েন্টে যুক্ত করে। এটি চলমান অবধি অব্যাহত থাকবে যতক্ষণ না কোনও ভেরিয়েবলের অবশিষ্টাংশের সাথে সম্পর্ক থাকে — যেমন সর্বনিম্ন-বর্গক্ষেত্র N t যখন এন> পি হয়।
সুতরাং, এটি কি অ্যালগরিদম ?:
b[1]=mean(y)
b[2..n]=0
r=(y-X*b)
index, maxCorr = max(transpose(r)*X)
while(abs(maxCorr) > someThreshold)
b[index]=b[index]+regress(r,X[1..n][index])
r=(y-X*b)
index, maxCorr = max(transpose(r)*X)
যেখানে বি সহগের একটি কলাম-ভেক্টর, এক্স ইনপুটগুলির একটি ম্যাট্রিক্স এবং y আউটপুটগুলির কলাম-ভেক্টর। অর্থাত y = এক্স * বি + ত্রুটি।
জিজ্ঞাসা করা হচ্ছে কারণ এই অ্যালগরিদমটি আমাকে ডেটাসেটটিতে পরীক্ষা করছে (থ্রেশহোল্ড = .0001 সহ) কেবলমাত্র কয়েকটি অ-শূন্য সহগ রয়েছে, এবং পূর্বাভাসের সঠিকতা মোটেই খুব ভাল নয়।