ফরোয়ার্ড স্টেজওয়াইজ রিগ্রেশন অ্যালগরিদম কী?


14

সম্ভবত এটি কেবল ক্লান্ত হয়ে পড়েছি তবে ফরোয়ার্ড স্টেজওয়াইজ রিগ্রেশন অ্যালগরিদম বোঝার চেষ্টা করতে আমার সমস্যা হচ্ছে। থেকে "পরিসংখ্যানগত শিক্ষণ উপাদানসমূহ" পৃষ্ঠা 60:

ফরোয়ার্ড-স্টেজওয়্যার রিগ্রেশন (এফএস) ফরোয়ার্ড-স্টেপওয়াইজ রিগ্রেশন-এর চেয়েও বেশি বাধা। এটি শুরু হয় ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে পরিণত করা হয় না এবং কেন্দ্রিক পূর্বাভাসকারীদের শুরুতে সমস্ত 0 হয়।

প্রতিটি পদক্ষেপে অ্যালগরিদম সনাক্তকরণ - চলকটি বর্তমানের অবশিষ্টাংশের সাথে সর্বাধিক সম্পর্কিত। এরপরে এটি নির্বাচিত পরিবর্তনশীলটির অবলম্বনের সাধারণ লিনিয়ার রিগ্রেশন কো-সিএনটি গণনা করে, এবং তারপরে এটিকে চলকটির জন্য বর্তমান কো-ই-সিটিয়েন্টে যুক্ত করে। এটি চলমান অবধি অব্যাহত থাকবে যতক্ষণ না কোনও ভেরিয়েবলের অবশিষ্টাংশের সাথে সম্পর্ক থাকে — যেমন সর্বনিম্ন-বর্গক্ষেত্র N t যখন এন> পি হয়।

সুতরাং, এটি কি অ্যালগরিদম ?:

b[1]=mean(y)
b[2..n]=0
r=(y-X*b)
index, maxCorr = max(transpose(r)*X)
while(abs(maxCorr) > someThreshold)
  b[index]=b[index]+regress(r,X[1..n][index])
  r=(y-X*b)
  index, maxCorr = max(transpose(r)*X)

যেখানে বি সহগের একটি কলাম-ভেক্টর, এক্স ইনপুটগুলির একটি ম্যাট্রিক্স এবং y আউটপুটগুলির কলাম-ভেক্টর। অর্থাত y = এক্স * বি + ত্রুটি।

জিজ্ঞাসা করা হচ্ছে কারণ এই অ্যালগরিদমটি আমাকে ডেটাসেটটিতে পরীক্ষা করছে (থ্রেশহোল্ড = .0001 সহ) কেবলমাত্র কয়েকটি অ-শূন্য সহগ রয়েছে, এবং পূর্বাভাসের সঠিকতা মোটেই খুব ভাল নয়।

উত্তর:


5

তারা লেখকরা তাদের বইয়ের অ্যালগরিদম ব্যাখ্যা করার জন্য একটি খারাপ কাজ করে। আপনি যদি তাদের কাগজে 1.6 এবং 1.7 সমীকরণগুলি দেখেন তবে এটি আরও স্পষ্ট হয়ে যায়। কাগজটির কিছুটা আলাদা গঠন রয়েছে (এটি গুণাগুণ ভেক্টরের পরিবর্তে অবশিষ্টাংশ তৈরি করে) তবে মূল বক্তব্যটি এটি খুব ছোট পদক্ষেপে খুব কম ফিট হয়ে যায় (এই কারণেই এই বইটিতে আলগোরিদিম উল্লেখ করা যেতে পারে "আরও অনেকগুলি নিতে পারে" "ধাপ শেষ" চেয়ে। আপনি "কিছুটা সংখ্যক সংখ্যার সাথে" (রিগ্রাস (...) "প্রতিস্থাপন করতে পারেন, বা আপনি 0.05 এর মতো কিছু দিয়ে এটি গুণতে পারেন। এটি নিয়ে চারপাশে খেলুন এবং দেখুন কী কাজ করে।

এছাড়াও, আপনার প্রান্তিকতা ছোট বলে মনে হচ্ছে। আর '* এক্স সংখ্যার আনুপাতিক তুলনায় তুলনামূলক তুলনায় তুলনামূলক তুলনামূলক তুলনামূলক তুলনামূলক তুলনা করে যা প্রকৃত সম্পর্কের তুলনায় অনেক বড় (যেমন কাগজে ডায়াবেটিসের তথ্যের জন্য পারস্পরিক সম্পর্ক ~ 70-900)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.