আমি একটি হোমওয়ার্ক অ্যাসাইনমেন্টে কাজ করছি যেখানে আমার প্রফেসর আমাদের সত্যিকারের রিগ্রেশন মডেল তৈরি করতে চান, উপাত্তের একটি নমুনা অনুকরণ করতে চান এবং তিনি ক্লাসে শিখেছি এমন কয়েকটি কৌশল ব্যবহার করে আমাদের সত্যিকারের রিগ্রেশন মডেলটি সন্ধান করার চেষ্টা করছেন। আমাদের একইভাবে তিনি আমাদের যে কোনও ডেটাসেট দিয়েছিলেন তা করতে হবে।
তিনি বলেছেন যে তাঁকে চেষ্টা ও প্ররোচিত করার জন্য অতীতের সমস্ত প্রয়াসের জন্য তিনি একটি দুর্দান্ত নির্ভুল মডেল তৈরি করতে সক্ষম হয়েছেন। এমন কিছু শিক্ষার্থী রয়েছে যা কিছু উন্মাদ মডেল তৈরি করে তবে তিনি তর্কসাপেক্ষে একটি সহজ মডেল তৈরি করতে সক্ষম হন যা যথেষ্ট ছিল।
তার সন্ধানের জন্য আমি কীভাবে একটি কৌশলপূর্ণ মডেল বিকাশ করতে পারি? আমি 4 টি চতুষ্কোণ পদ, 3 টি পর্যবেক্ষণ এবং বিশাল বৈকল্পিকতা দিয়ে সুপার সস্তা হতে চাই না? আমি কীভাবে একটি আপাতদৃষ্টিতে নিরীহ ডেটাসেট তৈরি করতে পারি যার নীচে একটি শক্ত ছোট মডেল রয়েছে?
তার অনুসরণ করার জন্য কেবলমাত্র 3 টি বিধি রয়েছে:
আপনার ডেটাসেটে অবশ্যই "Y", "X1", ..., "X20" হিসাবে লেবেলযুক্ত একটি "Y" ভেরিয়েবল এবং 20 "এক্স" ভেরিয়েবল থাকতে হবে।
আপনার প্রতিক্রিয়া পরিবর্তনশীল রৈখিক রিগ্রেশনের মডেল থেকে আসতে হবে মাফিক: যেখানে এবং ।
তৈরি করতে ব্যবহৃত সমস্ত ভার্ভেবলগুলি আপনার ডেটাসেটে রয়েছে।ওয়াই
এটি লক্ষ করা উচিত, সমস্ত 20 এক্স ভেরিয়েবলগুলি আপনার আসল মডেলটিতে থাকা উচিত নয়
আমি ফামা-ফরাসি 3 ফ্যাক্টর মডেলের মতো কিছু ব্যবহার করার কথা ভাবছিলাম এবং তাকে স্টক ডেটা (এসপিএক্স এবং এএপিএল) দিয়ে শুরু করিয়েছিলাম এবং আরও কিছুটা অস্পষ্ট করার জন্য সেই পরিবর্তনশীলগুলি ক্রমাগত সংশ্লেষিত রিটার্নে রূপান্তর করতে হয়েছিল। তবে এটি আমাকে প্রথম পর্যবেক্ষণে হারিয়ে যাওয়া মূল্যবোধের সাথে ছেড়ে দেয় এবং এটি সময়ের সিরিজ (যা আমরা এখনও ক্লাসে আলোচনা করিনি)।
এই জাতীয় পোস্ট দেওয়ার উপযুক্ত জায়গা কিনা তা নিশ্চিত করুন। আমার মনে হয়েছিল এটি কিছু ভাল আলোচনা তৈরি করতে পারে।
সম্পাদনা: আমি বিশেষত "প্রাক বিল্ট" মডেলগুলিও চাইছি না। আমি পরিসংখ্যানের বিষয়গুলি / সরঞ্জামগুলি সম্পর্কে আরও কৌতূহলী যা কারও সম্পর্কে এটি সক্ষম হতে পারে।