আমি একটি ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করছি যা একটি মেয়াদ শেষে কোনও শিক্ষার্থীর সাফল্যের সম্ভাবনা পূর্বাভাস দেয়। শিক্ষার্থী সফল হয় বা ব্যর্থ হয় কিনা সে সম্পর্কে আমি বিশেষভাবে আগ্রহী, যেখানে সাফল্য সাধারণত সংজ্ঞা দেওয়া হয় মোট সম্ভাব্য পয়েন্টগুলির মধ্যে 70% বা তার বেশি পয়েন্ট অর্জন করা।
আমি যখন মডেলটি নিযুক্ত করি তখন সাফল্যের সম্ভাবনার অনুমানের সময়কালে আরও তথ্য উপলব্ধ হওয়ার সাথে সাথে আপডেট করা দরকার - আদর্শভাবে কিছু ঘটে যাওয়ার পরপরই, যেমন কোনও শিক্ষার্থী যখন কোনও অ্যাসাইনমেন্ট জমা দেয় বা তার উপর গ্রেড পায় তখন। এই আপডেটটি আমার কাছে বায়েশিয়ানদের মতো বাজে, কিন্তু শিক্ষাগত পরিসংখ্যানগুলিতে আমার প্রশিক্ষণ দেওয়া হয়েছে, এটি আমার আরামদায়ক অঞ্চলের বাইরে কিছুটা is
আমি এখনও অবধি লজিস্টিক রিগ্রেশন (আসলে লসো) ব্যবহার করছি সপ্তাহভিত্তিক স্ন্যাপশট সমন্বিত একটি .তিহাসিক ডেটা সেট সহ। যেহেতু প্রত্যেক শিক্ষার্থীর হয়েছে এই তথ্য সেট, সম্পর্ক পর্যবেক্ষণ রয়েছে পর্যবেক্ষণ; একজন শিক্ষার্থীর জন্য পর্যবেক্ষণগুলি পারস্পরিক সম্পর্কযুক্ত। আমি নির্দিষ্টভাবে নির্দিষ্ট শিক্ষার্থীর সাপ্তাহিক পর্যবেক্ষণগুলির মধ্যে পারস্পরিক সম্পর্ককে মডেলিং করছি না। আমি বিশ্বাস করি যে মানক ত্রুটিগুলি খুব ছোট হবে বলেই কেবল একটি অনুমানমূলক সেটিংসে আমার এটি বিবেচনা করা দরকার। আমি মনে করি - তবে এ সম্পর্কে নিশ্চিত নই - পারস্পরিক সম্পর্কযুক্ত পর্যবেক্ষণগুলি থেকে উদ্ভূত একমাত্র সমস্যাটি হ'ল আমি যখন সাবধানতা অবলম্বন করা দরকার তখন যখন আমি ক্লাস্টারযুক্ত পর্যবেক্ষণগুলি ডেটার একটি উপসাগরে রাখার জন্য ক্রস-বৈধ হয়েছি, যাতে আমি না পাই মডেল ইতিমধ্যে দেখেছেন এমন কোনও ব্যক্তির ভবিষ্যদ্বাণী করার উপর ভিত্তি করে কৃত্রিমভাবে কম-স্যাম্পল ত্রুটির হার rates
সাফল্য / ব্যর্থতার সম্ভাবনা তৈরি করতে এবং একটি নির্দিষ্ট কোর্সের জন্য স্বয়ংক্রিয়ভাবে ভবিষ্যদ্বাণী বেছে নেওয়ার জন্য আমি লজিস্টিক মডেল সহ লাসো করতে আর এর গ্ল্যামনেট প্যাকেজটি ব্যবহার করছি । আমি সপ্তাহের পরিবর্তনশীলকে একটি ফ্যাক্টর হিসাবে ব্যবহার করছি, অন্যান্য সমস্ত ভবিষ্যদ্বাণীকের সাথে ইন্টারঅ্যাক্ট করেছি। আমি মনে করি না যে এটি কেবলমাত্র পৃথক সপ্তাহভিত্তিক মডেলগুলির অনুমানের তুলনায় পৃথক পৃথক সপ্তাহে বিভিন্ন ঝুঁকির সমন্বয়কারী উপাদানগুলির মাধ্যমে সামঞ্জস্য হওয়া এমন কিছু সাধারণ মডেল থাকতে পারে যা সম্পর্কে কিছু ধারণা দেয় except
আমার মূল প্রশ্নটি হ'ল: সপ্তাহের (বা অন্যান্য অন্তরভিত্তিক) স্ন্যাপশটগুলিতে সেট করা ডেটা ভাগ করার পরিবর্তে সময়ের সাথে সম্পর্কিত ফ্যাক্টর ভেরিয়েবলটি প্রতিটি অন্যান্য বৈশিষ্ট্যের সাথে ইন্টারঅ্যাক্ট করে পরিচয় করিয়ে দেওয়ার পরিবর্তে সময়ের সাথে সাথে শ্রেণিবিন্যাসের সম্ভাবনাগুলি আপডেট করার আরও ভাল উপায় কি এবং ক্রমযুক্ত বৈশিষ্ট্য ব্যবহার করে (উপার্জনিত পয়েন্ট, ক্লাসে সংযোজিত দিন ইত্যাদি)?
আমার দ্বিতীয় প্রশ্নটি : আমি কি এখানে সম্পর্কিত তদারকির সাথে ভবিষ্যদ্বাণীমূলক মডেলিং সম্পর্কে সমালোচনামূলক কিছু মিস করছি?
আমার তৃতীয় প্রশ্ন হ'ল: আমি সাপ্তাহিক স্ন্যাপশট দিচ্ছি কী করে আমি এটি বাস্তবের আপডেটে সাধারণ করতে পারি? আমি বর্তমান সাপ্তাহিক ব্যবধানের জন্য কেবল ভেরিয়েবলগুলিতে প্লাগ করার পরিকল্পনা করছি, তবে এটি আমার কাছে ক্লদজি বলে মনে হচ্ছে।
এফওয়াইআই, আমি প্রয়োগিত শিক্ষামূলক পরিসংখ্যান সম্পর্কে প্রশিক্ষণপ্রাপ্ত তবে অনেক আগে থেকেই গাণিতিক পরিসংখ্যানগুলির পটভূমি রয়েছে। আমি এর চেয়ে বেশি পরিশীলিত কিছু করতে পারি যদি এটি বোধগম্য হয় তবে আমার এটি অপেক্ষাকৃত অ্যাক্সেসযোগ্য পদে ব্যাখ্যা করা দরকার।