সময়ের মাধ্যমে লজিস্টিক রিগ্রেশনে শ্রেণিবদ্ধকরণের সম্ভাবনা আপডেট করা


19

আমি একটি ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করছি যা একটি মেয়াদ শেষে কোনও শিক্ষার্থীর সাফল্যের সম্ভাবনা পূর্বাভাস দেয়। শিক্ষার্থী সফল হয় বা ব্যর্থ হয় কিনা সে সম্পর্কে আমি বিশেষভাবে আগ্রহী, যেখানে সাফল্য সাধারণত সংজ্ঞা দেওয়া হয় মোট সম্ভাব্য পয়েন্টগুলির মধ্যে 70% বা তার বেশি পয়েন্ট অর্জন করা।

আমি যখন মডেলটি নিযুক্ত করি তখন সাফল্যের সম্ভাবনার অনুমানের সময়কালে আরও তথ্য উপলব্ধ হওয়ার সাথে সাথে আপডেট করা দরকার - আদর্শভাবে কিছু ঘটে যাওয়ার পরপরই, যেমন কোনও শিক্ষার্থী যখন কোনও অ্যাসাইনমেন্ট জমা দেয় বা তার উপর গ্রেড পায় তখন। এই আপডেটটি আমার কাছে বায়েশিয়ানদের মতো বাজে, কিন্তু শিক্ষাগত পরিসংখ্যানগুলিতে আমার প্রশিক্ষণ দেওয়া হয়েছে, এটি আমার আরামদায়ক অঞ্চলের বাইরে কিছুটা is

আমি এখনও অবধি লজিস্টিক রিগ্রেশন (আসলে লসো) ব্যবহার করছি সপ্তাহভিত্তিক স্ন্যাপশট সমন্বিত একটি .তিহাসিক ডেটা সেট সহ। যেহেতু প্রত্যেক শিক্ষার্থীর হয়েছে এই তথ্য সেট, সম্পর্ক পর্যবেক্ষণ রয়েছে টিRমিএলএনটি/7পর্যবেক্ষণ; একজন শিক্ষার্থীর জন্য পর্যবেক্ষণগুলি পারস্পরিক সম্পর্কযুক্ত। আমি নির্দিষ্টভাবে নির্দিষ্ট শিক্ষার্থীর সাপ্তাহিক পর্যবেক্ষণগুলির মধ্যে পারস্পরিক সম্পর্ককে মডেলিং করছি না। আমি বিশ্বাস করি যে মানক ত্রুটিগুলি খুব ছোট হবে বলেই কেবল একটি অনুমানমূলক সেটিংসে আমার এটি বিবেচনা করা দরকার। আমি মনে করি - তবে এ সম্পর্কে নিশ্চিত নই - পারস্পরিক সম্পর্কযুক্ত পর্যবেক্ষণগুলি থেকে উদ্ভূত একমাত্র সমস্যাটি হ'ল আমি যখন সাবধানতা অবলম্বন করা দরকার তখন যখন আমি ক্লাস্টারযুক্ত পর্যবেক্ষণগুলি ডেটার একটি উপসাগরে রাখার জন্য ক্রস-বৈধ হয়েছি, যাতে আমি না পাই মডেল ইতিমধ্যে দেখেছেন এমন কোনও ব্যক্তির ভবিষ্যদ্বাণী করার উপর ভিত্তি করে কৃত্রিমভাবে কম-স্যাম্পল ত্রুটির হার rates

সাফল্য / ব্যর্থতার সম্ভাবনা তৈরি করতে এবং একটি নির্দিষ্ট কোর্সের জন্য স্বয়ংক্রিয়ভাবে ভবিষ্যদ্বাণী বেছে নেওয়ার জন্য আমি লজিস্টিক মডেল সহ লাসো করতে আর এর গ্ল্যামনেট প্যাকেজটি ব্যবহার করছি । আমি সপ্তাহের পরিবর্তনশীলকে একটি ফ্যাক্টর হিসাবে ব্যবহার করছি, অন্যান্য সমস্ত ভবিষ্যদ্বাণীকের সাথে ইন্টারঅ্যাক্ট করেছি। আমি মনে করি না যে এটি কেবলমাত্র পৃথক সপ্তাহভিত্তিক মডেলগুলির অনুমানের তুলনায় পৃথক পৃথক সপ্তাহে বিভিন্ন ঝুঁকির সমন্বয়কারী উপাদানগুলির মাধ্যমে সামঞ্জস্য হওয়া এমন কিছু সাধারণ মডেল থাকতে পারে যা সম্পর্কে কিছু ধারণা দেয় except

আমার মূল প্রশ্নটি হ'ল: সপ্তাহের (বা অন্যান্য অন্তরভিত্তিক) স্ন্যাপশটগুলিতে সেট করা ডেটা ভাগ করার পরিবর্তে সময়ের সাথে সম্পর্কিত ফ্যাক্টর ভেরিয়েবলটি প্রতিটি অন্যান্য বৈশিষ্ট্যের সাথে ইন্টারঅ্যাক্ট করে পরিচয় করিয়ে দেওয়ার পরিবর্তে সময়ের সাথে সাথে শ্রেণিবিন্যাসের সম্ভাবনাগুলি আপডেট করার আরও ভাল উপায় কি এবং ক্রমযুক্ত বৈশিষ্ট্য ব্যবহার করে (উপার্জনিত পয়েন্ট, ক্লাসে সংযোজিত দিন ইত্যাদি)?

আমার দ্বিতীয় প্রশ্নটি : আমি কি এখানে সম্পর্কিত তদারকির সাথে ভবিষ্যদ্বাণীমূলক মডেলিং সম্পর্কে সমালোচনামূলক কিছু মিস করছি?

আমার তৃতীয় প্রশ্ন হ'ল: আমি সাপ্তাহিক স্ন্যাপশট দিচ্ছি কী করে আমি এটি বাস্তবের আপডেটে সাধারণ করতে পারি? আমি বর্তমান সাপ্তাহিক ব্যবধানের জন্য কেবল ভেরিয়েবলগুলিতে প্লাগ করার পরিকল্পনা করছি, তবে এটি আমার কাছে ক্লদজি বলে মনে হচ্ছে।

এফওয়াইআই, আমি প্রয়োগিত শিক্ষামূলক পরিসংখ্যান সম্পর্কে প্রশিক্ষণপ্রাপ্ত তবে অনেক আগে থেকেই গাণিতিক পরিসংখ্যানগুলির পটভূমি রয়েছে। আমি এর চেয়ে বেশি পরিশীলিত কিছু করতে পারি যদি এটি বোধগম্য হয় তবে আমার এটি অপেক্ষাকৃত অ্যাক্সেসযোগ্য পদে ব্যাখ্যা করা দরকার।

উত্তর:


4

টি0,টি1,...,টিএনটিআমি(জেডআমি,এসআমি)জেডআমিএসআমি(1,0)পিR(z- রআমি=0|গুলিআমি-1)এসআমি

ড্রপ আউট সম্ভাবনাগুলি স্থির নয়, যেহেতু আপনি চূড়ান্ত ছাড়ার-জরিমানার তারিখের ঠিক আগে ড্রপআউটগুলির একদল পেয়ে যাবেন। তবে আপনি পূর্ববর্তী ডেটাগুলি থেকে এটি অনুমান করতে পারেন current আপনি বর্তমান (বিরল) পারফরম্যান্সের ফাংশন হিসাবে বাদ পড়ার সম্ভাবনাও অনুমান করতে পারেন।

এসএন

জেডএস

এস

বেসলাইনে, কোনও শিক্ষার্থীর পাসের সম্ভাবনা হ'ল কেবল পূর্ববর্তী শ্রেণীর পাসের হার।

এস170-এস1

বোনাস হিসাবে, আপনি সম্ভাব্যতার একটি ব্যাপ্তি গণনা করতে পারেন, যা শব্দটির অগ্রগতির সাথে সংকীর্ণ হওয়া উচিত। প্রকৃতপক্ষে, শক্তিশালী শিক্ষার্থীরা মেয়াদ শেষ হওয়ার আগে 70%% অতিক্রম করবে এবং তাদের সাফল্য সেই মুহূর্তে নিশ্চিত হবে। দুর্বল শিক্ষার্থীদের ক্ষেত্রে, ব্যর্থতাও শেষের আগে নিশ্চিত হয়ে যাবে।

আরই: প্রশ্ন ৩. আপনার কি অবিচ্ছিন্ন সময়ে যাওয়া উচিত? আমি করব না, কারণ এটি একটানা সময় স্টোকাস্টিক প্রক্রিয়াগুলির ক্ষেত্রের মধ্যে ফেলে এবং এতে জড়িত গণিতটি আমার বেতন গ্রেডের aboveর্ধ্বে। শুধু তাই নয়, আপনার যথেষ্ট আলাদা ফলাফল পাওয়ার সম্ভাবনাও কম।

আমি যে মডেলটির উল্লেখ করেছি তার আপগ্রেড করার সর্বোত্তম উপায় হ'ল অবিচ্ছিন্ন সময় না যাওয়া, তবে পূর্বের অভিজ্ঞতার ভিত্তিতে রূপান্তর সম্ভাবনাগুলি সামঞ্জস্য করা। স্বাধীনতার মডেলটির পূর্বাভাসের চেয়ে দুর্বল শিক্ষার্থীরা আরও পিছিয়ে পড়বে। স্বতঃস্ফূর্ততা অন্তর্ভুক্তি থেকে অবিচ্ছিন্ন সময়ে যাওয়ার চেয়ে মডেলটিকে আরও উন্নত করবে।


0

আমি যখন একই ধরণের মোতায়েনের জন্য ভবিষ্যদ্বাণীপূর্ণ মডেলগুলি প্রশিক্ষণ দিই, তখন আমি নিশ্চিত করি যে আমার ডেটাসেটগুলিতে কিছুটা Term_End_Date রয়েছে যাতে আমি শব্দটি শেষ না হওয়া অবধি সময়সীমাটি অর্জন করতে পারি। এটি সম্ভবত আপনার মডেলের একটি গুরুত্বপূর্ণ ভবিষ্যদ্বাণী হিসাবে শেষ হবে।

পারস্পরিক সম্পর্কযুক্ত পর্যবেক্ষণের প্রশ্ন সম্পর্কে, আমি মনে করি এটি আপনার কাছে থাকা কতটা বড় ডেটা ভান্ডার matters যদি সম্ভব হয় তবে আমি এলোমেলোভাবে প্রতিটি শিক্ষার্থীর জন্য 1 টি পর্যবেক্ষণ নির্বাচন করব, যা [টার্ম শেষ না হওয়া অবধি সপ্তাহের #] পর্যন্ত স্তরযুক্ত। আমি যদি সম্ভব হয় তবে পুরানো পদ থেকেও দখল করব। যদি আপনার কাছে এটি করার জন্য পর্যাপ্ত ডেটা না থাকে, তবে আপনি বুটস্ট্র্যাপের মতো পুনরায় স্যাম্পলিং পদ্ধতি ব্যবহার করতে পারেন।

আমি মনে করি আপনার চূড়ান্ত মডেলটি স্থিতিশীল কিনা তা নিশ্চিত করার জন্য আপনার কাছে যদি একটি ছোট ডেটাসেট থাকে তবে হোল্ডআউট হিসাবে পর্যাপ্ত ডেটা রাখছেন।

আমি মনে করি আপনি যখন সমস্ত শেষ হয়ে গেছেন, এবং আপনার কাছে একটি স্কোরিং সূত্র রয়েছে তখন তা কার্যকর করা সহজ হবে। তবে হ্যাঁ, আপনার এখনও সাপ্তাহিক এক্স ভেরিয়েবলগুলি প্লাগ করা উচিত যা আপনার স্কোর গণনা করতে হবে - তবে এটি কোনও ডেটা সংগ্রহের ইস্যু এবং মডেল বাস্তবায়নের বিষয়ে কম বলে মনে হচ্ছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.