সময়ের সাথে আরও বিস্তারিত ব্যাখ্যামূলক ভেরিয়েবলগুলি অন্তর্ভুক্ত করা


9

আমি বুঝতে চেষ্টা করছি যে আমি কীভাবে একটি পরিবর্তনশীল মডেল করতে পারি যেখানে সময়ের সাথে সাথে ক্রমবর্ধমান বিস্তারিত ভবিষ্যদ্বাণী পেয়েছি। উদাহরণস্বরূপ, খেলাপি loansণগুলিতে মডেলিং পুনরুদ্ধার হারগুলি বিবেচনা করুন। ধরুন আমাদের 20 বছরের ডেটা সহ একটি ডেটাসেট রয়েছে, এবং সেই বছরের 15 বছরের মধ্যে আমরা কেবল জানি যে colণটি জামানত হয়েছিল কি না, তবে সেই জামানতটির বৈশিষ্ট্য সম্পর্কে কিছুই নেই। তবে গত পাঁচ বছর ধরে আমরা সমান্তরালটিকে বিভিন্ন বিভাগে বিভক্ত করতে পারি যা পুনরুদ্ধারের হারের ভাল পূর্বাভাসক হিসাবে প্রত্যাশিত।

এই সেটআপটি দিয়ে আমি ডেটাগুলিতে একটি মডেল ফিট করতে চাইছি, ভবিষ্যদ্বাণীকারীদের পরিসংখ্যানগত তাত্পর্য মতো পদক্ষেপগুলি নির্ধারণ করতে এবং তারপরে মডেলটির সাথে পূর্বাভাস।

এটি কোন অনুপস্থিত তথ্য কাঠামোর সাথে খাপ খায়? Detailedতিহাসিক নমুনা জুড়ে ছড়িয়ে ছিটিয়ে থাকার বিপরীতে আরও বিশদ বিবরণী পরিবর্তনশীলগুলি কেবলমাত্র একটি নির্দিষ্ট সময়ের পরে উপলব্ধ হয়ে ওঠার সাথে সম্পর্কিত কোনও বিশেষ বিবেচনা রয়েছে?

উত্তর:


1

ঠিক আছে, historicalতিহাসিক ডেটা ব্যবহারের অভিজ্ঞতা থেকে আরও ইতিহাস রিগ্রেশনকে আরও ভাল দেখাতে পারে তবে ভবিষ্যদ্বাণী করা যদি অনুশীলনের মূল বিষয় হয় তবে সাধারণ উত্তরটি সতর্ক করা হয়। সেই ক্ষেত্রে যেখানে ডেটাগুলি সময়ের সাথে প্রতিফলিত করে যার জন্য 'বিশ্ব' খুব আলাদা ছিল, সেখানে সম্পর্কের স্থিরতা প্রশ্নবিদ্ধ। এটি বিশেষত অর্থনীতিতে ঘটে যেখানে বাজার এবং নিয়মাবলী ক্রমাগত বিকশিত হয়।

এটি রিয়েল এস্টেটের বাজারকে ধরে রাখে যাগুলি ছাড়াও, দীর্ঘ চক্র থাকতে পারে। বন্ধক ব্যাক সিকিওরিটির উদ্ভাবন, উদাহরণস্বরূপ, বন্ধকী বাজারকে রূপান্তরিত করে এবং বন্ধক উত্‍পাদনের জন্য বন্যার দ্বার উন্মুক্ত করে এবং দুর্ভাগ্যক্রমে অনুমানও করা হয় (আসলে লায়ার calledণ নামে ডাকা / কম ডকুমেন্ট loansণের পুরো শ্রেণি ছিল)।

ইতিহাস পরিবর্তনের ক্ষেত্রে অ-বিষয়গত পদ্ধতিতে সিদ্ধান্ত নেওয়ার ক্ষেত্রে শাসন পরিবর্তনের জন্য পরীক্ষা করা পদ্ধতিগুলি বিশেষত মূল্যবান হতে পারে।


1

সাধারণত, এটি একটি সীমাবদ্ধ প্যারামিটার মান সমস্যা হিসাবে দেখা যেতে পারে। আপনার প্রশ্নটি আমি বুঝতে পারছি যে, আপনার ডেটা শুরুর দিকে আপনার কাছে কম তথ্যমূলক প্যারামিটার (অজানা মানের সমান্তরাল [সিইউ]) রয়েছে এবং আরও তথ্যবহুল (উচ্চ [সিএইচ], মাঝারি [সেন্টিমিটার] বা নিম্ন [সিএল] মানের) সহ আপনার পরবর্তী তথ্য।

যদি আপনি বিশ্বাস করেন যে মডেলটির জন্য অ-পর্যবেক্ষণ করা প্যারামিটারগুলি সময়ের সাথে সাথে পরিবর্তন হয় না, তবে পদ্ধতিটি সহজ হতে পারে যেখানে আপনি অনুমান করেন যে প্রত্যেকটির বিন্দু অনুমানগুলি হ'ল << সেমি <সিএল এবং সিএল <= কিউ <= Ch। যুক্তিটি হ'ল সিএল সবচেয়ে খারাপ এবং সিএইচ সবচেয়ে ভাল, সুতরাং যখন তথ্য অজানা থাকে তখন অবশ্যই এটির মধ্যে বা এর সমান হতে হবে। আপনি যদি কিছুটা সীমাবদ্ধ হতে ইচ্ছুক হন এবং ধরে নেন যে প্রথম 15 বছরের মধ্যে সমস্ত জামানত উচ্চতর বা নিম্নমানের ছিল না তবে আপনি ধরে নিতে পারেন যে ক্লা <কিউ <Ch যা অনুমান করার জন্য এটি সহজতর করে তোলে।

গাণিতিকভাবে, এগুলি এমন সাথে অনুমান করা যায়:

Cl=exp(β1)Cm=exp(β1)+exp(β2)Cu=exp(β1)+exp(β3)1+exp(β4)Ch=exp(β1)+exp(β2)+exp(β3)

Cu- তে লগইট ফাংশনটি Cm এবং Ch এর মধ্যে থাকা মানটিকে সেমি সম্পর্কিত তুলনামূলকভাবে সীমাবদ্ধ না করে সীমাবদ্ধ করে। (0 এবং 1 এর মধ্যে আবদ্ধ অন্যান্য ফাংশনগুলিও ব্যবহার করা যেতে পারে))

মডেলের আর একটি পার্থক্য হ'ল বৈকল্পিকটি কাঠামোযুক্ত করা উচিত যাতে অবশিষ্ট সময়গুলি সময়ের সময়কালের উপর নির্ভরশীল কারণ প্রতিটি সময়ের মধ্যে তথ্য আলাদা।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.