যাক y1,…,yn পর্যবেক্ষিত তথ্য যা সম্ভাব্য হয় IID র্যান্ডম ভেরিয়েবল একটা ক্রম একটি আদায় হতে Y1,…,Yn সাধারণ সম্ভাব্যতা ঘনত্ব ফাংশন সঙ্গে pe একটি সিগমা-সসীম পরিমাপ থেকে সম্মান সঙ্গে সংজ্ঞায়িত ν । ঘনত্ব pe ডেটা জেনারেট প্রক্রিয়া (ডিজিপি) ঘনত্ব বলা হয়।
গবেষক এর সম্ভাব্যতা মডেলে
M≡{p(y;θ):θ∈Θ} সম্ভাব্যতা ঘনত্ব ফাংশন যা একটি প্যারামিটার ভেক্টর দ্বারা সূচীবদ্ধ করা হয় একটি সংগ্রহ
θ । প্রতিটি ঘনত্ব অনুমান M একটি একটি সাধারণ সিগমা-সসীম পরিমাপ থেকে সম্মান সঙ্গে সংজ্ঞায়িত করা হয় ν (যেমন, প্রতিটি ঘনত্ব একই নমুনা স্থানসহ একটি সম্ভাব্যতা ভর ফাংশন হতে পারে S )।
ঘনত্ব pe রাখা গুরুত্বপূর্ণ যা বাস্তবে ডেটাগুলির সম্ভাব্যতা মডেল থেকে ডেটা ধারণাগতভাবে পৃথক করে তোলে। ক্লাসিক পরিসংখ্যানগত চিকিত্সাগুলিতে এই ধারণাগুলির একটি সাবধানে বিভাজন হয় তা উপেক্ষা করা হয়, তৈরি হয় না, বা শুরু থেকেই ঠিক ধরে নেওয়া হয় যে সম্ভাবনার মডেলটি সঠিকভাবে নির্দিষ্ট করা হয়েছে।
পি ই সম্পর্কিত একটি সঠিকভাবে নির্দিষ্ট মডেল M এমন এক মডেল হিসাবে সংজ্ঞায়িত করা হয়েছে যেখানে p e ∈ M al- সর্বমোট সর্বত্র। যখন
এম থেকে সম্মান সঙ্গে misspecified হয় পি ই ক্ষেত্রে যেখানে সম্ভাব্যতা মডেল নিদিষ্ট সঠিকভাবে হয় না এই অনুরূপ।pepe∈M νMpe
সম্ভাব্যতা মডেল সঠিকভাবে নির্দিষ্ট করা থাকে, তাহলে সেখানে একটি বিদ্যমান θ∗ প্যারামিটার স্থান Θ যেমন যে
pe(y)=p(y;θ∗) ν -almost সর্বত্র। এই জাতীয় প্যারামিটার ভেক্টরকে "ট্রু প্যারামিটার ভেক্টর" বলা হয়। যদি সম্ভাব্যতা মডেলটি ভুল বানান থেকে থাকে তবে সত্যিকারের পরামিতি ভেক্টরের উপস্থিতি নেই।
হোয়াইট এর মডেল misspecification কাঠামোর মধ্যে লক্ষ্য পরামিতি অনুমান খুঁজে পেতে θ এন যে ছোট
ℓ এন ( θ ) ≡ ( 1 / এন ) Σ এন আমি = 1 লগ পি ( Y আমিθ^nℓ^n(θ)≡(1/n)∑ni=1logp(yi;θ) কিছু কম্প্যাক্ট প্যারামিটার স্থান ধরেΘ । ধারণা করা হয় একটি অনন্য কঠোর বিশ্বব্যাপী মিনিমাইজার,θ∗ , প্রত্যাশিত মূল্যের ℓ এন উপর Θ অভ্যন্তর অবস্থিত Θℓ^nΘΘ। ভাগ্যবান ক্ষেত্রে যেখানে সম্ভাব্যতা মডেল সঠিকভাবে নির্ধারণ সালে θ∗ "সত্যিকারের প্যারামিটার মান" হিসেবে ব্যাখ্যা করা যেতে পারে।
বিশেষ ক্ষেত্রে যেখানে সম্ভাব্যতা মডেলটি সঠিকভাবে নির্দিষ্ট করা হয়েছে, তারপরে θ^nপরিচিত সর্বাধিক সম্ভাবনা অনুমান। আমরা জানি না পরম যে জ্ঞান সম্ভাব্যতা মডেল সঠিকভাবে নির্ধারণ থাকে, তাহলে θ এনআধা-সর্বোচ্চ সম্ভাবনা অনুমান বলা হয় এবং লক্ষ্য অনুমান হয়θ*। আমরা যদি ভাগ্যবান পেতে এবং সম্ভাব্যতা মডেল সঠিকভাবে উল্লিখিত থাকলে, তারপর আপাতদৃষ্টিতে সর্বোচ্চ সম্ভাবনা অনুমান পরিচিত সর্বাধিক সম্ভাবনা অনুমান করার জন্য একটি বিশেষ ক্ষেত্রে যেমন হ্রাস করে এবং
θ*সত্য প্যারামিটার মান হয়ে ওঠে।θ^nθ∗θ∗
হোয়াইট এর অভিসৃতি করতে (1982) ফ্রেমওয়ার্ক অনুরূপ মধ্যে সমন্নয় θ∗ যে প্রয়োজন ছাড়া θ∗ অগত্যা সত্য প্যারামিটার বাহক। হোয়াইটের কাঠামোর মধ্যে আমরা কখনই ইভেন্টের সম্ভাবনাটি অনুমান করতে পারি না যে by উত্পাদিত সেটগুলিতে সত্য বিতরণ পি * অন্তর্ভুক্ত রয়েছে। পরিবর্তে, আমরা সর্বদা সম্ভাবনা বন্টন পি ** অনুমান করব যা ইভেন্টটির সম্ভাব্যতা যা by উত্পাদিত সেটে ঘনত্ব p(y;θ∗) দ্বারা নির্দিষ্ট বিতরণ অন্তর্ভুক্ত করে
।
শেষ অবধি, মডেল অপব্যবহার সম্পর্কে কয়েকটি মন্তব্য। উদাহরণস্বরূপগুলি খুঁজে পাওয়া সহজ যেখানে কোনও ভুল বানানো মডেল অত্যন্ত দরকারী এবং খুব ভবিষ্যদ্বাণীপূর্ণ। উদাহরণস্বরূপ, গাউসীয় অবশিষ্টাংশ ত্রুটি শব্দটির সাথে একটি ননলাইনার (বা এমনকি লিনিয়ার) রিগ্রেশন মডেলটি বিবেচনা করুন যার বৈকল্পিকতা খুব ছোট হলেও পরিবেশে প্রকৃত অবশিষ্ট ত্রুটি গাউসিয়ান নয়।
উদাহরণস্বরূপ সন্ধান করাও সহজ যেখানে সঠিকভাবে নির্দিষ্ট করা মডেল কার্যকর না এবং ভবিষ্যদ্বাণীমূলক নয়। উদাহরণস্বরূপ, স্টকের দামগুলির পূর্বাভাস দেওয়ার জন্য একটি এলোমেলো পদক্ষেপের মডেল বিবেচনা করুন যা আগামীকালকের সমাপ্তির দামটি আজকের সমাপনী দামের একটি ওজনযুক্ত সমষ্টি এবং অত্যন্ত বড় বৈকল্পিকতার সাথে কিছু গাউসিয়ান গোলমাল।
মডেলের অপব্যবহার কাঠামোর উদ্দেশ্য মডেলের বৈধতা নিশ্চিত করা নয় বরং নির্ভরযোগ্যতা নিশ্চিত করা। এটি, আপনার প্যারামিটারের অনুমানগুলি, আত্মবিশ্বাসের ব্যবধানগুলি, অনুমানের পরীক্ষাগুলি এবং এর সাথে সম্পর্কিত স্যাম্পলিং ত্রুটিটি ছোট বা বড় পরিমাণে মডেলের ভুল ব্যবহারের উপস্থিতি সত্ত্বেও সঠিকভাবে অনুমান করা হয়েছে তা নিশ্চিত করুন। আপাতদৃষ্টিতে সর্বোচ্চ সম্ভাবনা অনুমান এসিম্পটোটিকভাবে স্বাভাবিক কেন্দ্রীভূত হয় θ∗ একটি সহভেদাংক ম্যাট্রিক্স মূল্নির্ধারক যা নেতিবাচক লগ-সম্ভাবনা ফাংশনের উভয় প্রথম এবং দ্বিতীয় ডেরাইভেটিভস উপর নির্ভর করে না। আপনি যদি ভাগ্যবান হন এবং মডেলটি সঠিক হন তবে বিশেষ সূত্রগুলি সমস্ত পরিচিত ধ্রুপদী পরিসংখ্যান কাঠামোর সাথে হ্রাস করে যেখানে লক্ষ্য "সত্য" পরামিতি মানগুলি অনুমান করা।