কেন উইল্কসের 1938 প্রুফ ভুল বর্ণিত মডেলগুলির জন্য কাজ করে না?


23

বিখ্যাত 1938 পত্রিকায় (" যৌগিক অনুমানের পরীক্ষার সম্ভাবনা অনুপাতের বৃহত-নমুনা বন্টন ", গাণিতিক পরিসংখ্যানগুলির অ্যানালস, 9: 60-62), স্যামুয়েল উইলস (লগ সম্ভাবনা অনুপাত) এর অ্যাসিম্পোটিক বিতরণ প্রাপ্ত করেছেন নেস্টেড হাইপোথিসিসের জন্য, অনুমানের অধীনে যে বৃহত্তর অনুমানটি সঠিকভাবে নির্দিষ্ট করা হয়েছে। সীমাবদ্ধ বিতরণ হ'ল স্বাধীনতার ডিগ্রি সহ (চি-স্কোয়ার্ড) , যেখানে বৃহত্তর অনুমান এবং এর পরামিতিগুলির সংখ্যাχ 2 ঘন্টা - এম এইচ মি2×এলএলআরχ2-মিমিনেস্টেড হাইপোথিসিসে মুক্ত প্যারামিটারগুলির সংখ্যা। যাইহোক, ধারণা করা যায় যে অনুমানগুলি ভুল বানানো হয় (যেমন, যখন বৃহত্তর অনুমানটি নমুনাযুক্ত তথ্যের জন্য সত্য বিতরণ নয়) এই ফলাফলটি ধারণ করে না supposed

কেন কেউ ব্যাখ্যা করতে পারেন? আমার কাছে মনে হচ্ছে উইলক্সের প্রমাণটি এখনও ছোটখাটো পরিবর্তন নিয়ে কাজ করা উচিত। এটি সর্বাধিক সম্ভাবনার প্রাক্কলন (এমএলই) এর অ্যাসিম্পটোটিক স্বাভাবিকতার উপর নির্ভর করে, যা এখনও ভুল বর্ণিত মডেলগুলির সাথে ধারণ করে। পার্থক্যটি হ'ল সীমিত মাল্টিভারিয়েট স্বাভাবিকের কোভারিয়েন্স ম্যাট্রিক্স: সঠিকভাবে নির্দিষ্ট মডেলগুলির জন্য, আমরা বিবর্তিত ফিশার তথ্য ম্যাট্রিক্স the এর সাথে কোভারিয়েন্স ম্যাট্রিক্সের অনুমান করতে পারি, ভুল বর্ণনার সাথে আমরা কোভারিয়েন্স ম্যাট্রিক্সের স্যান্ডউইচ অনুমান ব্যবহার করতে পারি ( )। মডেলটি সঠিকভাবে নির্দিষ্ট করা হলে ( থেকে যেহেতু) ফিশার তথ্য ম্যাট্রিক্সের বিপরীতে হ্রাস হয় জে - 1 কে জে - 1= কে সি - 1জে-1জে-1কেজে-1জে=কে)। এএএএএফসিটি, উইলাক্স প্রুফ কোয়ারেন্স ম্যাট্রিক্সের প্রাক্কলনটি কোথা থেকে আসে তা বিবেচনা করে না, যতক্ষণ না আমরা এমএলইয়ের ( উইকিউস পেপারে )) মাল্টিভারিয়েট নরমালের একটি অবিচ্ছিন্ন অ্যাসেম্পোটিক কোভারিয়েন্স ম্যাট্রিক্স পাই । -1


যখন বৃহত্তর মডেল সত্য কিন্তু submodel মিথ্যা, asymptotic বন্টন নয় গসিয়ান ত্রুটি যুক্ত আর (রৈখিক মডেল, উদাহরণস্বরূপ, আমরা জিনিস সঠিক noncentral-এফ ডিস্ট্রিবিউশন তাই ভালো মধ্যে asymptotic বন্টন nc- ভালো কিছু হওয়া উচিত পেতে χ 2 আমি অনুমান করছি)। সুতরাং বৃহত্তর এবং ছোট মডেল উভয়ই ভুল হলে আমরা কেন এটি 2 ডলার হওয়ার আশা করব ? এখানে শূন্য অনুমানটি ঠিক কী দিয়ে শুরু করা যেতে পারে? χ2χ2χ2
লোক

সঠিকভাবে নির্দিষ্ট নাল-হাইপোথিসিসে, উভয় মডেল "সত্য", তবে নীড়যুক্তটির সঠিক মানের ক্ষেত্রে প্যারামিটার রয়েছে । ভুল বর্ণিত নাল-হাইপোথিসিসে, উভয় মডেল "মিথ্যা", তবে নীড়যুক্তটির সিউডোট্রু মানগুলিতে স্থির মি প্যারামিটার রয়েছে । ("সিউডোট্রু মান" প্যারামিটারের অ্যাসিপটোটিক মান যা ভুল বর্ণিত মডেল এবং সত্য মডেলের মধ্যে কুলব্যাক-লেবলারের দূরত্বকে হ্রাস করে)) সুতরাং আপনার কেন্দ্রহীন- F এর উদাহরণ প্রাসঙ্গিক নয়, কারণ এটি বিতরণ যখন এখানে নাল-হাইপোথিসিসটি মিথ্যা। মিমি
রাতসালাদ

দুঃখিত, আমার বলা উচিত ছিল যে নেস্টেড হাইপোথিসিসে প্যারামিটারগুলি সত্যিকার মানগুলিতে স্থির করা আছে। -মি
রাতসালাদ

এটি আমার বোঝা যায় যে একটি ভুল বানানো শূন্য মডেলটি বিভিন্ন উপায়ে ভুল বানান করা যেতে পারে। উদাহরণস্বরূপ: অবশিষ্টাংশের ভুল বিতরণ, উপাত্তে বিজাতীয় বৈশিষ্ট্য রয়েছে, প্রভাবগুলি সংযোজনীয় নয়, তবে যাইহোক, আমি সম্মত হই যে কমপক্ষে "পরীক্ষিত" প্যারামিটারের কোনও একটি যদি একটি ভ্যালু মান (উদাহরণস্বরূপ সিউডোট্রু মান) স্থির করা হয় , এটি একটি ভুলভাবে নির্দিষ্ট নাল মডেলের একটি উদাহরণ। -মি
rcorty

উত্তর:


19

আরভি ফাউটজ এবং আরসি শ্রীবাস্তব বিষয়টি বিস্তারিতভাবে পরীক্ষা করেছেন। তাদের 1977 এর গবেষণাপত্র "মডেলটি ভুল হলে সম্ভাবনা অনুপাতের পরীক্ষার পারফরম্যান্স" প্রমাণের খুব সংক্ষিপ্ত স্কেচের পাশাপাশি ভুল বর্ণনার ক্ষেত্রে বন্টনমূলক ফলাফলের বিবৃতি ধারণ করে, যখন তাদের 1978-এর গবেষণাপত্র "সম্ভাবনা অনুপাতের অ্যাসিম্পোটিক বিতরণ যখন মডেলটি ভুল " এতে প্রুফ রয়েছে তবে শেষোক্তটি পুরানো ধাঁচের টাইপ-রাইটারে টাইপ করা হয় (উভয় পেপারই একই স্বরলিপি ব্যবহার করে, তাই আপনি তাদের পড়ার ক্ষেত্রে সংযুক্ত করতে পারেন)। এছাড়াও, প্রমাণের কয়েকটি পদক্ষেপের জন্য তারা কেপি রায় রচিত একটি গবেষণাপত্রের বিষয়ে উল্লেখ করেন ১৯৫7 সাল থেকে "সম্ভাবনা অনুপাতের অ্যাসিপোটোটিক বিতরণ সম্পর্কিত একটি নোট" যা অন-লাইন, এমনকি গেটেড বলে মনে হয় না।

বিতরণমূলক অপব্যবহারের ক্ষেত্রে, যদি এমএলই এখনও সামঞ্জস্যপূর্ণ এবং অ্যাসিপোটোটিকভাবে স্বাভাবিক থাকে (যা সর্বদা ক্ষেত্রে হয় না ), এলআর পরিসংখ্যানটি স্বতন্ত্র চি-স্কোয়ারগুলির এক লিনিয়ার সংমিশ্রণ অনুসরণ করে (প্রতিটি এক ডিগ্রি স্বাধীনতার)

-2LnλΣআমি=1Rআমিχআমি2

যেখানে । যে কেউ "মিল" দেখতে পাবে: এইচ - এম ডিগ্রি সহ একটি চি-স্কোয়ারের পরিবর্তে আমাদের প্রতিটি ডিগ্রি স্বাধীনতার সাথে এইচ - এম চি-স্কোয়ার রয়েছে। তবে "সাদৃশ্য" সেখানেই থেমে আছে, কারণ চি-স্কোয়ারগুলির একটি রৈখিক সংমিশ্রণে বন্ধ-ফর্মের ঘনত্ব নেই। প্রতিটি স্কেল করা চি-স্কোয়ার একটি গামা, তবে বিভিন্ন সি আই প্যারামিটারের সাহায্যে গামার জন্য বিভিন্ন স্কেল প্যারামিটার বাড়ে - এবং এই জাতীয় গামার যোগফল বন্ধ-ফর্ম নয়, যদিও এর মানগুলি গণনা করা যায়।R=-মি-মি-মিআমি

জন্য ধ্রুবক, আমরা 12সি আর0 , এবং এগুলি একটি ম্যাট্রিক্সের ইগেনভ্যালু ... কোন ম্যাট্রিক্স? ওয়েল, লেখক স্বরলিপি ব্যবহার, সেট Λ লগ-সম্ভাবনা নিয়ে চট এবং হতে সি লগ-সম্ভাবনা নতিমাত্রা (expectational পদ) বাইরের পণ্য যাবে। সুতরাং ভি = Λ - 1 সেন্টিগ্রেড ( Λ ) - 1 হ'ল এমএলইয়ের অ্যাসিম্পটোটিক ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স।আমি12R0Λসিভী=Λ-1সি(Λ')-1

তারপরে কে V এর r × r উপরের তির্যক ব্লক হিসাবে সেট করুন । এমR×Rভী

এছাড়াও লিখতে ব্লক আকারেΛ

Λ=[ΛR×RΛ2'Λ2Λ3]

এবং সেট ( ওয়াট এর Schur পরিপূর্ণ নেতিবাচক হয় Λ )।W=Λr×r+Λ2Λ31Λ2WΛ

তারপরে হ'ল প্যারামিটারের সত্যিকারের মানগুলিতে মূল্যায়ন করা ম্যাট্রিক্স এম ডাব্লু এর ইগেনভ্যালুগুলি ।ciMW

সংযোজন
মন্তব্য উপ বৈধ মন্তব্য জবাবে (কখনও কখনও প্রকৃতপক্ষে, প্রশ্ন একটি সাধারণ ফলাফলের ভাগ করে নেওয়ার জন্য একটি springboard হই, এবং নিজেদের প্রক্রিয়ায় উপেক্ষিত হতে পারে), এখানে কিভাবে Wilks এর প্রমাণ আয়: Wilks যৌথ দিয়ে শুরু হয় এমএলই এর সাধারণ বন্টন এবং সম্ভাবনা অনুপাতের কার্যকরী অভিব্যক্তি অর্জন করতে এগিয়ে যায়। পর্যন্ত এবং তার eq সহ। , প্রমাণ এগিয়ে স্থানান্তর করতে পারেন এমনকি যদি আমরা ধরে নিই যে আমরা একটি distributional misspecification আছে: ওপি নোট হিসাবে, ভ্যারিয়েন্স সহভেদাংক ম্যাট্রিক্স পদ misspecification দৃশ্যকল্প বিভিন্ন থাকবে, কিন্তু সব Wilks করে নিতে ডেরাইভেটিভস, এবং চিহ্নিত অ্যাসেম্পোটোটিকভাবে উপেক্ষিত শর্তাদি। এবং তাই তিনি এক এ পৌঁছেছেন। [ 9 ][9][9]যেখানে আমরা দেখতে পাই যে সম্ভাবনা অনুপাতের পরিসংখ্যান, যদি স্পেসিফিকেশনটি সঠিক হয় তবে কেবল বর্গক্ষেত্রের স্ট্যান্ডার্ড সাধারণ এলোমেলো ভেরিয়েবলের যোগফল এবং তাই এগুলি স্বাধীনতার h - m ডিগ্রি সহ একটি চি-বর্গ হিসাবে বিতরণ করা হয় : (জেনেরিক স্বরলিপি )hmhমি

2lnλ=i=1hm(nθ^iθiσi)2dχhm2

কিন্তু আমরা যদি misspecification থাকে, তখন পদ যাতে ব্যবহার করা হয় কেন্দ্রিক এবং বিবর্ধিত MLE আকার পরিবর্তন করতে আর পদ ঐক্য সমান প্রতিটি উপাদান ভেরিয়ানস করতে হবে, এবং তাই একটি চি-বর্গক্ষেত্র মধ্যে একটি আদর্শ স্বাভাবিক আরভি ও যোগফল প্রতিটি শব্দ রুপান্তর হয়। এবং সেগুলি নয়, কারণ এই শর্তাদিলগ-সম্ভাবনার দ্বিতীয় ডেরিভেটিভগুলিরপ্রত্যাশিত মানগুলিকেজড়িত... তবে এমএলই তথ্য এবং ক্রিয়াকলাপের ফলে কার্যকারিতা সত্যিকারের বিতরণের ক্ষেত্রেই গ্রহণ করা যেতে পারে ডেটা সত্য বিতরণ অনুসরণ করে, যখন লগ-সম্ভাবনার দ্বিতীয় ডেরাইভেটিভগুলি ভুল ঘনত্ব অনুমানের ভিত্তিতে গণনা করা হয়। এন(θ^-θ)

সুতরাং ভুল বানানের অধীনে আমাদের মতো কিছু রয়েছে এবং আমরা যা করতে পারি তা হ'ল এর মধ্যে কারসাজি করা

-2Lnλ=Σআমি=1-মি(এনθ^আমি-θআমিএকটিআমি)2

-2Lnλ=Σআমি=1-মিσআমি2একটিআমি2(এনθ^আমি-θআমিσআমি)2=Σআমি=1-মিσআমি2একটিআমি2χ12

-মি


1
সুতরাং, যখন মডেলটি ভুল বানান করা হয় এটি স্ট্যান্ডার্ড ফলাফলের পুনরায় বিশ্রাম। এই ফলাফলটি অনেকবার উত্পন্ন হয়েছে এবং পুনরায় প্রাপ্ত হয়েছে। সবচেয়ে স্পষ্ট ও আলোকিত উদ্দীপনা আমি দেখেছি ক্যান্ট 1982 "সম্ভাবনা অনুপাতের টেস্টগুলির শক্তসমর্থ বৈশিষ্ট্য " (বায়োমেট্রিকা 69:19)। তবে আপনি আমার প্রশ্নের উত্তর দেননি। আমার প্রশ্নটি উইলক্স 1938 এর প্রমাণ সম্পর্কে ছিল এবং কেন এটি ব্যর্থ হয়।
রাতসালাদ

2

জে-1জে-1জে-1কেজে-1আমিজেআমিজে-1কেজে-1=জে-1কে=জেকে=জে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.