উইলসের উপপাদ্যটির সাথে একটি সীমাবদ্ধ মিশ্রণে গাউসিয়ানদের সংখ্যাটি সন্ধান করছেন?


11

ধরুন আমার কাছে স্বাধীন, অভিন্নরূপে বিতরণ করা অবিচ্ছিন্ন পর্যবেক্ষণ এবং কীভাবে উত্পন্ন হয়েছিল সে সম্পর্কে দুটি অনুমানের একটি সেট রয়েছে :xx

H0 : অজানা গড় এবং বৈকল্পিক সহ একক গাউসীয় বিতরণ থেকে আঁকা।x

HA : অজানা গড়, বৈকল্পিক এবং মিশ্রণ সহগ সহ দুটি গাউসিয়ানদের মিশ্রণ থেকে আঁকা।x

যদি আমি সঠিকভাবে বুঝতে পারি তবে এগুলি নেস্টেড মডেল যেহেতু প্রতিনিধিত্ব করে সেই মডেলটি এর পরিপ্রেক্ষিতে বর্ণিত হতে পারে যদি আপনি দুটি গাউসিয়ানদের পরামিতিগুলিকে অভিন্ন হতে বা দুটি মিশ্রণ দুটি গৌসিয়ানর মধ্যে একটির জন্য শূন্য হতে বাধা দেন। H0HA

সুতরাং, দেখে মনে হচ্ছে আপনার এর পরামিতিগুলি অনুমান করার জন্য EM অ্যালগরিদম ব্যবহার করতে সক্ষম হওয়া উচিত এবং তারপরে অধীন ডেটার সম্ভাবনা অধীনে উল্লেখযোগ্য পরিমাণে বেশি কিনা তা নির্ধারণ করার জন্য উপপাদ্যটি ব্যবহার করা । EM অ্যালগরিদম এখানে সর্বাধিক সম্ভাবনায় রূপান্তরিত হবে এই ধারণা নিয়ে বিশ্বাসের একটি ছোট লাফ রয়েছে, তবে এটি আমি প্রস্তুত করতে ইচ্ছুক।HAHAH0

আমি একটি মন্টে কার্লো সিমুলেশন মধ্যে এই চেষ্টা অভিমানী যে চেয়ে স্বাধীনতার আরো 3 ডিগ্রি রয়েছে (গড় এবং দ্বিতীয় গসিয়ান এবং মেশানো পরামিতি জন্য ভ্যারিয়েন্স)। আমি যখন থেকে ডেটা সিমুলেটেড করলাম তখন আমি একটি পি-মান বিতরণ পেয়েছি যা যথেষ্ট পরিমাণে অ-অভিন্ন এবং ছোট পি-মানগুলির জন্য সমৃদ্ধ। (যদি ইএম সত্যিকারের সর্বাধিক সম্ভাবনায় রূপান্তরিত না করে, তবে ঠিক বিপরীতটি আশা করা যায়)) উইলক্সের উপপাদ্যটি যে এই পক্ষপাতটি তৈরি করছে তাতে আমার প্রয়োগের ক্ষেত্রে কী ভুল?HAH0H0

উত্তর:


8

দ্বি-উপাদান মিশ্রণের মডেলটিতে নাল অনুমানটি কীভাবে অন্তর্ভুক্ত রয়েছে তার একটি সতর্কতার সাথে উল্লেখ করে, সমস্যাটি কী হতে পারে তা দেখা সম্ভব। মিশ্রণ মডেল পাঁচটি প্যারামিটার হন , তারপর এইচ 0 : ( μ 1 = μ 2  এবং  σ 1 = σ 2 )  বা  ρ { 0 , 1 } μ1,μ2,σ1,σ2,ρ

এইচ0:(μ1=μ2 এবং σ1=σ2) অথবা ρ{0,1}
কারণ পারেন দুই স্বাভাবিক মিশ্রণ উপাদান সমান, যে ক্ষেত্রে মিশ্রণ অনুপাত অপ্রাসঙ্গিক বা মিশ্রণ অনুপাত ρ 0 বা 1, যা মিশ্রণ উপাদান ক্ষেত্রে এক অপ্রাসঙ্গিক। উপসংহারটি হল যে নাল অনুমানটি নির্দিষ্ট করে দেওয়া যায় না, এমনকি স্থানীয়ভাবেও নয়, একটি সাধারণ পরামিতি বিধিনিষেধ হিসাবে যা প্যারামিটার স্পেসের মাত্রা 5 থেকে 2 এ ড্রপ করে।ρρ

নাল হাইপোথিসিস সম্পূর্ণ প্যারামিটার জায়গার একটি জটিল উপসেট, এবং নূরের নীচে পরামিতিগুলি সনাক্তকরণযোগ্যও নয়। উইলকের উপপাদ্যটি ভেঙে ফেলার জন্য প্রয়োজনীয় অনুমানগুলি প্রয়োজন, সম্ভবত উল্লেখযোগ্যভাবে লগ-সম্ভাবনার যথাযথ টেলর সম্প্রসারণ করা সম্ভব নয়।

এই বিশেষ সমস্যার সাথে আমার কোনও ব্যক্তিগত অভিজ্ঞতা নেই, তবে আমি অন্যান্য ক্ষেত্রে জানি যেখানে প্যারামিটারগুলি নালীর নীচে "অদৃশ্য হয়ে যায়", যা এখানেও মনে হয়, এবং এই ক্ষেত্রে উইলকের উপপাদ্যের সিদ্ধান্তগুলিও ভেঙে যায় down । একটি দ্রুত অনুসন্ধান অন্যান্য বিষয়ের সাথে এই প্রবন্ধটি প্রাসঙ্গিক বলে মনে হচ্ছে এবং যেখানে আপনি মিশ্রণের মডেলগুলির সাথে সম্পর্কিত সম্ভাবনা অনুপাত পরীক্ষার ব্যবহার সম্পর্কে আরও রেফারেন্স খুঁজে পেতে সক্ষম হবেন।


ধন্যবাদ। আমি ভেবেছিলাম এরকম কিছু সমস্যা হতে পারে তবে আমি নিশ্চিত ছিলাম না। উইলক্সের উপপাদ্যটির উদ্দেশ্যে কী নেস্টেড মডেল গঠন করে তার সূক্ষ্ম পয়েন্টগুলি সম্পর্কে আমি কিছুটা বিভ্রান্ত হয়ে পড়েছিলাম। শূন্যের অধীনে শনাক্তকরণ সম্পর্কে ভাল পয়েন্ট।
dsimcha

4

ρপ্যারামিটার স্পেসের সীমানায় এবং (খ) পরামিতিটি শূন্যের নীচে অজানা। এটি সাধারণ সম্ভাবনার অনুপাতের বিতরণটি অজানা বলে বলা যায় না! যদি আপনার সেটআপের সমস্ত 5 টি প্যারামিটার অজানা এবং আরও গুরুত্বপূর্ণভাবে - সীমাহীন- তবে এলআর পরিসংখ্যানের বিতরণ রূপান্তরিত হয় না। সমস্ত অজানা পরামিতি যদি আবদ্ধ হয়, তবে এলআর পরিসংখ্যানটি কাটা কাটা গাউসিয়া প্রক্রিয়াটির আধিপত্যে একঘেয়ে হয়ে থাকে। সাধারণের (5 প্যারামিটার) ক্ষেত্রে গণ্য করা সহজ নয় এবং আপনি যখন এটি ব্যবহার করেন তখনও এই জাতীয় প্রক্রিয়াটির আধিপত্যের বন্টন সহজেই অনুমান করা যায় না। দ্বি-উপাদান মিশ্রণ সম্পর্কিত কিছু ব্যবহারিক ফলাফলের জন্য এখানে দেখুন। মজার বিষয় হচ্ছে, কাগজটি দেখায় যে সাধারণ সেটআপগুলিতে, এলআর পরিসংখ্যান আসলে কিছু সাধারণ পরিসংখ্যানের চেয়ে কম শক্তিশালী। এই জাতীয় সমস্যাগুলিতে অ্যাসিম্পোটোটিক বিতরণ উপার্জনের জন্য সেমিনাল পেপারের জন্য এখানে দেখুন । সমস্ত ব্যবহারিক উদ্দেশ্যে, আপনি একটি EM ব্যবহার করে মিশ্রণটি ফিট করতে পারেন এবং তারপরে এলআর পরিসংখ্যান বিতরণে বুটস্ট্র্যাপ করতে পারেন। এটি কিছুটা সময় নিতে পারে যেহেতু ইএম ধীর গতির হিসাবে পরিচিত, এবং নমুনা আকারের প্রভাব ক্যাপচার করতে আপনার অনেকগুলি প্রতিলিপি প্রয়োজন। বিশদ জন্য এখানে দেখুন ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.