আমি একটি মিশ্রণ মডেল যা আমি ডেটার একটি সেট দেওয়া সর্বোচ্চ সম্ভাবনা মূল্নির্ধারক খুঁজতে চান আছে এবং আংশিকভাবে পর্যবেক্ষিত তথ্য একটি সেট । আমি উভয় ই-পদক্ষেপ বাস্তবায়িত হয়েছে (প্রত্যাশা গণক দেওয়া এবং বর্তমান পরামিতি , এবং M-পদক্ষেপ), নেতিবাচক লগ-সম্ভাবনা প্রত্যাশিত দেওয়া কমান ।
যেহেতু আমি এটি বুঝতে পেরেছি, প্রতিটি পুনরাবৃত্তির জন্য সর্বাধিক সম্ভাবনা বৃদ্ধি পাচ্ছে, এর অর্থ হ'ল নেতিবাচক লগ-সম্ভাবনা অবশ্যই প্রতিটি পুনরাবৃত্তির জন্য হ্রাস পাবে? যাইহোক, আমি পুনরাবৃত্তি হিসাবে, অ্যালগরিদম প্রকৃতপক্ষে নেতিবাচক লগ-সম্ভাবনার হ্রাস মান উত্পাদন করে না। পরিবর্তে, এটি হ্রাস এবং বৃদ্ধি উভয়ই হতে পারে। উদাহরণস্বরূপ এটি রূপান্তর পর্যন্ত নেতিবাচক লগ-সম্ভাবনার মান ছিল:
এখানে কি আমি ভুল বুঝেছি?
এছাড়াও, সিমুলেটেড ডেটার জন্য যখন আমি প্রকৃত সুপ্ত (অরক্ষিত) ভেরিয়েবলগুলির সর্বাধিক সম্ভাবনা সম্পাদন করি, তখন আমার পুরোপুরি উপযুক্ত ফিট হয়, এতে বোঝা যায় যে কোনও প্রোগ্রামিং ত্রুটি নেই। ইএম অ্যালগরিদমের জন্য এটি প্রায়শই স্পষ্টভাবে সাবঅপটিমাল সমাধানগুলিতে রূপান্তরিত হয়, বিশেষত প্যারামিটারগুলির একটি নির্দিষ্ট উপসেটের জন্য (যেমন শ্রেণিবদ্ধ ভেরিয়েবলগুলির অনুপাত)। এটি সুপরিচিত যে অ্যালগরিদম স্থানীয় মিনিমা বা স্টেশনারি পয়েন্টগুলিতে রূপান্তর করতে পারে, সেখানে কোনও প্রচলিত অনুসন্ধানের তাত্ত্বিক বা তেমনি বৈশ্বিক ন্যূনতম (বা সর্বোচ্চ) সন্ধানের সম্ভাবনা বাড়ানোর জন্য রয়েছে । এই বিশেষ সমস্যার জন্য আমি বিশ্বাস করি যে মিসের অনেকগুলি শ্রেণিবিন্যাস রয়েছে কারণ দ্বিবিভক্ত মিশ্রণের মধ্যে দুটি বিতরণের একটির সম্ভাব্যতার সাথে মান গ্রহণ করা হয় (এটি আজীবনের মিশ্রণ যেখানে সত্যিকারের আজীবন পাওয়া যায় যেখানে উভয় বিতরণের অন্তর্ভুক্ত নির্দেশ করে। সূচক অবশ্যই ডেটা সেটে সেন্সর করা আছে।
আমি যখন তাত্ত্বিক সমাধান (যা সর্বোত্তমের কাছাকাছি হওয়া উচিত) দিয়ে শুরু করব তার জন্য আমি একটি দ্বিতীয় চিত্র যুক্ত করেছি। তবে, যেমন দেখা যায় সম্ভাবনা এবং পরামিতিগুলি এই সমাধান থেকে স্পষ্টত নিকৃষ্টতর হিসাবে পরিবর্তিত হয়।
সম্পাদনা: পুরো ডেটাটি the যেখানে বিষয় জন্য একটি পর্যবেক্ষণের সময় , কোনও আসল ইভেন্টের সাথে সম্পর্কিত কিনা তা নির্দেশ করে অথবা যদি এটি সঠিক সেন্সর করা হয় (1 ইভেন্টটি চিহ্নিত করে এবং 0 টি ডান সেন্সারিংকে বোঝায়), হ'ল পর্যবেক্ষণের সময় (সম্ভবত 0) সূচক এবং অবশেষে হ'ল পর্যবেক্ষণটি জনসংখ্যার সাথে সম্পর্কিত (যেহেতু এর বিভাজনটি আমাদের কেবল 0 এবং 1 এর বিবেচনা করা দরকার)।
জন্য আমরা ঘনত্ব ফাংশন আছে , একইভাবে এটি লেজ বণ্টনের ফাংশনের সঙ্গে যুক্ত করা হয় । জন্য সুদের ঘটনা সৃষ্টি হবে না। যদিও কোন আছে এই ডিস্ট্রিবিউশন সঙ্গে যুক্ত, আমরা এটা হতে সংজ্ঞায়িত , এইভাবে এবং । এটি নিম্নলিখিত সম্পূর্ণ মিশ্রণ বিতরণও দেয়:
এবং
আমরা সম্ভাবনার সাধারণ ফর্মটি সংজ্ঞায়িত করতে এগিয়ে যাই:
এখন কেবলমাত্র আংশিকভাবে পর্যবেক্ষণ করা হবে যখন , অন্যথায় এটি অজানা। পূর্ণ সম্ভাবনা হয়ে যায়
যেখানে হ'ল আনুষঙ্গিক বিতরণের ওজন (সম্ভবত কিছু লিঙ্ক ফাংশন দ্বারা কিছু covariates এবং তাদের নিজ নিজ সহগের সাথে যুক্ত)। বেশিরভাগ সাহিত্যে এটি নিম্নলিখিত লগলিস্টিভিলিটিতে সহজতর হয়েছে
জন্য এম-পদক্ষেপ , এই ফাংশন বড় করা হয়, যদিও 1 বৃহদায়ন পদ্ধতিতে তার সম্পূর্ণতা নয়। পরিবর্তে আমরা নই যে ।
K: th + 1 ই-পদক্ষেপের জন্য , আমাদের অবশ্যই (আংশিক) অব্যাহত সুপ্ত পরিবর্তনশীল এর প্রত্যাশিত মানটি খুঁজে বের করতে হবে । আমরা সত্যটি ব্যবহার করি যে , তারপরে ।
এখানে আমরা
যা আমাদের
(এখানে নোট করুন যে , সুতরাং কোনও পর্যবেক্ষণযোগ্য ইভেন্ট নেই, সুতরাং data ডেটার সম্ভাবনাটি লেজ বিতরণ ফাংশন দ্বারা দেওয়া হয়।