গাউসীয় মিশ্রণে উপাদানগুলির সর্বাধিক সংখ্যক


10

সুতরাং, কে-উপায়ে ক্লাস্টারের অনুকূল সংখ্যার একটি "ধারণা" পাওয়া ভাল নথিভুক্ত। আমি গাউসিয়ান মিশ্রণগুলিতে এটি করার একটি নিবন্ধ পেয়েছি , তবে আমি নিশ্চিত নই যে এটি দ্বারা আমি দৃ convinced়প্রত্যয়ী, এটি খুব ভাল করে বুঝতে হবে না। এটি করার কোন ... ধীরে ধীরে উপায় আছে?


4
আপনি নিবন্ধটি উদ্ধৃত করতে পারেন, বা কমপক্ষে এটির প্রস্তাবিত পদ্ধতির রূপরেখা তৈরি করতে পারেন? যদি আমরা
বেসলাইনটি

1
জিওফ ম্যাকল্যাচলান এবং অন্যান্যরা মিশ্রণ বিতরণ সম্পর্কিত বই লিখেছেন। আমি নিশ্চিত যে এগুলির মধ্যে একটি মিশ্রণের উপাদানগুলির সংখ্যা নির্ধারণের পদ্ধতির অন্তর্ভুক্ত রয়েছে। আপনি সম্ভবত সেখানে তাকান পারে। আমি জাবনোমানের সাথে একমত যে আপনার বিভ্রান্তি থেকে মুক্ত হওয়া সর্বাধিক সফল হবে যদি আপনি আমাদের বোঝান যে এটি কী সম্পর্কে আপনি বিভ্রান্ত হয়ে পড়েছেন।
মাইকেল আর চেরনিক

স্পিকার শনাক্তকরণের জন্য বর্ধমান কে-ইনের উপর ভিত্তি করে গাউসিয়ান মিশ্রণের আনুমানিক অনুকূল সংখ্যা .... এটির শিরোনাম, এটি ডাউনলোড বিনামূল্যে। এটি ক্লাস্টারগুলির সংখ্যাটি 1 দ্বারা বাড়িয়ে দেয় যতক্ষণ না আপনি দেখতে পান যে দুটি ক্লাস্টার একে অপরের মধ্যে নির্ভরশীল হয়ে ওঠে, এরকম কিছু। ধন্যবাদ!
জেকুইহুয়া

কেন সম্ভাবনার ক্রস-বৈধতা অনুমানকে সর্বাধিক সংখ্যক উপাদান বেছে নেবে না? এটি গণনামূলকভাবে ব্যয়বহুল, তবে মডেল নির্বাচনের জন্য ক্রস-বৈধতা বেশিরভাগ ক্ষেত্রেই বীট দেওয়া শক্ত, যদি না টিউন করার জন্য বিশাল সংখ্যক পরামিতি থাকে।
ডিকরান মার্সুপিয়াল

সম্ভাবনার ক্রস-বৈধতা প্রাক্কলনটি কি আপনি কিছুটা ব্যাখ্যা করতে পারেন? আমি ধারণা সম্পর্কে সচেতন না। ধন্যবাদ.
জেকুইহুয়া

উত্তর:


5

ডিকরান মার্সুপিয়ালের মন্তব্যে (ক্রস-বৈধতা) মাত্র কিছুটা বাড়ানো। মূল ধারণাটি হ'ল কোনও উপায়ে আপনার ডেটা প্রশিক্ষণ এবং বৈধতা সেটগুলিতে বিভক্ত করা, বিভিন্ন সংখ্যক উপাদান চেষ্টা করে সংশ্লিষ্ট প্রশিক্ষণ এবং বৈধতা সম্ভাবনার মানগুলির ভিত্তিতে সেরাটি নির্বাচন করা select

জিএমএমের সম্ভাবনা হ'ল সংজ্ঞা অনুসারে, যেখানে উপাদানগুলির (ক্লাস্টার) সংখ্যা এবং number , , মডেল প্যারামিটার। এর মান পরিবর্তন করে আপনি নীচের মত প্রশিক্ষণ এবং বৈধতা সেট জন্য GMM সম্ভাবনা প্লট করতে পারেন।পি(এক্স|π,μ,Σ)=Σকেπএন(এক্স|μ,Σ)কেπμΣকে

এখানে চিত্র বর্ণনা লিখুন

এই উদাহরণে এটি সুস্পষ্ট হওয়া উচিত যে উপাদানগুলির সর্বোত্তম সংখ্যাটি প্রায় 20 এর কাছাকাছি C এই সম্পর্কে একটি দুর্দান্ত ভিডিও রয়েছে কোরসেরায়, এবং এটিই আমি এখানে থেকে উপরের ছবিটি পেয়েছি।


পদ্ধতিটিতে ব্যবহৃত অন্য একটি হ'ল বেইসিয়ান তথ্য মাপদণ্ড (বিআইসি) : যেখানে সম্ভাবনা, কে প্যারামিটারের সংখ্যা এবং ডাটা পয়েন্টের সংখ্যা। এটি লগ সম্ভাবনার পরামিতিগুলির সংখ্যার জন্য একটি জরিমানা যুক্ত হিসাবে বোঝা যায়।

বিআমিসি=-2লগ(এল)+ +কেলগ(এন)
এলএন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.