আমি শুরু করার জন্য সম্ভাব্যতা তত্ত্বটি ব্যবহার করব এবং তারপরে সম্ভাব্যতা তত্ত্ব আপনাকে যা করতে বলবে তার মধ্যে যে কোনও অ্যালগরিদম সবচেয়ে ভাল গণনা করবে pick সুতরাং আপনার কাছে প্রশিক্ষণ ডেটা , এবং কয়েকটি নতুন পূর্বসূরী এবং শ্রেণিবদ্ধ করার জন্য একটি বিষয় রয়েছে , পাশাপাশি আপনার পূর্বের তথ্য ।TXYI
সুতরাং আপনি সম্পর্কে জানতে চান । তারপরে সম্ভাব্যতা তত্ত্বটি বলে, কেবলমাত্র তার সম্ভাব্যতাটি গণনা করুন, আপনি যে সমস্ত তথ্য আপনার কাছে উপলভ্য করেছেন তা শর্তাধীন।Y
P(Y|T,X,I)
এখন আমরা সম্ভাব্যতা তত্ত্বের যে কোনও নিয়ম ব্যবহার করতে পারি যাতে এটি কীভাবে গণনা করতে হয় তা আমরা জানি into সুতরাং বয়েস উপপাদ্যটি ব্যবহার করে আপনি পাবেন:
P(Y|T,X,I)=P(Y|T,I)P(X|Y,T,I)P(X|T,I)
এখন সাধারণত সহজ - যদি না আপনি পূর্বের তথ্য প্রশিক্ষণের ডেটা (যেমন সম্পর্কিত) এর বাইরে সম্পর্কে কিছু না বলতে পারেন , তবে এটি উত্তরাধিকারের নিয়ম দ্বারা দেওয়া হয় - বা মূলত বারের পর্যবেক্ষণ ভগ্নাংশ প্রশিক্ষণ তথ্য সেট সত্য ছিল।পি( ওয়াই| টি, আমি)ওয়াইওয়াই
দ্বিতীয় মেয়াদে - এটি আপনার মডেল, এবং আপনার বেশিরভাগ কাজ কোথায় যাবে এবং যেখানে বিভিন্ন অ্যালগোরিদম বিভিন্ন কাজ করবে। গণনা করার জন্য কিছুটা জঘন্য জানোয়ার, সুতরাং এটি না করার জন্য আমরা নিম্নলিখিত কৌশলটি করি: (অর্থাত্ নয় ) এর বিরুদ্ধে গ্রহণ করুন । এবং আমরা পেতে:পি( এক্স| ওয়াই, টি, আমি)পি( এক্স| টি, আমি)ওয়াইওয়াই¯¯¯¯ওয়াই
ও ( ওয়াই)| টি, এক্স, আমি) = পি( ওয়াই| টি, এক্স, আমি)পি( ওয়াই¯¯¯¯| টি, এক্স, আমি)= পি( ওয়াই| টি, আমি)পি( ওয়াই¯¯¯¯| টি, আমি)পি( এক্স| ওয়াই, টি, আমি)পি( এক্স| ওয়াই¯¯¯¯, টি, আমি)
এখন আপনার মূলত একটি সিদ্ধান্তের নিয়ম দরকার - যখন প্রতিকূলতা / সম্ভাবনা নির্দিষ্ট মাত্রার উপরে থাকে, আপনি কে "সত্য" হিসাবে শ্রেণিবদ্ধ করবেন, অন্যথায় আপনি এটিকে "মিথ্যা" হিসাবে শ্রেণিবদ্ধ করবেন। এখন কেউ আপনাকে সত্যিকার অর্থে সহায়তা করতে পারে না - এটি এমন সিদ্ধান্ত যা সঠিক এবং ভুল সিদ্ধান্ত নেওয়ার পরিণতির উপর নির্ভর করে। এটি একটি বিষয়গত অনুশীলন, এবং কেবলমাত্র সঠিক প্রসঙ্গই এর উত্তর দিতে পারে। অবশ্যই "সাবজেকটিভিটি" কেবলমাত্র যদি উচ্চ অনিশ্চয়তা থাকে (তবে আপনার কাছে "ক্রেপ" মডেল / ডেটা রয়েছে যা উভয়কে খুব ভালভাবে পার্থক্য করতে পারে না) তা বিবেচনা করে।ওয়াই
দ্বিতীয় পরিমাণ - মডেল একটি "ভবিষ্যদ্বাণীমূলক" মডেল। ধরুন পূর্বে তথ্য একটি একক মডেল যা পরামিতি উপর নির্ভর করে ইঙ্গিত । তারপরে পরিমাণটি দেওয়া হয়:পি( এক্স| ওয়াই, টি, আমি)θওয়াই
পি( এক্স| ওয়াই, টি, আমি) = ∫পি( এক্স, θওয়াই| ওয়াই, টি, আমি) ঘθ = ∫পি( এক্স| θওয়াই, Y, টি, আমি) পি( θ)ওয়াই| ওয়াই, টি, আমি) ঘθওয়াই
এখন যদি আপনার মডেলটি "আইআইডি" জাতের হয়, তবে । তবে যদি আপনার একটি নির্ভরশীল মডেল থাকে যেমন অটোরিজ্রেসিভ মডেল, তবে এখনও বিষয়টি বিবেচনা করতে পারে। এবং হ'ল মডেলের পরামিতিগুলির বিতরণ - এটি সেই অংশ যা প্রশিক্ষণের ডেটা নির্ধারণ করবে। এবং সম্ভবত এখানেই বেশিরভাগ কাজ চলবে।পি( এক্স| θওয়াই, Y, টি, আমি) = পি( এক্স| θওয়াই, Y, আমি)টিপি( θ)ওয়াই| ওয়াই, টি, আমি)
তবে মডেলটি যদি নিশ্চিততার সাথে পরিচিত না হয়? ভাল এটা শুধু সংহত করার আরেকটি উত্পাত প্যারামিটার হয়ে, ঠিক যেমন জন্য করা হয়েছিল । Ith মডেল এবং এর পরামিতিগুলির কল করুন , এবং সমীকরণটি হয়ে ওঠে:θওয়াইএমআমিθ( i )ওয়াই
পি( এক্স| ওয়াই, টি, আমি) = ∑আমিপি( এমআমি| ওয়াই, টি, আমি) ∫পি( এক্স| θ( i )ওয়াই, এমআমি, Y, টি, আমি) পি( θ)( i )ওয়াই| এমআমি, Y, টি, আমি) ঘθ( i )ওয়াই
যেখানে
পি( এমআমি| ওয়াই, টি, আমি) = পি( এমআমি| ওয়াই, আমি) ∫পি( θ)( i )ওয়াই| এমআমি, Y, আমি) পি( টি| θ( i )ওয়াই, এমআমি, Y, আমি) ঘθ( i )ওয়াই
(দ্রষ্টব্য: হ'ল এই ফর্মের প্রস্তাব " মডেল যে সেটটি বিবেচনা করা হচ্ছে তার মধ্যে সেরা" and এবং আপনি যদি মডেলগুলির সাথে সংহত করছেন তবে কোনও অনুচিত প্রিয়ার অনুমতিপ্রাপ্ত নয় - অসম্পূর্ণতা এই ক্ষেত্রে বাতিল হবে না, এবং আপনি অজ্ঞান রেখে যাবে)Mi
এখন পর্যন্ত, সমস্ত ফলাফল সঠিক এবং অনুকূল (এটি বিকল্প 2 - ডেটাতে কিছু দুর্দান্ত অ্যালগরিদম প্রয়োগ করুন)। তবে এটি গ্রহণ করা একটি দুরূহ কাজ। বাস্তব বিশ্বে, গণিতের প্রয়োজনীয় ব্যবহার অনুশীলনে করা সম্ভব নয় - সুতরাং আপনাকে আপস করতে হবে। সঠিক সমীকরণগুলি করার জন্য আপনার সর্বদা "যেতে" হবে, আপনি যে গণিতকে সহজ করতে পারেন তার জন্য পিসিতে আপনার সময় সাশ্রয় হবে। তবে এই প্রথম পদক্ষেপটি গুরুত্বপূর্ণ, কারণ এটি "লক্ষ্য" নির্ধারণ করে এবং এটি কী করা হবে তা পরিষ্কার করে দেয়। অন্যথায় আপনি সম্ভাব্য বিকল্পগুলির একটি সম্পূর্ণ হোস্টের মধ্যে তাদের মধ্যে বেছে নেওয়ার মতো কিছুই না রেখেই বাকি রয়েছেন।
এখন এই পর্যায়ে, আমরা এখনও "প্রতীকী যুক্তি" বিশ্বে রয়েছি, যেখানে বাস্তবে কিছুই বোঝা যায় না। সুতরাং আপনার এগুলি আপনার নির্দিষ্ট সমস্যার সাথে যুক্ত করতে হবে:
- P(Mi|Y,I) হ'ল মডেলের পূর্ব সম্ভাবনা - সাধারণত সমস্ত i এর জন্য সমান হবে।
- P(θ(i)Y|Mi,Y,I) মডেলের প্যারামিটারগুলির জন্য পূর্ববর্তী (যথাযথ হতে হবে!)
- P(T|θ(i)Y,Mi,Y,I) মডেলটি দেওয়া প্রশিক্ষণের ডেটার সম্ভাবনা ফাংশন is
- P(θ(i)Y|T,Mi,Y,I) প্রশিক্ষণ ডেটার শর্তসাপেক্ষে আইথ মডেলের পরামিতিগুলির ।
- P(Mi|Y,T,I) প্রশিক্ষণ ডেটাতে শর্তসাপেক্ষে
for এর জন্য আরও একটি সমীকরণ থাকবেY¯¯¯¯
নোট করুন যে সমীকরণগুলি সরল করবে যদি ক) একটি মডেল স্পষ্ট বিজয়ী হয়, যাতে এবং খ) এই মডেলটির মধ্যে এর পরামিতিগুলি খুব নির্ভুল, তাই ইন্টিগ্রান্ডটি একটি ডেল্টা ফাংশনের সাথে সাদৃশ্যযুক্ত (এবং সংহতকরণ বিকল্প প্রতিস্থাপন বা প্লাগ-ইন অনুমানের খুব কাছাকাছি)। যদি এই উভয় শর্ত পূরণ হয় তবে আপনার রয়েছে:P(Mj|Y,T,I)≈1
P(X|Y,T,I)≈P(X|θ(j)Y,Mj,Y,T,I)θ(j)Y=θ^(j)Y
যা এই ধরণের সমস্যার "মানক" পদ্ধতির।