আমি এটি একটি শট দেব এবং আমি আশা করি আপনি এটি পছন্দ করি! নীচে কিছু সূত্র রয়েছে যা আপনাকে ভয় দেখাতে পারে। আমি এটি আশা করি না, কারণ আমি তাদের সবচেয়ে সহজ পদ্ধতিতে ব্যাখ্যা করার জন্য যথাসাধ্য চেষ্টা করব।
এই দুটি সূত্র:
- সম্ভাবনা:P(r|θ,a,x)
- এবং উত্তরোত্তর:P(θ|D)
টি এল; ডিআর
থম্পসন স্যাম্পলিং আপনাকে অনুমতি দেয়
- আপনার মনে হয় যে সমস্ত মডেল প্যারামিটারগুলি সম্ভব তা থেকে একটি র্যান্ডম মডেল প্যারামিটার চয়ন করুন।
- সেই নির্দিষ্ট মডেলের প্যারামিটার অনুসারে একবার কাজ করুন।
- সেই নির্দিষ্ট মডেল প্যারামিটারের সাথে আপনি যে পুরষ্কার পেয়েছেন তা পর্যবেক্ষণ করুন।
- এই নতুন অভিজ্ঞতা থেকে শিখুন এবং সম্ভাব্য মডেল প্যারামিটারগুলি সম্পর্কে আপনার বিশ্বাস আপডেট করুন।
সম্ভাবনা ??
সম্ভাবনা এমন একটি বিষয় যা সংজ্ঞায়িত করে যে জিনিসগুলি কীভাবে সম্ভাব্য । এই ক্ষেত্রে সম্ভাবনা বলছেন কিভাবে সম্ভবত এটা যে আমরা পুরস্কার পেতে যদি খেলা কর্ম প্রসঙ্গের । উদাহরণস্বরূপ, যদি বৃষ্টি হচ্ছে (প্রসঙ্গ!) এবং আপনি একটি ছাতা নিচ্ছেন (পদক্ষেপ!) আপনি শুকনো থাকবেন (পুরষ্কার! :))। অন্যদিকে, যদি বৃষ্টি না হয় (প্রসঙ্গ!) এবং আপনি একটি ছাতা নিচ্ছেন (পদক্ষেপ!) আপনাকে অতিরিক্ত ওজন বহন করতে হবে (নেতিবাচক পুরষ্কার! :() তাই সম্ভাবনা হ'ল কেন্দ্রীয় বিষয় যা আপনি বুঝতে চান। সম্ভাবনা সম্পর্কে যদি আপনি সমস্ত কিছু জানেন তবে অনুকূল অভিনয় করা সহজ।rax
কি সেই আজব বৃত্তের ??
আপনি যেমন খেয়াল করে থাকতে পারেন আমি সেই অদ্ভুত বৃত্ত নামে থিটা নামে কিছু লিখিনি। (গণিতবিদদের অভ্যাস রয়েছে যেগুলি বোঝাও আরও কঠিন করে গ্রীক অক্ষর দিয়ে কোন অংশগুলি সবচেয়ে কঠিন hard এই মডেল পরামিতি উপস্থাপন করে। এই পরামিতিগুলি ব্যবহার করা হয় যখন প্রসঙ্গ + ক্রিয়া এবং পুরষ্কারের মধ্যে সম্পর্ক আরও কঠিন হয় difficult উদাহরণস্বরূপ, কোনও মডেলের প্যারামিটার হতে পারে যদি 1 মিমি বৃষ্টি আপনার মাথার উপরে পড়ে তবে আপনার পুরষ্কারটি কতটা নামবে। অন্য একটি মডেল প্যারামিটারে উল্লেখ করা যেতে পারে যে আপনি ছাতা নিলে আপনার পুরষ্কারটি কত কমে যায়। আমি কেবল বলেছি যে সম্ভাবনা হ'ল আপনি যা বুঝতে চান সেটি কেন্দ্রীয় বিষয়; এবং সম্ভাবনার কেন্দ্রবিন্দু হ'ল মডেল পরামিতি। আপনি যদি মডেল পরামিতি জানেনθθθ, আপনি কীভাবে প্রসঙ্গে + ক্রিয়াগুলি পুরষ্কারের সাথে সম্পর্কিত এবং এটি সর্বোত্তম কাজ করা সহজ you
সুতরাং আমরা কীভাবে এই মডেল পরামিতিগুলি জানতে পারি যে আমি সর্বাধিক পুরষ্কার পেতে পারি ??
এটি বহু-সশস্ত্র ডাকাত সমস্যার জন্য প্রয়োজনীয় প্রশ্ন। আসলে এটির দুটি অংশ রয়েছে। আপনি বিভিন্ন প্রসঙ্গে সমস্ত ধরণের ক্রিয়া অন্বেষণ করে মডেল পরামিতিগুলি অবিকল জানতে চান। তবে আপনি যদি ইতিমধ্যে জানেন যে কোন ক্রিয়াটি নির্দিষ্ট প্রসঙ্গে উপযুক্ত তবে আপনি সেই ক্রিয়াটি কাজে লাগাতে এবং যথাসম্ভব পুরষ্কার পেতে চান। সুতরাং আপনি যদি নিজের মডেলের পরামিতিগুলি সম্পর্কে অনিশ্চিত থাকেন আপনি কিছু অতিরিক্ত অনুসন্ধান করতে চাইতে পারেন। আপনি যদি আমাদের মডেল পরামিতি- সম্পর্কে বেশ নিশ্চিত হন তবে আপনি কোন পদক্ষেপ নেবেন তাও নিশ্চিত। এটি এক্সপ্লোরেশন বনাম শোষণ বাণিজ্য বন্ধ হিসাবে পরিচিত।θθ
এই পোস্টারিয়র সম্পর্কে আপনি কিছু বলেননি
এই অনুকূল আচরণের কী আপনার (UN) মডেল পরামিতি সম্পর্কে নিশ্চয়তা । এবং উত্তরোত্তরটি ঠিক বলেছেন: আমরা পূর্ববর্তী সমস্ত প্রসঙ্গে পূর্ববর্তী সমস্ত পুরষ্কার পেয়েছি, আপনি কতটা জানেন সম্পর্কে । উদাহরণস্বরূপ, আপনি যদি কখনও বাইরে না থাকেন তবে জানেন না যে বৃষ্টি আপনার মাথায় পড়লে আপনি কতটা নাখোশ হয়ে পড়েন। অন্য কথায়, আপনি অসুখী-যখন-বৃষ্টি-অন-হেড মডেল প্যারামিটার সম্পর্কে খুব অনিশ্চিত। আপনি যদি মাঝে মাঝে ছাতা সহ এবং তার বাইরে বৃষ্টিপাত করেন তবে আপনি এই অস্পষ্ট মডেল প্যারামিটার সম্পর্কে কিছু শিখতে পারেন।θθ
এখন থমসন স্যাম্পলিং এই সমস্ত অনিশ্চয়তার সাথে কী করার পরামর্শ দেয় ??
থমসন স্যাম্পলিং খুব সহজ কিছু প্রস্তাব দেয়: কেবল আপনার উত্তোলক থেকে একটি এলোমেলো মডেল পরামিতি চয়ন করুন, একটি পদক্ষেপ নিন এবং কী ঘটে তা পর্যবেক্ষণ করুন। উদাহরণস্বরূপ, যখন আপনি আগে কখনও বাইরে ছিলেন না, অসুখী-যখন-বৃষ্টি-অন-মাথার প্যারামিটার কিছু হতে পারে। সুতরাং আমরা কেবল একটি বাছাই করি, আমরা ধরে নিই যে বৃষ্টি যখন আমাদের মাথায় পড়ে তখন আমরা সত্যই অসন্তুষ্ট হই। আমরা দেখতে পাচ্ছি যে বৃষ্টি হচ্ছে (প্রসঙ্গে) তাই আমরা একটি ছাতা নিলাম (ক্রিয়া) কারণ আমাদের মডেল প্যারামিটারটি আমাদের জানায় যে আমরা এভাবে সর্বোচ্চ সওয়াব পেতে পারি। এবং প্রকৃতপক্ষে, আপনি লক্ষ্য করেছেন যে একটি ছাতা নিয়ে বৃষ্টিতে হাঁটতে আপনি খানিকটা কুরুচিপূর্ণ হন তবে সত্যই অসন্তুষ্ট হন না। আমরা এ থেকে শিখতে পারি যে বৃষ্টি + ছাতা ক্ষুধার্ত। পরের বার যখন বৃষ্টি হয় তখন আপনার মাথায় বৃষ্টি পড়লে কী হয় সে সম্পর্কে আপনি আবার এলোমেলো বিশ্বাস বাছুন। এবার এটি হতে পারে এটি আপনাকে মোটেই বিরক্ত করে না। যাহোক, আপনি একবার আপনার গন্তব্যে অর্ধপথে নেমে গেলে আপনি ভিজতে শুরু করছেন এবং আপনি শিখবেন যে ছাতা ছাড়াই বৃষ্টি সত্যিই খারাপ। এটি অখুশি-যখন-বৃষ্টি-অন-মাথায় আপনার অনিশ্চয়তা হ্রাস করে, কারণ এখন আপনি জানেন যে এটি সম্ভবত বেশি high
এটা খুব সহজ শোনায় !!
হ্যাঁ, এটি এত জটিল নয়। কঠিন অংশটি একটি মডেল প্যারামিটার পোস্টেরিয়র থেকে নমুনা দিচ্ছে। আপনার সমস্ত মডেলের পরামিতিগুলির উপর বিতরণ পাওয়া এবং বজায় রাখা, এটি আপনার নির্দিষ্ট সমস্যার জন্য উপযুক্ত। তবে ... এটি অবশ্যই করণীয় :)।