মুদ্রা উল্টানো, সিদ্ধান্তের প্রক্রিয়া এবং তথ্যের মূল্য


14

নিম্নলিখিত সেটআপটি কল্পনা করুন: আপনার কাছে দুটি মুদ্রা, মুদ্রা এ রয়েছে যা ন্যায্য হওয়ার গ্যারান্টিযুক্ত , এবং কয়েন বি যা ন্যায্য বা নাও হতে পারে। আপনাকে 100 টি মুদ্রা ফ্লিপ করতে বলা হয় এবং আপনার উদ্দেশ্য হ'ল মাথা সর্বাধিক করা

মুদ্রা বি সম্পর্কে আপনার পূর্ববর্তী তথ্য হ'ল এটি 3 বার উল্টানো হয়েছিল এবং 1 টি মাথা বেরিয়েছে। যদি আপনার সিদ্ধান্তের নিয়মটি 2 মুদ্রার প্রধানগুলির প্রত্যাশিত সম্ভাবনার তুলনা করার উপর ভিত্তি করে তৈরি হয় তবে আপনি মুদ্রা এ 100 বার ফ্লিপ করবেন এবং এটি দিয়ে সম্পন্ন করবেন। সম্ভাবনার যুক্তিসঙ্গত বায়েশিয়ান অনুমান (উত্তরোত্তর উপায়) ব্যবহার করার পরেও এটি সত্য, যেহেতু আপনার বিশ্বাস করার কোনও কারণ নেই যে মুদ্রা বি আরও মাথা দেয়।

যাইহোক, মুদ্রা বি যদি আসলে মাথার পক্ষে পক্ষপাতদুষ্ট হয়? অবশ্যই "সম্ভাব্য প্রধানগণ" কয়েকবার মুদ্রা বিটিকে উল্টিয়ে ছেড়ে দিয়েছিলেন (এবং সুতরাং এর পরিসংখ্যানগত বৈশিষ্ট্য সম্পর্কে তথ্য অর্জন) কিছু দিক থেকে মূল্যবান হতে পারে এবং তাই আপনার সিদ্ধান্তের কারণ হয়ে দাঁড়াবে। এই "তথ্যের মান" কীভাবে গাণিতিকভাবে বর্ণনা করা যায়?

প্রশ্ন: এই পরিস্থিতিতে আপনি কীভাবে একটি অনুকূল সিদ্ধান্তের নিয়মটি গাণিতিকভাবে তৈরি করবেন?


আমি আমার উত্তর মুছে ফেলছি। অনেক লোক অভিযোগ করছে যে আমি স্পষ্টভাবে একটি পূর্ব ব্যবহার করেছি (যা সাহিত্যে মানসম্মত)। ক্যাম ডেভিডসন পাইলনের ভুল উত্তরটি উপভোগ করুন যেখানে তিনি একটি পূর্বের (তবে কারওই কোনও অবজেক্ট )ও ধরে নিচ্ছেন এবং অনুকূল পদ্ধতি হিসাবে দাবি করেছেন যা সর্বোত্তম নীচে 1.035 is
ডগলাস জারে

হু, এ সব কখন হয়েছিল? বিটিডাব্লু, আমি ডগলাসের সাথে একমত হব যে পূর্ব ব্যবহার করা ভাল। আমি আমার অনুকূলতা দৃ ret়তাও প্রত্যাহার করি।
ক্যাম.ড্যাভিডসন.পিলন

আমি ক্যামের সমাধানটি গ্রহণ করছি কারণ এটি আমাকে অনেক সাহায্য করেছিল। আমি সম্মতি দিচ্ছি যে এটি সর্বোত্তম নয়, তবে যদি কেউ কেউ সাধারণ অনুকূল সমাধানটি নির্দেশ করতে না পারে যা সহজেই গণনা করা যায়, তবে এটি সেরা বাজি।
এম সাইফার

"বায়সিয়ান?" ট্যাগিত প্রশ্নের উত্তর দেওয়ার জন্য কেন আমি এতটা খারাপ ছিলাম যে আমি পূর্বের (যা আমি স্পষ্টভাবে বলেছি) ব্যবহার করেছি?
ডগলাস জারে

1
আমি পূর্বের ব্যবহারের সমালোচনা করিনি। আমি একটি সাইডেনোট হিসাবে উল্লেখ করেছি যে ইউনিফর্মের চেয়ে আরও উপযুক্ত প্রিয়ার থাকতে পারে (যেমন জেফরি এর) তবে এটি কেবল প্রশ্নের সাথে সামান্য প্রাসঙ্গিক। আপনার সমাধানটি পুরোপুরি সূক্ষ্ম ছিল, কেবল আমার পক্ষে তেমন কার্যকর নয় যেহেতু এটি সহজেই সাধারণ হয় না।
এম সাইফার

উত্তর:


7

মাল্টি-সশস্ত্র ডাকাত

এটি একটি বহু-সশস্ত্র ডাকাত সমস্যার একটি বিশেষ ক্ষেত্রে । আমি একটি বিশেষ কেস বলছি কারণ সাধারণত আমরা মাথার কোনও সম্ভাবনা জানি না (এই ক্ষেত্রে আমরা জানি যে একটি মুদ্রার মধ্যে সম্ভাব্যতা রয়েছে 0.5)।

আপনি উত্থাপিত ইস্যুটি এক্সপ্লোরেশন বনাম শোষণ দ্বিধা হিসাবে পরিচিত : আপনি কি অন্যান্য বিকল্পগুলি ঘুরে দেখেন, বা আপনি যেটিকে সর্বোত্তম বলে মনে করেন তার সাথে কি লেগে থাকেন ? আপনি সমস্ত সম্ভাব্যতা জানেন তা ধরে নিয়ে একটি তাত্ক্ষণিক অনুকূল সমাধান রয়েছে : কেবলমাত্র জয়ের সর্বোচ্চ সম্ভাবনার সাথে মুদ্রাটি বেছে নিন। সমস্যাটি যেমন আপনি চিহ্নিত করেছেন, তা হ'ল আসল সম্ভাবনাগুলি কী তা সম্পর্কে আমরা অনিশ্চিত ।

বিষয়টিতে প্রচুর সাহিত্য রয়েছে, এবং অনেকগুলি ডিটারমিনিস্টিক অ্যালগরিদম রয়েছে তবে আপনি যেহেতু এই বায়েশিয়ান ট্যাগ করেছেন, আমি আপনাকে আমার ব্যক্তিগত প্রিয় সমাধান সম্পর্কে বলতে চাই: বায়েশিয়ান দস্যু !

বায়েশিয়ান দস্যু সমাধান

এই সমস্যা সম্পর্কে বায়েশিয়ান পদ্ধতি খুব স্বাভাবিক is " মুদ্রা X এর দুজনের চেয়ে ভাল হওয়ার সম্ভাবনা কী?" এর উত্তরে আমরা আগ্রহী ।

একটি অগ্রণী , ধরে নেওয়া আমরা এখনও কোনও মুদ্রা ফ্লিপ করে না লক্ষ্য করেছি, মুদ্রা বি এর প্রধানদের সম্ভাবনা কী হতে পারে সে সম্পর্কে আমাদের কোনও ধারণা নেই, এই অজানা নির্দেশ করুন । সুতরাং আমাদের এই অজানা সম্ভাবনার পূর্ববর্তী ইউনিফর্ম বিতরণ বরাদ্দ করা উচিত। বিকল্পভাবে, কয়েন এ এর ​​জন্য আমাদের পূর্বের (এবং উত্তরোত্তর) তুচ্ছভাবে সম্পূর্ণভাবে 1/2 এ ঘন করা হয়।pB

যেমনটি আপনি বলেছেন, আমরা মুদ্রা বি থেকে 2 টি লেজ এবং 1 টি মাথা নিরীক্ষণ করি, আমাদের আমাদের উত্তরোত্তর বিতরণ আপডেট করতে হবে। পূর্বে একটি অভিন্ন হিসাবে ধরে নেওয়া এবং ফ্লিপগুলি হলেন বার্নোল্লি মুদ্রা-ফ্লিপস, আমাদের উত্তরোত্তর একটি । উত্তরোত্তর বিতরণ বা এখন এবং এ এবং বি তুলনা:Beta(1+1,1+2)

এখানে চিত্র বর্ণনা লিখুন

একটি আনুমানিক অনুকূল কৌশল সন্ধান করা

এখন আমাদের পোস্টারিয়র আছে, কী করব? আমরা "সম্ভাবনার মুদ্রা বি কী দুটির চেয়ে ভাল" - এর উত্তর দিতে আগ্রহী (আমাদের বায়েশীয় দৃষ্টিকোণ থেকে মনে রাখবেন, যদিও এর একটি নির্দিষ্ট উত্তর রয়েছে তবে কোনটি উত্তম, আমরা কেবল সম্ভাবনার মধ্যে কথা বলতে পারি):

wB=P(pb>0.5)

প্রায় অনুকূল সমাধানটি হ'ল সম্ভাব্যতা এবং বি এর সম্ভাব্যতা সহ বি বেছে । এই স্কিমটি প্রত্যাশিত লাভকে সর্বাধিক করে তোলে। বন্টন জানি হিসাবে সংখ্যার সাথে গণনা করা যেতে পারে, কিন্তু একটি আকর্ষণীয় উপায় নিম্নলিখিত:wB1wBwB

1. Sample P_B from the posterior of coin B
2. If P_B > 0.5, choose coin B, else choose coin A.

এই স্কিমটি স্ব-আপডেট করাও। আমরা যখন মুদ্রা বি বাছাইয়ের ফলাফলটি পর্যবেক্ষণ করি, আমরা এই নতুন তথ্যটি সহ আমাদের উত্তরোত্তর আপডেট করি এবং আবার নির্বাচন করি। এইভাবে, মুদ্রা বিটি যদি খারাপ হয় তবে আমরা এটিকে কমই বেছে নেব, এবং এটি মুদ্রা বিটি সত্যই ভাল, আমরা আরও প্রায়ই এটি বেছে নেব। অবশ্যই, আমরা বায়েশিয়ান, তাই আমরা কখনই নিশ্চিত হতে পারি না মুদ্রা বি আরও ভাল। এর মতো সম্ভাব্যতা বাছাই হ'ল অনুসন্ধান-শোষণের দ্বিধাদ্বন্দ্বের সর্বাধিক প্রাকৃতিক সমাধান

এটি থম্পসন স্যাম্পলিংয়ের একটি বিশেষ উদাহরণ । অনলাইন বিজ্ঞাপনে আরও তথ্য এবং শীতল অ্যাপ্লিকেশনগুলি গুগলের গবেষণা পত্র এবং ইয়াহুর গবেষণা কাগজে পাওয়া যাবে । আমি এই জিনিস পছন্দ!


2
আমি কৌশলটি সঠিক বলে মনে করি না। আমি মনে করি না আপনার বাছাই করা উচিত বা সম্ভবত বা সম্ভবত বাছাই করা উচিত।
ডগলাস জারে

2
আমি মনে করি না যে এই কাগজটি যা বলে তা যা বলে তা বলে। আপনি যদি একমত না হন তবে দয়া করে আপনি সেই কৌশলটির অধীনে প্রাপ্ত প্রত্যাশিত মাথাগুলির গণনা করুন।
ডগলাস জারে

5
আমি মনে করি না এটি সর্বোত্তমের কাছাকাছি। এটি প্রস্তাব দেয় যে প্রথম ফ্লিপে আপনি সম্ভাব্যতা 1/2 দিয়ে বি বেছে নিয়েছিলেন। এটি স্পষ্ট হওয়া উচিত যে আপনি এ নির্বাচন করেন তবে আপনি কোনও তথ্য পান না, তাই আপনার সমস্ত সময় বি নির্বাচন করা উচিত। আপনি যখন এটি তৈরি করেন তখন আপনি এই ত্রুটির দ্বারা যে পরিমাণ পরিমাণ হারান তা প্রায় 0.12 হয়, সুতরাং প্রথম ধাপে এটি আপনার জন্য 0.06 এর জন্য ব্যয় করে। আপনি পরবর্তী কয়েকটি পদক্ষেপে কোনও তথ্য সংগ্রহ করবেন কিনা তা সিদ্ধান্ত নেওয়ার জন্য মোটামুটি একটি মুদ্রা উল্টাতে গেলে আপনি একই পরিমাণ হারাবেন। প্রথম দিকে উল্টানো মানে আপনি যে কোনও সুবিধা পেতে পারেন তা কাজে লাগানোর জন্য আপনার কাছে সময় কম।
ডগলাস জারে

3
এই সম্ভাব্য পদ্ধতিটি সর্বোত্তম নয় তা দেখার আরেকটি উপায় হ'ল শেষ ফ্লিপটি বিবেচনা করা। শেষ টসে বি ফ্লিপ করবেন কিনা তা স্থির করার জন্য আপনার বি এর বিতরণ থেকে নমুনা নেওয়া উচিত নয়, আপনার গড় মানটি সাথে তুলনা করা উচিত । 0.5
ডগলাস জারে

1
@ ডগলাসজারে যদি আপনার একমাত্র পরিমাপটি আমাদের মুদ্রাটিকে সরিয়ে ফেলা হয়, তবে সর্বাধিক কৌশলটি সর্বদা কয়েন এ বাছাই করা হয় তবে এটি অসম্পূর্ণ কারণ এটি প্রশংসনের দিকে বেশি জোর দেয় , এবং সম্ভাব্য উত্সাহে যথেষ্ট নয় অন্বেষণ । আপনার পরামর্শটির যৌক্তিক উপসংহারটি হ'ল, আমরা যদি পরীক্ষাটি আবার চালু করি, একবার কয়েন বি ফ্লিপ করতে: এটি যদি লেজ হয়, সর্বদা এটিকে বেছে নিন; অন্যথায় এটা আবার টুসকি, যদি নেতৃবৃন্দ সবসময় বি চয়ন করা হয়
Cam.Davidson.Pilon

9

এটি বহু-সশস্ত্র ডাকাত সমস্যার একটি সাধারণ ঘটনা । আপনি যেমন নোট করেছেন, আপনি অজানা মুদ্রা ব্যবহার করে আপনি যে তথ্য সংগ্রহ করেছেন তা ভারসাম্য বজায় রাখতে চান যখন আপনি মনে করেন যে আপনার কাছে থাকা জ্ঞানকে কাজে লাগানোর বিরুদ্ধে অল্প সময়ে রানকে সাব্পটিমাল বলে মনে হচ্ছে।

ধ্রুপদী বহু-সশস্ত্র ডাকাত সমস্যায়, আপনি কোনওটি মুদ্রার সম্ভাবনা সম্পর্কে নিশ্চিত নন। তবে, এখানে আপনাকে দেওয়া হয়েছে যে আপনি মুদ্রা এ এর ​​মান জানেন, সুতরাং আপনি যখন এ ফ্লিপ করবেন তখন কোনও তথ্য পাবেন না। প্রকৃতপক্ষে, আপনি এ এর ​​স্টোকাস্টিক প্রকৃতিটি উপেক্ষা করতে পারেন এবং ধরে নিতে পারেন যে আপনি এ এর পছন্দ অনুসারে একটি ফ্ল্যাট এর অর্থ এটি যদি কয়েন A এ ফ্লিপ করা কখনও সঠিক হয় তবে আপনার A. কে উল্টানো উচিত So কখন আপনাকে বি ছেড়ে দেওয়া উচিত তার জন্য সর্বোত্তম স্টপিং নিয়মটি অনুসন্ধান করতে চান এটি বি এর জন্য পরামিতিগুলির পূর্ব বিতরণ এবং পরীক্ষার সংখ্যার উপর নির্ভর করে। একটি বৃহত্তর পরীক্ষার সাথে, অন্বেষণের আরও বেশি মূল্য থাকে, সুতরাং আপনি বি আরও পরীক্ষা করে দেখবেন।1/2

সাধারণভাবে, আমি মনে করি আপনি গতিশীল প্রোগ্রামিং সমস্যা থেকে দূরে সরে যেতে পারবেন না, যদিও এমন বিশেষ কিছু ক্ষেত্রে থাকতে পারে যেখানে অনুকূল কৌশলটি খুঁজে পাওয়া যায় এবং আরও সহজভাবে পরীক্ষা করা যায়।

আগে ইউনিফর্ম সহ, এখানে আপনার থামানো উচিত:

(0 heads,3 tails),(1 head,5 tails),(2 heads,6 tails),(3,7),(4,8),...(31,35),(32,35),(33,36),(34,37),...(41,44),(42,44),...(46,48),(47,48),(48,49),(49,50)

এই কৌশল অনুসারে, আপনি মাথা সংগ্রহ করার প্রত্যাশা করছেন ।61.3299

আমি ইক্যুইটিগুলি গণনা করতে নিম্নলিখিত গাণিতিক কোডটি ব্যবহার করেছি:

Clear[Equity];
Equity[n_, heads_, tails_] := Equity[n, heads, tails] = 
    If[n == 0, heads, 
       Max[1/2 + Equity[n - 1, heads, tails], 
           (heads + 1)/(heads + tails + 2) Equity[n - 1, heads + 1, tails] + 
           (tails + 1)/(heads + tails + 2) Equity[n - 1, heads, tails + 1]
           ]
      ]

তুলনা করার জন্য, থম্পসন স্যাম্পলিং হিউরিস্টিক (যা ক্যাম ডেভিডসন পাইলন দাবি করেছেন যে অনুকূল) তিনি গড়ে 60.2907 হেড দেন, যা 1.03915 কম হয়। থম্পসন স্যাম্পলিংয়ে সমস্যাটি রয়েছে যে এটি কখনও কখনও বি নমুনা দেয় যখন আপনার কাছে যথেষ্ট তথ্য থাকে যে এটি ভাল বাজি নয়, এবং প্রায়শই বি স্যাম্পল হওয়ার সম্ভাবনাগুলি নষ্ট করে দেয়, যখন তথ্য সার্থক হয়। এই ধরণের সমস্যায় আপনি প্রায়শই আপনার বিকল্পগুলির মধ্যে উদাসীন হন না এবং খাঁটি অনুকূল কৌশলও রয়েছে।

tp[heads_, tails_] := tp[heads, tails] = 
    Integrate[x^heads (1 - x)^tails / Beta[heads + 1, tails + 1], {x, 0, 1/2}]


Clear[Thompson];
Thompson[flipsLeft_, heads_, tails_] := Thompson[flipsLeft, heads, tails] = 
    If[flipsLeft == 0, heads, 
       Module[{p = tp[heads, tails]}, 
           p (1/2 + Thompson[flipsLeft-1,heads,tails]) + 
           (1-p)((heads+1)/(heads+tails+2)Thompson[flipsLeft-1,heads+1,tails] + 
           ((tails+1)/(heads+tails+2)) Thompson[flipsLeft-1,heads,tails+1])]]

আমি একমত যে একটি অনুকূল সমাধান আনুমানিক সমাধানের চেয়ে ভাল। আমি অবাক হয়েছি যদি এমন একটি সর্বোত্তম সাধারণ সমাধান রয়েছে যা বেশ কয়েকশ "কয়েন" দিয়ে গতিশীল পরিবেশে দক্ষতার সাথে মিলিসেকেন্ডের মধ্যে প্রয়োগ করা যেতে পারে। যদি তা না হয় তবে আমার ধারণা, থম্পসন স্যাম্পলিং সেরা বিকল্প।
এম সাইফার

থম্পসন নমুনা হ'ল একটি খুব কম অনুমান। আপনি যদি (সবচেয়ে খারাপ চতুষ্কোণে) সঠিক গণনার সমস্যায় যেতে না চান তবে আরও ভাল আনুমানিকতা আপনি ব্যবহার করতে পারেন তবে এখনও বড় ত্রুটিগুলি এড়াতে চান। আসলে, সঠিক গণনা রৈখিক কাছাকাছি হতে পারে।
ডগলাস জারে

আমাদের বিতে পূর্বের বিতরণ আছে তা ধরে নিতে কীসের অনুমতি দেয় ? আমি স্বীকার করি যে এই ধরণের ধারণাটি সমস্যাটিকে আরও ট্র্যাকটেবল করে তোলে, তবে খ এর ন্যায্যতার একটি অবজ্ঞাতভাবে বৈধ মূল্যায়নের উপস্থিতি আমার কাছে সন্দেহজনক। হ্যাঁ, আমাদের কিছু পূর্ববর্তী ফ্লিপের ফলাফল রয়েছে তবে সেগুলি এখনও এর জন্য কোনও মানের সাথে সামঞ্জস্যপূর্ণ । যদি প্রকৃতপক্ষে সম্ভাবনাটি এরও কম হয় তবে আপনি কী গ্রহণ করবেন তা পছন্দ করার আগে আমি তা বিবেচনা করি না : এটি একটি উদ্দেশ্যগত সত্য হবে যে আপনার পদ্ধতির সাথে থাকা মাথাগুলির প্রত্যাশিত সংখ্যা এরও কম । ( 0 , 1 ) 1 / 2 50PrB(heads)(0,1)1/250
whuber

আমি ম্যাথামেটিকাকে জানি না তাই আপনি কীভাবে আপনার প্রত্যাশিত শিরোনামের গণনা করেছেন তা আমি অনুসরণ করতে পারি না। সেই অংশটি বোঝানোর জন্য যত্নশীল? যদি আমরা জ্ঞান ধরে নিই যে [0,1] এ মুদ্রা বিয়ের পক্ষপাতিত্ব অভিন্ন বিতরণ থেকে আঁকা, তবে আপনি দেখতে পাচ্ছেন না যে আপনি কীভাবে 50/50 পরাজিত করতে পারেন।
জেরাদ

1
ডগলাস: কারণ আপনার উত্তর :-) আমি বেশি মনোযোগ দিয়েছি। দয়া করে আমাকে ভুল করবেন না - আমি এটি পছন্দ করি এবং আমি এই সুতোটি পছন্দ করি। আমি এটি উল্লেখ করা গুরুত্বপূর্ণ বলে মনে করেছি যে আপনার উত্তরটি পাওয়ার জন্য আপনাকে একটি অনুমান যুক্ত করতে হয়েছিল, এটাই সব। ব্যবহারিক বিষয় হিসাবে, অনেকগুলি ক্ষেত্রে - এটি সহ - এর কোনও পূর্ব নেই । (আমি নিশ্চিত যে কোনও ব্যক্তিগত পূর্বে তৈরি করতে চাইব না এবং তারপরে এটিতে প্রচুর অর্থ ব্যয় করতে হবে!) তবে অবশ্যই কোনও অপসারণ রয়েছে, যদি আপনি কোনও ক্ষতির ফাংশন নির্দিষ্ট করেন specify ("সর্বাধিক" প্রত্যাশা করা কোনও সম্পূর্ণ ক্ষতির ফাংশন নয়))
হুবুহু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.