ওয়ারেন বাফেট সমস্যা


19

গ্রীষ্মে আমি যে অনলাইন লার্নিং / ডাকাত সমস্যা নিয়ে কাজ করেছিলাম তার বিমূর্ততা এখানে দেওয়া হল। আমি এর আগে কোনও সমস্যা দেখিনি এবং এটি বেশ আকর্ষণীয় দেখায়। আপনি যদি কোনও সম্পর্কিত কাজ সম্পর্কে জানেন তবে আমি উল্লেখগুলি প্রশংসা করব।

সমস্যা সেটিংসটি হ'ল বহু-সশস্ত্র ডাকাত। তোমার হাতে এন। প্রতিটি বাহুতে পুরষ্কারের চেয়ে অজানা তবে স্থির সম্ভাবনার বন্টন রয়েছে যা এটি খেলে আয় করা যায়। সংক্ষিপ্ততার জন্য, ধরে নেওয়া যাক যে প্রতিটি বাহু আমি সম্ভাব্যতার সাথে 10 ডলার পুরস্কার প্রদান করে [i] এবং পরীক্ষার সাথে reward 0 পুরষ্কার দিয়েছি। 1-পি [i]

প্রতি রাউন্ড টিতে আপনি খেলার জন্য একটি সেট এস [টি] বেছে নিন । আপনি যে প্রতিটি বাহু নির্বাচন করেন তার জন্য, আপনি সামনের দিকে $ 1 ডলার দিতে হবে। প্রতিটি নির্বাচিত বাহুর জন্য, আপনি একটি বাহুটির (অজানা) পুরষ্কারের সম্ভাবনা বন্টন থেকে প্রাপ্ত পুরষ্কার সংগ্রহ করেন। সমস্ত পুরষ্কারগুলি আপনার ব্যাংক অ্যাকাউন্টে জমা হয় এবং সমস্ত অ্যাকাউন্ট সেই অ্যাকাউন্ট থেকে কেটে নেওয়া হয়। এছাড়াও, প্রতিটি পুনরাবৃত্তির শুরুতে আপনি $ 1 এর ক্রেডিট পান ।

সমস্যাটি হ'ল লম্বা পর্যায়ে দিগন্তে সর্বাধিক মুনাফা অর্জনের জন্য প্রতিটি পুনরাবৃত্তিতে খেলতে অস্ত্রের উপসেটটি বেছে নেওয়ার নীতি বিকাশ করা (যেমন খেলার জন্য বিয়োগ বিয়োগের ফিগুলি), সেই সীমাবদ্ধতার সাপেক্ষে যে এটি অবশ্যই অ-নেতিবাচক অ্যাকাউন্ট ব্যালেন্স বজায় রাখতে হবে সর্বদা.

প্রতি বাহু পুরষ্কার বিতরণগুলি পূর্ব বিতরণ থেকে চয়ন করা হয় বা বিরোধী দ্বারা নির্বাচিত কিনা তা আমি নির্দিষ্ট করেছিলাম না। উভয় পছন্দ অর্থপূর্ণ। প্রতিকূল সূত্রটি আমার কাছে আরও আবেদনময়, তবে সম্ভবত অগ্রগতি করা আরও কঠিন। এখানে, বিরোধীরা বিতরণগুলির একটি ভেক্টর (ডি 1, ডি 2, .., ডিএন) চয়ন করে। বিতরণগুলি দেওয়া, সর্বোত্তম বাজেটের ভারসাম্য নীতি হ'ল সমস্ত বাহু খেলুন যার প্রত্যাশিত পুরষ্কার $ 1 এর চেয়ে বেশি। পিটিকে এই সর্বোত্তম সর্বজ্ঞানী নীতির প্রতি-পদক্ষেপের মুনাফা হতে দিন। আমি চাই আমার অনলাইন নীতিটি আফসোসকে কমিয়ে আনুক (অর্থাত্ একটি টাইম উইন্ডো টি দিয়ে লাভের ক্ষতি) এই সর্বজ্ঞানী নীতিটি ছড়িয়ে দেওয়া উচিত।


আপনি কি নিশ্চিত যে সর্বোত্তম নীতিটি এমন সমস্ত বাহু খেলা যাঁর প্রত্যাশিত পুরষ্কার প্রতি রাউন্ডে $ 1 এর চেয়ে বেশি? আপনার যদি কঠোর প্রতিবন্ধকতা থাকে যে আপনাকে সর্বদা নেতিবাচক অ্যাকাউন্টের ভারসাম্য বজায় রাখতে হবে, এমন গোলগুলি হতে পারে যাতে আপনাকে খেলতেও দেওয়া হয় না।
ম্যাথিয়াস

সুতরাং আপনি পুরষ্কারের সম্ভাবনাগুলি জানেন না, তবে আপনি প্রতিটি স্বতন্ত্র হাত থেকে বেতনটি বলতে পারেন?
ডেভিড থর্নলি

আপনি সম্ভাবনা জানেন না এবং আপনি প্রত্যাশিত পুরষ্কারগুলিও জানেন না। আমি নিজের সাথে তুলনা করতে চাই এমন একটি সর্বজ্ঞ "সর্বোত্তম" নীতি যাইহোক সমস্ত অস্ত্র 1 এর চেয়ে বেশি পুরষ্কারের সাথে খেলতে পারে কারণ এটি সর্বজ্ঞ।
মার্টিন পল

1
আমি একটি বুনো অনুমান করব যে রাউন্ডের পরে আপনি আপনার প্রত্যাশিত একটি ধ্রুবক ফ্যাক্টরের মধ্যে পেতে পারেন, যার পরে সমস্যাটি তার বেশিরভাগ অস্বাভাবিক চরিত্রটি হারিয়েছে বলে মনে হয়। এর নিম্ন-সীমানা এমন একটি উদাহরণ অনুসরণ করে যেখানে কেবলমাত্র একটি বাহুতে শূন্য-শোধের পরিমাণ নেই। তাত্ক্ষণিকভাবে আমি একটি উপরের সীমাটি দেখতে পাচ্ছি না। Ω ( এন )Θ(N)Ω(N)
ওয়ারেন স্কুডি

সংশোধন: রাউন্ডের পরে আপনি সম্ভবত সর্বোত্তম আয়ের একটি ধ্রুবক ফ্যাক্টরের মধ্যে যাওয়ার গ্যারান্টি দিতে পারবেন না। যাইহোক আপনি সম্ভবত অস্ত্র থেকে যে আয় প্রত্যাশিত প্রত্যাশা করেছেন কমপক্ষে 2 ডলার থেকে তুলনামূলকভাবে এই গ্যারান্টিটি পেতে পারেন। Θ(N)
ওয়ারেন শুডি

উত্তর:


13

আমি ভাবছি এই সমস্যাটির জন্য প্রচুর সম্ভাব্য পন্থা রয়েছে (যার মধ্যে বেশিরভাগই আমি নিশ্চিত যে আপনি বিবেচনা করেছেন) - এখানে কয়েকটি ধারণা / উল্লেখ রয়েছে।

  • প্রতিটি বাহু স্বাধীনভাবে টানতে না টানানোর সিদ্ধান্ত নিয়ে আপনি স্বাধীন সমান্তরাল একক-বাহু ডাকাত গেমস হিসাবে এটি খেলতে পারেন । পুরষ্কারগুলি স্বাধীনভাবে বিতরণ করা হলে এটি বিশেষত ভাল কাজ করা উচিত।N
  • প্রতিটি বাহুটিকে একটি নতুন বাহু হিসাবে মঞ্জুর করুন এবং একটি এক্সপিএন-টাইপ অ্যালগরিদম চালান। এটি একটি আফসোস দেয় - এত দুর্দান্ত নয়।O(2N/2T1/2)
  • আসন্ন এনআইপিএস ২০১০ এর কাগজে, সাটেন কেল, রব স্কাপায়ার এবং আমি কেসটি বিবেচনা করি যেখানে একজন একবারে অস্ত্রের স্লেট খেলেন। আমাদের কাজে, তবে স্লেটের আকার স্থির করা আছে। এই কাগজটি একটি অনুরূপ সমস্যা বিবেচনা করে। আর একটি অনুরূপ কাজ ALT 2010 এ উপস্থিত হয়েছিল Perhaps সম্ভবত কিছু ধারণাগুলি স্থানান্তর।
  • আপনি যদি এটি বিশেষজ্ঞের সমস্যা হিসাবে বিবেচনা করেন (প্রতিটি বিশেষজ্ঞ উপসেটগুলির মধ্যে একটি আলাদা প্রস্তাব দেয় ), একজন বিশেষজ্ঞকে অনুসরণ করে, আপনি অন্যান্য বিশেষজ্ঞের পারফরম্যান্স অনুমান করতে পারেন যাদের অস্ত্র খালি করার ক্ষেত্রে খালি ফাঁকা ছেদ নেই তাদের কাছে টানতে গুরুত্ব ওজন ব্যবহার করে । একটি Exp4 টাইপ বিশ্লেষণ আপনাকে আফসোস পেতে পারে তবে চলমান সময়।( এন √)2NO(NT)O(2NT)

নীচে সম্পাদনা করুন:

আমার কাছে মনে হয় বাজেটের সীমাবদ্ধতা ( নিচে না যাওয়া ) সমস্যাটিকে জটিল করে তুলছে। ভাবুন আপনার বাজেট । শত্রুরা একটি অস্ত্র সর্বদা পরিশোধ করতে পারে এবং বাকীগুলি কখনই পরিশোধ করে না। WP সুতরাং আপনি বক্ষ প্রথম দফা যেতে অনুকূল কৌশল পায় যখন পরে ডলার চক্রের। সুতরাং আপনার প্রত্যাশিত অনুশোচনা কমপক্ষে এবং আপনি কোনও উচ্চমানের সম্ভাব্যতাটি আদৌ আশা করতে পারবেন না।1 ( এন - 1 ) / এন টি টি01(n1)/nTT(n1)T/n

এটিও মনে হয় এটি কোনও প্রাথমিক বাজেটের জন্য কাজ করতে পারে। বলুন আপনি ডলার দিয়ে শুরু করুন । তারপরে শত্রুরা ডাব্লুপি মতো কিছু দিতে একটি বাহু ব্যতীত এবং এক বাহু সেট করতে পারে । আমি অনুমান করি যদি আপনার সম্ভাব্য পরিশোধের পরিমাণের একটি সীমা এবং উচ্চ পর্যায়ে পর্যাপ্ত প্রাথমিক বাজেট থাকে তবে এটি একটি আকর্ষণীয় সমস্যার জন্য জায়গা ছেড়ে দিতে পারে।0 2 বি 1 / বিB02B1/B


হাই লেভ, পয়েন্টারগুলির জন্য ধন্যবাদ। আমি সম্মত হই যে আমার যদি সীমাহীন একক আর্ম ডাকাতরা এন প্যারালাল খেলে সীমাহীন প্রাথমিক বাজেট সমস্যাটি সমাধান করে solve বাজেটের সীমাবদ্ধতা তবে অস্ত্রগুলির মধ্যে মিলনের পরিচয় দেয় এবং জিনিসগুলিকে আকর্ষণীয় করে তোলে। বিশেষত, প্রথম ধাপে আপনার কাছে কেবল একটি বাহু খেলতে বাজেট রয়েছে। প্রথম ধাপে আপনি ভাগ্যবান হয়েছেন কিনা এবং তার উপর নির্ভর করে দ্বিতীয় ধাপে আপনি 11 টি অস্ত্র বা কেবল 1 বাহু খেলতে পারেন। সুতরাং তাড়াতাড়ি লাভজনক অস্ত্রের সন্ধান করা জরুরী যে এরপরে আপনি আরও অনুসন্ধান চালিয়ে যান।
মার্টিন পোল

2
আমি বুঝতে পারি না যে প্রাথমিক বাজেট ছিল (আমি এখন "অ-নেতিবাচক ভারসাম্য" অংশটি বুঝতে পারি, তবে সম্ভবত আপনি এটিকে প্রশ্নে আরও পরিষ্কার করে তুলতে পারেন?) - যা সমস্যাটিকে আরও আকর্ষণীয় করে তোলে। এছাড়াও "প্রাসঙ্গিক" বা বিশেষজ্ঞদের সংস্করণ বিবেচনা করতে মজাদার হতে পারে। দুর্ভাগ্যক্রমে, আমি এই সমস্যার জন্য আরও কোনও প্রাসঙ্গিক রেফারেন্স জানি না।
লেভ রেইজিন

যদি আমি সমস্যাটি ঠিকঠাক তৈরি করতে পারি তবে আপনি প্রতিটি রাউন্ডে অতিরিক্ত $ 1 অর্জন করেন। মার্টিন, আপনি সম্ভবত প্রশ্নটি পরিষ্কার করতে পারেন?
Jukka Suomela

আমি মনে করি আপনি যদি কোনও মেশিন খেলেন তবে যা কিছু অর্থ প্রদান করেন তা অর্জন করুন এবং আপনি যখনই খেলার সিদ্ধান্ত নিচ্ছেন জয় এবং $ 1 হারাবেন।
লেভ রেইজিন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.