জার্মান ট্যাঙ্ক সমস্যার সমাধান


10

জার্মান ট্যাঙ্ক সমস্যার সমাধানটি কেবল প্যারামিটার কে (পর্যবেক্ষিত নমুনার সংখ্যা) এবং এম (পর্যবেক্ষিত নমুনাগুলির মধ্যে সর্বাধিক মান ) এর একটি কার্যকারিতা কি এমন কোনও আনুষ্ঠানিক গাণিতিক প্রমাণ রয়েছে ? অন্য কথায়, কেউ কি প্রমাণ করতে পারবেন যে সলিউশন সর্বাধিক মান ছাড়াও অন্যান্য নমুনা মানের থেকে পৃথক?


3
আপনি যা জিজ্ঞাসা করছেন তা হ'ল প্যারামিটারের জন্য কীভাবে নমুনা সর্বাধিক পর্যাপ্ত show থেকে আলাদা ইউনিফর্ম বিতরণের উপরের সীমানা নির্দিষ্ট করে । θθ
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

2
ফিশার নেইমন ফ্যাক্টেরাইজেশন উপপাদ্য সম্ভাবনা ফাংশন, পরিদর্শন করা নমুনাগুলির সম্ভাব্যতা (সর্বাধিক দ্বারা সংক্ষিপ্তসার ) পরামিতি (ট্যাঙ্কের সংখ্যা) এবং \ PR (এম = মি | এন ) এর পদে সম্পূর্ণ লেখা যেতে পারে , কে) = \ শুরু {কেসগুলি} 0 & \ পাঠ্য {যদি} এম> এন \\ rac ফ্র্যাক {\ বিনম {এম - 1} {কে - 1}} {\ om বিনম এন কে} & \ পাঠ্য {যদি} এম \ লে, এন, \ শেষ {কেস} তা কি উত্তর হবে? kmnkm
Pr(M=m|n,k)={0if m>n(m1k1)(nk)if mn,
সেক্সটাস এম্পেরিকাস

@ স্কোর্টচি যে সঠিক, আমার জন্য এটি আরও পরিষ্কারভাবে পুনর্বিবেচনা করার জন্য আপনাকে ধন্যবাদ।
বোগদান আলেকজান্দ্রু

পুনঃটুইট মূলত আমি একটি প্রমাণ জন্য (উপরে Scortchi এর মন্তব্য উদ্ধৃত) যে নমুনা সর্বাধিক সমাধান জন্য যথেষ্ট জিজ্ঞাসা করছি ছাড়া আসলে সমাধান কম্পিউটিং।
বোগদান আলেকজান্দ্রু

সুতরাং আপনি প্রমাণ হিসাবে ফিশার নেইম্যান ফ্যাক্টেরাইজেশন উপপাদ্যের সন্ধান করছেন না?
সেক্সটাস এম্পেরিকাস

উত্তর:


15

সম্ভাবনা

সম্ভাব্যতা তত্ত্বের সাধারণ সমস্যাগুলি পর্যালোচনাগুলির সম্ভাব্যতা উল্লেখ করে একটি নির্দিষ্ট মডেল দেওয়া হয়েছে এবং প্যারামিটারগুলি দেওয়া হয়েছে (আসুন তাদের কল করুন ) জড়িত। উদাহরণস্বরূপ কার্ড গেমস বা ডাইস গেমগুলির নির্দিষ্ট পরিস্থিতির সম্ভাবনাগুলি প্রায়শই খুব সোজা থাকে।x1,x2,...,xnθ

তবে, অনেক ব্যবহারিক পরিস্থিতিতে আমরা একটি বিপরীতমুখী পরিস্থিতি ( অনুমানমূলক পরিসংখ্যান ) নিয়ে কাজ করছি। এটি হল: পর্যবেক্ষণ দেওয়া হয়েছে এবং এখন মডেলটি অজানা , বা কমপক্ষে আমরা নির্দিষ্ট পরামিতিগুলি জানি না ।x1,x2,...,xkθ

এই ধরণের সমস্যায় আমরা প্রায়শই এমন একটি উল্লেখ করি যার নাম প্যারামিটারের সম্ভাবনা বলে। , যা একটি নির্দিষ্ট প্যারামিটারে বিশ্বাসের হার প্রদত্ত পর্যবেক্ষণ । এই শব্দটি পর্যবেক্ষণগুলির সম্ভাবনার সমানুপাতিক হিসাবে প্রকাশিত হয়েছে ধরে যে একটি মডেল প্যারামিটার- অনুমানকৃতভাবে সত্য হবে। L(θ)θx1,x2,..xkx1,x2,..xkθ

L(θ,x1,x2,..xk)probability observations x1,x2,..xk given θ 

একটি প্রদত্ত প্যারামিটার মানের ক্ষেত্রে আরো সম্ভাব্য একটি নির্দিষ্ট পর্যবেক্ষণ (অন্যান্য পরামিতি মান সম্ভাব্যতা আপেক্ষিক), আরো পর্যবেক্ষণ এই বিশেষ প্যারামিটার সমর্থন (অথবা তত্ত্ব / হাইপোথিসিস যে এই প্যারামিটারটি অনুমান) হল । একটি (আপেক্ষিক) উচ্চ সম্ভাবনা সেই প্যারামিটার মান সম্পর্কে আমাদের বিশ্বাসকে শক্তিশালী করবে (এটি সম্পর্কে আরও অনেক বেশি দার্শনিক রয়েছে )।θx1,x2,..xn


জার্মান ট্যাঙ্ক সমস্যার সম্ভাবনা

এখন জার্মান ট্যাঙ্ক সমস্যার জন্য স্যাম্পলগুলির একটি সম্ভাবনা কার্যকারিতা হ'ল:x1,x2,..xk

L(θ,x1,x2,..xk)=Pr(x1,x2,..xk,θ)={0if max(x1,x2,..xk)>θ(θk)1if max(x1,x2,..xk)θ,

আপনি নমুনাগুলি {1, 2, 10 samples বা নমুনাগুলি {8, 9, 10 Whether পর্যবেক্ষণ করেন কিনা তা যখন প্যারামিটার সহ অভিন্ন বন্টন থেকে নমুনাগুলি বিবেচনা করা হয় তখন তা বিবেচ্য নয় । উভয় নমুনা সম্ভাবনার সাথে সমানভাবে সম্ভবত: are করে এবং সম্ভাবনার ধারণাটি ব্যবহার করে একটি নমুনা অন্য নমুনার তুলনায় প্যারামিটার- সম্পর্কে আরও কিছু জানায় না ।θ(θ3)1θ

8, 9, 10 high উচ্চ মানগুলি আপনাকে ভাবতে / বিশ্বাস করতে পারে বেশি হওয়া উচিত। তবে, এটি কেবলমাত্র 10 ডলারের মান} যা আপনাকে সম্ভাবনা সম্পর্কে সত্যই প্রাসঙ্গিক তথ্য দেয় (মান 10 আপনাকে বলে যে দশ বা তার বেশি হবে, অন্যান্য মান 8 এবং 9 এই তথ্যটিতে কোনও অবদান রাখে না )।θθθ


ফিশার নেইম্যান ফ্যাক্টেরাইজেশন উপপাদ্য

এই উপপাদ্যটি আপনাকে বলে যে একটি নির্দিষ্ট পরিসংখ্যান (অর্থাত্ পর্যবেক্ষণগুলির কিছু ফাংশন যেমন গড়, মধ্যম বা জার্মান ট্যাঙ্ক সমস্যার ক্ষেত্রে সর্বাধিক) যথেষ্ট হয় (সমস্ত তথ্য ধারণ করে) আপনি সম্ভাবনা , অন্যান্য পর্যবেক্ষণগুলির উপর নির্ভর করে এমন পদগুলি , যেমন এই ফ্যাক্টরটি প্যারামিটার এবং উভয়ের উপর নির্ভর করে না (এবং অনুমানের পরামিতি মানগুলির সাথে ডেটা সম্পর্কিত যে সম্ভাবনা ফাংশনের অংশটি কেবল পরিসংখ্যানের উপর নির্ভর করে তবে ডেটা / পর্যবেক্ষণের পুরোটা নয়)।T(x1,x2,,xk)x1,x2,,xkθx1,x2,,xk

জার্মান ট্যাঙ্ক সমস্যার ক্ষেত্রে বিষয়টি সহজ। উপরে আপনি দেখতে পাচ্ছেন যে উপরের সম্ভাবনার সম্পূর্ণ অভিব্যক্তিটি ইতিমধ্যে কেবলমাত্র পরিসংখ্যান এবং বাকী মানের করে না।max(x1,x2,..xk)x1,x2,..xk


উদাহরণ হিসাবে ছোট খেলা

যাক আসুন আমরা বারবার নিম্নলিখিত খেলা খেলতে: নিজেই একটি দৈব চলক এবং সমান সম্ভাবনা থাকে টানা পারেন 100 অথবা 110 তারপর আমরা একটি নমুনা আঁকা ।θx1,x2,...,xk

আমরা পর্যবেক্ষিত উপর ভিত্তি করে অনুমান করার জন্য একটি কৌশল বেছে নিতে চাই যা আমাদের সম্ভাবনা সর্বাধিক করে অনুমান ।θx1,x2,...,xkθ

সঠিক কৌশলটি হ'ল নমুনায় থাকা সংখ্যার মধ্যে একটি> 100 না থাকলে 100 নির্বাচন করা হবে।

আমরা ইতিমধ্যে প্যারামিটার মান 110 বেছে নেওয়ার জন্য প্রলুব্ধ হতে পারি যখন উচ্চ মানের কাছাকাছি থাকে (তবে ঠিক বেশি নয়) তবে এটি ভুল হবে। প্রকৃত প্যারামিটার মান যখন এটি 110 এর চেয়ে 100 হয় তখন এই ধরনের পর্যবেক্ষণের সম্ভাবনা বেশি থাকে So সুতরাং আমরা যদি অনুমান করি, এমন পরিস্থিতিতে প্যারামিটার মান হিসাবে 100 হয় তবে আমরা ভুল করার সম্ভাবনা কম করব (কারণ এই উচ্চ মানের সাথে শততম কাছাকাছি পরিস্থিতি, তবুও এটির নীচে, প্রকৃত মানটি 110 এর ক্ষেত্রে পরিবর্তে প্রকৃত মান 100 হয় এমন ক্ষেত্রে প্রায়শই ঘটে।x1,x2,...,xk


আশ্চর্যজনক, আমার ঠিক কী প্রয়োজন! আপনার শেষ বন্ধনী সম্পর্কে কেবল একটি মন্তব্য: আপনি বলছেন যে "এই উচ্চ মানগুলি প্রায় শতাধিক ঘটে ...", যা আমি বুঝতে পেরেছি কেন এটি সত্য, তবে কেবল স্পষ্ট করে বলতে হবে: 1 এবং 100 এর মধ্যে কোনও মান হওয়ার সম্ভাবনা বেশি যখন প্যারামিটারটি 100 হয় (মূলত 1-100 এ প্রতিটি সংখ্যার সম্ভাবনা 1 / প্যারামিটার হয়)।
বোগদান আলেকজান্দ্রু

এছাড়াও, এখন আমার পোস্টে আপনার প্রাথমিক মন্তব্যটি বোধগম্য হয় - যদি আমি এই ধারণাগুলি প্রয়োগ করতে জানতাম তবে আপনার মন্তব্যটি প্রমাণ পাওয়ার জন্য আমার ঠিক ইঙ্গিত হত। আবার ধন্যবাদ!
বোগদান আলেকজান্দ্রু

আপনি @ ঠিক আছে; এটি 1-100 এর মধ্যে যে কোনও মানের জন্য সত্য। এটাই পাল্টা ধারণা, আমরা মনে করি যে উচ্চ পর্যবেক্ষণকৃত মানগুলি নিম্ন পর্যবেক্ষিত মানগুলির চেয়ে কিছু পরামিতি মানের জন্য আরও বেশি প্রমাণ, তবে যে কোনও সংখ্যার পক্ষে সমান সম্ভাবনা রয়েছে এবং এইভাবে মডেল প্যারামিটার সম্পর্কে আমাদের বিশ্বাসকে কোনও অবদান রাখে না / করা উচিত নয় ( আমরা যে সর্বাধিক মানটি পর্যবেক্ষণ করি তা ব্যতীত But তবে এমনকি যে গেমটিতে আমি কেবল দুটি মানের মধ্যে একটি পছন্দ রেখেছি It এটি এমন যে সীমাটি সীমা ছাড়িয়ে সর্বাধিক বা নিম্নতর হলে আরও সর্বোচ্চ তথ্য সরবরাহ করে না)।
সেক্সটাস এম্পেরিকাস

আমার প্রাথমিক মন্তব্যটি খুব ভারী হতে পারে তবে কী ধরণের উত্তর প্রয়োজন তা দেখার জন্য আমি কেবল তাকাচ্ছিলাম। বিশেষত আমি 'প্রুফ' শব্দটি কিছুটা শক্তিশালী দেখতে পেয়েছিলাম এবং ভাবছিলাম যে আপনি কেবল অনুষঙ্গ তত্ত্বটি খুঁজছেন কিনা (যা হ্যাঁর উত্তর দিয়েছিল এমন একটি প্রশ্নের উত্তর হবে যখন আপনি এই উপপাদ্যটি জানেন না) বা আপনি আরও অস্পষ্ট কিছু সন্ধান করছেন কিনা এবং দার্শনিক, যেমন পরিসংখ্যান / সম্ভাবনার পক্ষেও চ্যালেঞ্জিং ধারণা এবং ভিন্ন ধরণের "প্রমাণ" সন্ধানের জন্য এই জাতীয় উপপাদনের বাইরে গিয়ে।
সেক্সটাস এম্পেরিকাস

আমার উদ্দেশ্য তখন ভাল পড়া! আবার ধন্যবাদ.
বোগদান আলেকজান্দ্রু

0

আপনি "সমস্যা" এর সুনির্দিষ্ট সূত্র উপস্থাপন করেন নি, সুতরাং আপনি কী প্রমাণ করতে বলছেন তা ঠিক পরিষ্কার নয়। বায়েশিয়ান দৃষ্টিকোণ থেকে, উত্তরীয় সম্ভাবনা সমস্ত ডেটার উপর নির্ভর করে। তবে নির্দিষ্ট ক্রমিক সংখ্যার প্রতিটি পর্যবেক্ষণ সেই সংখ্যাটিকে সবচেয়ে বেশি সমর্থন করবে। যে কোনও পর্যবেক্ষণ দেওয়া হলে উত্তর ও পূর্বের মধ্যে বৈষম্যের অনুপাতটি হাইপোথিসিসের জন্য "ট্যাঙ্কের প্রকৃত সংখ্যা " এর চেয়ে বেশি হবে "ট্যাঙ্কগুলির প্রকৃত সংখ্যা [ ব্যতীত অন্য সংখ্যা " "এর চেয়ে বেশি হবে )। সুতরাং, আমরা যদি আগে একটি ইউনিফর্ম দিয়ে শুরু করি, তবে সেই পর্যবেক্ষণটি দেখার পরে এর সর্বাধিক উত্তরোত্তর হবে।nnnn

এমন একটি ক্ষেত্রে বিবেচনা করুন যেখানে আমাদের কাছে ডেটা পয়েন্ট এবং অনুমান করা হয়েছে । স্পষ্টতই, এর উত্তরোত্তরটি শূন্য। এবং জন্য আমাদের পোস্টারিয়রগুলি তাদের পূর্বের চেয়ে বড় হবে। এই জন্য কারণ যে Bayesian যুক্তি, প্রমাণ অনুপস্থিতি হয় অনুপস্থিতি প্রমাণ। কোন সময় আমরা একটি সুযোগ যেখানে আমরা আছে পারতেন একটি পর্যবেক্ষণ যে আমাদের সম্ভাব্যতা কমে যেত করতে লাগল, কিন্তু না, সম্ভাব্যতা বাড়ে। আমরা যেহেতু পারে দেখেছি , যার জন্য আমাদের অধোদেশ সেট যেত শুন্যতে যে, আসলে আমরা তা দেখতে পাইনি মানে হল, আমরা আমাদের অধোদেশ বৃদ্ধি করা উচিত13N=10,13,15N=10N=13,1516 এন = 13 , 15 এন = 13 , 15 এন = 13 14 , 15 , 16 , এন = 15 16 এন = 13 এন = 15 এন = 13 এন = 13 এন = 15 এন16N=13,15N=13,15 । তবে মনে রাখবেন যে সংখ্যাটি যত কম হবে, তত বেশি সংখ্যা আমরা দেখতে পেতাম যে সেই সংখ্যাটি বাদ দেওয়া হত। জন্য আমরা দেখার পরে সেই অনুমানটিকে প্রত্যাখ্যান । তবে জন্য অনুমানটি প্রত্যাখ্যান করার জন্য আমাদের কমপক্ষে টির দরকার ছিল। হাইপোথিসিস যেহেতু চেয়ে বেশি falsifiable হয় , আসলে আমরা যে করা হয়নি মিথ্যা বর্ণনা জন্য আরো প্রমাণ , মিথ্যাভাবে না চেয়ে জন্য প্রমাণ ।N=1314,15,16,...N=1516N=13N=15N=13N=13N=15N=15

সুতরাং প্রতিবার আমরা যখন কোনও ডেটা পয়েন্ট দেখি তখন এটি নীচের সমস্ত কিছুর উত্তরোত্তরকে শূন্যে সেট করে এবং অন্য সংখ্যার উত্তরোত্তর বৃদ্ধি করে, ছোট সংখ্যাগুলি সবচেয়ে বেশি উত্সাহ পায়। সুতরাং, সামগ্রিক বৃহত্তম উত্সাহ পেতে যে সংখ্যাটি তার ন্যূনতম সংখ্যা হবে যার উত্তরোত্তর শূন্যে সেট করা হয়নি, অর্থাৎ পর্যবেক্ষণের সর্বাধিক মান।

সর্বাধিকের চেয়ে কম সংখ্যাগুলি প্রভাব ফেলবে যে সর্বোচ্চ কতটা বাড়িয়ে তোলে, তবে এটি সর্বাধিকতম উত্সাহ পাওয়ার সাধারণ প্রবণতাটিকে প্রভাবিত করে না। উপরের উদাহরণটি বিবেচনা করুন, যেখানে আমরা ইতিমধ্যে দেখেছি । আমরা যদি পরবর্তী সংখ্যাটি দেখতে পাই তবে এর কী প্রভাব থাকবে? এটা সাহায্য করে চেয়ে বেশি , তবে দুটো একসাথে সংখ্যার ইতিমধ্যে বাতিল করা হয়েছে, যাতে প্রাসঙ্গিক নয়। এটি টিরও বেশি জনকে সাহায্য করে , তবে ইতিমধ্যে টিরও বেশি সাহায্য করেছে , যাতে কোন সংখ্যাটি সবচেয়ে বেশি সহায়তা করেছে তা প্রভাবিত করে না।1355613151315


এই উদাহরণটি পরিস্থিতির উপর অনেক নির্ভর করে এবং বিবৃতিগুলি সাধারণ হয় না। উদাহরণস্বরূপ, যদি পূর্বেরটির জন্য 13% এর জন্য 50% এবং 15 এর জন্য 50% হয় তবে 13 টি পর্যবেক্ষণটি এমন নয় যে "N = 13, 15 এর জন্য আমাদের পোস্টারিয়রগুলি তাদের পূর্বের চেয়ে বড় হবে" পর্যবেক্ষণগুলি পূর্বের তুলনায় উত্তরোত্তর হ্রাস করতে পারে ।
সেক্সটাস এম্পেরিকাস

এছাড়াও, আরও অতিরিক্ত সংখ্যার পর্যবেক্ষণ অনুমান পরিবর্তন করতে পারে। যদি "যদি পরবর্তী সংখ্যা আমরা দেখতে 5 ..." তারপর অবর হবে এখনো পরিবর্তন, এমনকি যখন সংখ্যার ইতিমধ্যে হয়েছে 'আউট সাহায্য করেছে', অতিরিক্ত সংখ্যার এই "সাহায্য আউট যেমন বাড়াতে পারে '(যখন আপনি সমস্ত নম্বর নমুনা 1,2, ... 12, 13 এরপরে এটি পরবর্তীগুলির জন্য 13 টির বেশি বাড়বে যখন আপনি কেবলমাত্র 13 টি নমুনা করেন)
সেক্সটাস এম্পেরিকাস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.