20,000 টসস থেকে 10,000 মাথা কেন অবৈধ ডেটার পরামর্শ দেয় তার পরিসংখ্যানিক যুক্তি


11

ধরা যাক আমরা বারবার একটি ন্যায্য মুদ্রা টস করছি, এবং আমরা জানি মাথা এবং লেজগুলির সংখ্যা মোটামুটি সমান হওয়া উচিত। আমরা যখন মোট 20 টি টাসের জন্য 10 টি মাথা এবং 10 লেজের মতো ফলাফল দেখি, আমরা ফলাফলগুলিতে বিশ্বাস করি এবং মুদ্রাটি ন্যায্য বলে বিশ্বাস করতে ঝুঁকির সাথে।

ভাল আপনি যখন 20000 টসসের জন্য 10000 মাথা এবং 10000 লেজের মতো ফলাফল দেখেন, আমি আসলে ফলাফলটির বৈধতা নিয়ে প্রশ্ন করব (পরীক্ষকটি ডেটা জাল করেছেন), কারণ আমি জানি যে এটির চেয়ে বেশি সম্ভাবনা রয়েছে, ফলাফল হিসাবে বলুন 10093 মাথা এবং 9907 লেজ।

আমার স্বজ্ঞানের পিছনে পরিসংখ্যান যুক্তি কী?

উত্তর:


21

একটি ন্যায্য মুদ্রা ধরে নেওয়া 10000 মাথা এবং 10000 লেজের ফলাফল 10093 মাথা এবং 9907 লেজের ফলাফলের চেয়ে বেশি সম্ভাবনা।

যাইহোক, আপনি যখন বলছেন যে সত্যিকারের পরীক্ষক সমান সংখ্যক মাথা এবং লেজ প্রাপ্তির সম্ভাবনা নেই, আপনি বায়েস উপপাদকে স্পষ্টতই প্রার্থনা করছেন। বাস্তব পরীক্ষার বিষয়ে আপনার পূর্ব বিশ্বাসটি হ'ল প্রোব (20000 টসসে মাথাগুলির 10000 | পরীক্ষকটি ফেক করছে না তা দেওয়া হচ্ছে) 0 এর কাছাকাছি রয়েছে। সুতরাং, যখন আপনি একটি আসল ফলাফল দেখেন যে 'মাথাগুলির সংখ্যা নেই = 10000' আপনার প্রোব সম্পর্কে উত্তরোত্তর (এক্সপেরিমেন্টার ফ্যাকিং করছে না | 10000 মাথার পর্যবেক্ষণ করা ফলাফল) 0 এরও নিকটে রয়েছে Thus সুতরাং, আপনি সিদ্ধান্তে পৌঁছেছেন যে পরীক্ষক তথ্যটি নকল করছেন।


খুব ভালভাবে ব্যাখ্যা! বায়েসের উপপাদ্য পদ্ধতির জন্য কী দুর্দান্ত উদাহরণ example
তাল গ্যালিলি

1
@ শ্রীকান্ত: পূর্বেরটি আনুষ্ঠানিকভাবে সংজ্ঞায়িত করা যায় না। যে কোনও ক্ষেত্রে, প্রো ((মাথাগুলির কোনও নয় = এক্স | পরীক্ষকটি ফেক করছে না)) যখন N = 20000 হয় তখন সর্বদা শূন্যের কাছাকাছি থাকে, এক্স এর মান এবং আপনার পূর্বের কোনও বিষয় নয়। সুতরাং যে কোনও সংখ্যার জন্য আপনার উত্তরোত্তরও সর্বদা 0 এর কাছাকাছি থাকে Bay বায়েসের উপপাদ্যের সাথে এটির কী আছে তা আমি দেখতে পাচ্ছি না।
জোরিস মেয়েস

Guyশ্বরের অস্তিত্ব প্রমাণ করার চেষ্টা করে আটকানো একটি লোকের কাছ থেকে এই সমস্ত। মার্জিত, সত্যিই।
ব্র্যান্ডন বার্টেলসেন

1
এটিকে আরও সাধারণ দৃষ্টিকোণে রাখলে আমি যে বিষয়টির সাথে একমত হই তা হল, এখানে বায়েস উপপাদ্য কাজ করছে। বিশেষত প্রতারণার জন্য এবং সৎ পরীক্ষার্থীদের বিকল্প সম্ভাবনা রয়েছে (বিভিন্ন উত্পাদনশীল প্রক্রিয়া অনুসারে)। প্রতারণাপূর্ণ প্রতিষ্ঠা করা স্বজ্ঞাতদের সাথে সম্মানের সাথে পশ্চাত্ত্বিক দিকনির্দেশনা এবং অতএব দুঃখের সাথে ছদ্মবেশী প্রতারক প্রক্রিয়াটিকে আক্ষেপ করে।
কনজুগেটপায়ার

1
@ শ্রীকান্ত @ হুবার: সংযুক্তি ... আপনি ঠিক বলেছেন। আমি অভিন্ন সম্ভাবনা থেকে শুরু করেছি, যা এই ক্ষেত্রে অবশ্যই বাজে কথা নয়। আমার খারাপ
জোরিস মেয়েস

12

আমি শ্রীকান্তের ব্যাখ্যাটি পছন্দ করি এবং আমি মনে করি যে বায়সীয় ধারণা সম্ভবত এই জাতীয় সমস্যার কাছে যাওয়ার সর্বোত্তম উপায়। তবে বেয়েস ছাড়া এটি দেখার আরও একটি উপায় এখানে রয়েছে: (আরে)

dbinom(10, size = 20, prob = 0.5)/dbinom(10000, 20000, 0.5)

যা আমার সিস্টেমে প্রায় 31.2। অন্য কথায়, এটি 20,000 এর মধ্যে 10 টি দেখতে 20 এর মধ্যে 10 টি দেখার সম্ভাবনা 30 গুণ বেশি, এমনকি উভয় ক্ষেত্রেই ন্যায্য মুদ্রা রয়েছে। নমুনার আকার বাড়ার সাথে সাথে এই অনুপাতটি আবদ্ধ না করেই বৃদ্ধি পায়।

এটি এক ধরণের সম্ভাবনা অনুপাতের পদ্ধতির উপায়, তবে আবার আমার অন্ত্রে এটি বায়সিয়ান রায় মত মনে হয় অন্য যে কোনও কিছুর চেয়ে বেশি কল।


অনুপাত কেন? কেন কেবল এমনটি বলা হয়নি যে সেই সঠিক অঙ্কনের সম্ভাবনা অত্যন্ত কম?
অ্যান্ডি ডব্লু

5
নির্দিষ্ট সম্ভাবনার প্রসঙ্গের তুলনায় কম থাকার দাবিটি বিশ্বাসযোগ্য নয়। আমার উচ্চতার তুলনায় আমি ঠিক উঁচু হওয়ার সম্ভাবনা শূন্য। এবং হ্যাঁ, এমনকি এটি অসীম নির্ভুলতা, ইয়াদ, ইয়াদ, ইয়াদ সহ উচ্চতা সংজ্ঞায়িত করতে সমস্যাযুক্ত ... আমার বক্তব্য হ'ল অস্তিত্বের দুরত্বগুলি সর্বদা ঘটে যাওয়া অসীম সম্ভাবনার ঘটনাগুলির সাথে মন্থন করে! 20,000 এর মধ্যে 10,000 - প্রসঙ্গের বাইরে - আমাকে মোটেও অবাক করে না। এর সংখ্যাসূচক সম্ভাবনা যাই হউক না কেন।

9

একজন সাবজেক্টিভিস্ট বায়েশিয়ান যুক্তি কার্যতঃ একমাত্র উপায় (একটি পরিসংখ্যানগত দিক থেকে) আপনি নিজের অন্তর্দৃষ্টি বোঝার বিষয়ে যেতে পারেন , যা - সঠিকভাবে বলা - একটি মনস্তাত্ত্বিক তদন্তের বিষয় , কোনও পরিসংখ্যানগত নয়। তবে, তদন্তকারী ডেটা ফেক করেছেন এমন যুক্তি উপস্থাপনের জন্য একটি বয়েশিয়ান পদ্ধতির ব্যবহার করা স্পষ্টতই অন্যায় - এবং তাই অবৈধ। এর যুক্তিটি পুরোপুরি বিজ্ঞপ্তিযুক্ত: "ফলাফল সম্পর্কে আমার পূর্ব বিশ্বাসের উপর ভিত্তি করে, আমি আপনার ফলাফলটিকে অবিশ্বাস্য বলে মনে করি এবং তাই আপনাকে অবশ্যই প্রতারণা করা উচিত " saying এ জাতীয় অযৌক্তিক স্ব-পরিবেশনার যুক্তি আদালতরুমে বা পিয়ার পর্যালোচনা প্রক্রিয়ায় স্পষ্টত দাঁড়াবে না।

α= 5% স্তর 9,996 এবং 10,004 এর মধ্যে যে কোনও ফলাফল সন্দেহজনক হিসাবে দেখবে, কারণ (ক) এই সংগ্রহটি আমাদের অনুমান "জাল" ফলাফলগুলির নিকটে এবং (খ) কোনও জালিয়াতির নাল অনুমানের অধীনে (আদালতে দোষী প্রমাণিত না হওয়া পর্যন্ত নির্দোষ!) , এই সীমার ফলাফলের ঘটতে কেবল 5% (আসলে 5.07426%) সম্ভাবনা রয়েছে। তদুপরি, আমরা পর্যবেক্ষিত অনুপাত এবং প্রত্যাশিত অনুপাতের মধ্যে বিচ্যুতিটি কেবল চৌ-বর্গ প্রসঙ্গে (একটি লা ফিশার) রেখে এই আপাতদৃষ্টিতে অ্যাডহক পদ্ধতিকে রাখতে পারি, তারপরে নেইমেন-পিয়ারসন লেমাকে একটি লেজযুক্ত পরীক্ষায় ডেকে আনি স্বল্প লেজ এবং বিনোমিয়াল বিতরণে সাধারণ অনুমান প্রয়োগ করা ।

যদিও এই জাতীয় পরীক্ষা অদ্ভুত প্রমাণ করতে পারে না, তবে কেবলমাত্র আপনার স্বজ্ঞাততার উপর ভিত্তি করে অযাচিত এবং অসমর্থিত অনুমানগুলি তৈরি না করে, তাদের দাবির বিশ্বাসযোগ্যতা মূল্যায়নের জন্য সেই পরীক্ষামূলক ভবিষ্যতের প্রতিবেদনে এটি প্রয়োগ করা যেতে পারে পুরোপুরি নির্দোষ এবং সবেমাত্র এমন দুর্ভাগ্যজনক হয়েছিল যে কোনও সুন্দর পরীক্ষামূলক ফলাফল পেয়েছে এমন কাউকে জড়িত করার জন্য এটি বয়েসিয়ান যুক্তির প্রতি আহ্বান করার চেয়ে অনেক বেশি ন্যায্য এবং কঠোর!


5

আমি মনে করি আপনার অন্তর্দৃষ্টি ত্রুটিযুক্ত। দেখে মনে হচ্ছে আপনি একক, "খুব বিশেষ" ফলাফলের (ঠিক 10000 মাথা) অনেকগুলি ফলাফলের সেটের সাথে (সমস্ত "অ-বিশেষ" মাথা 10000 এর কাছাকাছি) এর সাথে তুলনা করছেন। তবে, "বিশেষ" এর সংজ্ঞাটি আমাদের মনোবিজ্ঞানের উপর ভিত্তি করে একটি স্বেচ্ছাসেবী পছন্দ। বাইনারি 1000000000000000 (দশমিক 8192) বা হেক্স এবিসি (দশমিক 2748) সম্পর্কে - এটি সন্দেহজনকভাবেও বিশেষ হবে? জোরিস মেয়েস যেমন মন্তব্য করেছেন, বেয়েসের যুক্তি মূলত যে কোনও একক মাথার জন্য একই রকম হবে, তা বোঝায় যে প্রতিটি ফলাফল সন্দেহজনক হবে।

যুক্তিটি কিছুটা প্রসারিত করার জন্য: আপনি একটি হাইপোথিসিস পরীক্ষা করতে চান ("পরীক্ষক জাল করছেন"), এবং তারপরে আপনি একটি পরীক্ষার পরিসংখ্যান (শিরোনামের সংখ্যা) চয়ন করুন। এখন, এই পরীক্ষার পরিসংখ্যানটি কি আপনার অনুমানের বিষয়ে কিছু বলার জন্য উপযুক্ত? আমার কাছে মনে হয় নির্বাচিত পরীক্ষার পরিসংখ্যান তথ্যবহুল নয় (অনুমানের একটি নির্দিষ্ট মান হিসাবে নির্দিষ্ট পরামিতিগুলির ফাংশন নয়)। "প্রতারণা" বলতে আপনার অর্থ কী তা এই প্রশ্নে ফিরে যায়। এর অর্থ যদি পরীক্ষক ইচ্ছায় মুদ্রা নিয়ন্ত্রণ করে, তবে এটি পরীক্ষার পরিসংখ্যানগুলিতে প্রতিফলিত হয় না। আমি মনে করি আপনাকে একটি পরিমানযোগ্য সূচক খুঁজে পেতে আরও সুনির্দিষ্ট হওয়া দরকার, এবং এইভাবে প্রশ্নটি একটি পরিসংখ্যান পরীক্ষার জন্য অনুকূল করে তুলবে।


+1, তবে আমি নিশ্চিত নই। 10,000 সম্পর্কে বিশেষটি হ'ল এটি যে মুদ্রাটি ন্যায্য তা অনুমানের অধীনে মাথাগুলির প্রত্যাশিত সংখ্যার সমান হয়। এই তথ্যটি কোনও মনোবিজ্ঞান বা সংখ্যার উপস্থাপনের পদ্ধতি থেকে স্বতন্ত্র। এই প্রতিক্রিয়ার বিশ্লেষণ এমন পরিস্থিতিতে কিছুটা অন্তর্দৃষ্টি দিতে পারে যেখানে বলুন, 20,005 মুদ্রা উল্টানো হয়েছিল এবং 10,000 টি মাথা (এবং তাই 10,005 লেজ) নোট করা হয়েছিল এবং কারও "অন্তর্দৃষ্টি" পরামর্শ দিয়েছে ফ্যাকারি হয়েছিল।
whuber

আমি সম্পূর্ণরূপে সম্মত হই যে - যেমন আপনি নিজের জবাবটি দেখিয়েছেন - এটি সমস্ত অনুমানের পূর্ব-সংজ্ঞা সংজ্ঞার উপর নির্ভর করে: আপনি যদি আগে থেকেই সংজ্ঞায়িত করেন যে "পরীক্ষাকে জালিয়াতির মাধ্যমে" আপনি বোঝাচ্ছেন যে "মাথাটি সংখ্যার জন্য একটি ফলাফল অর্জন করা হয় যা প্রত্যাশিত মানের কাছাকাছি ", তারপরে এটি পরীক্ষার পরিসংখ্যান হিসাবে" সংখ্যার মাথা "সহ একটি পরিসংখ্যানগত পরীক্ষার একটি ভিত্তি। তবে, এই জাতীয়-অগ্রাধিকারের ব্যাখ্যা ছাড়াই "নকল" এবং "মাথার সংখ্যার জন্য বিশেষ মূল্য" এর অর্থ মেঘলা থেকে যায় এবং তাদের একে অপরের সাথে কী সম্পর্ক রয়েছে তা পরিষ্কার নয়।
কারাকাল

4

আপনি যে উপসংহারটি আঁকেন তা প্রতারণার সম্ভাব্যতা এবং ফ্লিপারটি মিথ্যা বলে দেওয়া হয়েছে, এক্স হেডস রিপোর্ট করা হয়েছে তার পূর্বের সম্ভাবনার জন্য আপনি যে পূর্ব নির্বাচন করেছেন তার উপর নির্ভরশীল।

পি-তে সর্বাধিক ভর করা (10000 মাথা রিপোর্ট করা হয়েছে | মিথ্যা) আমার মতে সামান্য পাল্টা স্বজ্ঞাত। প্রতিবেদক নিখুঁত না হলে আমি কল্পনাও করতে পারি না যে এই ধরণের মিথ্যা তথ্যটি (মূলত আপনি মূল পোস্টে উল্লিখিত কারণগুলির জন্য; বেশিরভাগ লোকের কাছে এটি অত্যন্ত সন্দেহজনক।) যদি মুদ্রাটি সত্যিই অন্যায় হয় এবং ফিলিপারটি প্রতিবেদন করত মিথ্যা ডেটা, তারপরে আমি মনে করি যে রিপোর্ট করা ফলাফলের আগে আরও যুক্তিসঙ্গত (এবং খুব আনুমানিক) হতে পারে একটি পৃথক ইউনিফর্মের পূর্ববর্তী P (এক্স হেডস রিপোর্ট করেছেন lying মিথ্যা) = 1 / the 9900 এর পূর্ণসংখ্যার জন্য, ..., 10100} এবং পি (এক্স হেডস রিপোর্ট করেছেন | মিথ্যা) = 0 অন্যান্য সমস্ত এক্স এর জন্য। মনে করুন যে আপনি মিথ্যা বলার পূর্ব সম্ভাবনা 0.5। তারপরে কিছু উত্তরীয় সম্ভাবনাগুলি হ'ল:

পি (মিথ্যা | 9900 মাথা রিপোর্ট করেছেন) = পি (মিথ্যা | 10100 মাথা রিপোর্ট করেছেন) = 0.70;

পি (মিথ্যা | 9950 মাথা রিপোর্ট করেছেন) = পি (মিথ্যা | 10050 মাথা রিপোর্ট করেছেন) = 0.54;

পি (মিথ্যা | 10000 মাথা রিপোর্ট করেছেন) = 0.47।

একটি ন্যায্য মুদ্রা থেকে বেশিরভাগ যুক্তিসঙ্গত সংখ্যাযুক্ত মাথা সন্দেহের ফলস্বরূপ। আপনার প্রবীণদের ক্ষেত্রে উত্তরীয় সম্ভাবনাগুলি কতটা সংবেদনশীল তা দেখানোর জন্য, যদি প্রতারণার পূর্ব সম্ভাবনা 0.10 এ নামানো হয়, তবে উত্তরীয় সম্ভাবনাগুলি হয়ে যায়:

পি (মিথ্যা | 9900 মাথা রিপোর্ট করেছেন) = পি (মিথ্যা | 10100 মাথা রিপোর্ট করেছেন) = 0.21;

পি (মিথ্যা | 9950 মাথা রিপোর্ট করেছেন) = পি (মিথ্যা | 10050 মাথা রিপোর্ট করেছেন) = 0.11;

পি (মিথ্যা | 10000 মাথা রিপোর্ট করেছেন) = 0.09।

সুতরাং আমি মনে করি মূল (এবং উচ্চ রেটযুক্ত উত্তর) কিছুটা প্রসারিত হতে পারে; কোনওভাবেই আপনার এই সিদ্ধান্তে উপনীত হওয়া উচিত নয় যে পূর্বের তথ্যগুলি ভালভাবে বিবেচনা না করে ডেটাটি মিথ্যা করা হয়। এছাড়াও, কেবল স্বজ্ঞাতভাবে এটি সম্পর্কে চিন্তা করেই, মনে হয় যে মিথ্যা বলার পূর্ববর্তী সম্ভাবনাগুলি মিথ্যা বলার পূর্বের সম্ভাবনা দ্বারা বেশি প্রভাবিত হতে পারে তবে উল্লিখিত ফ্লিপারটি মিথ্যা বলার অপেক্ষা রাখে না (প্রিরিয়ারদের বাদে যা সবগুলি রেখে দেয়) উল্লিখিত মিথ্যা কথা শনাক্ত করে মাথার সংখ্যক মাথায় তাদের ভর, যেমন আমার উদাহরণ হিসাবে)


আমি মনে করি এটি খুব ভাল উত্তর, তবে আমি আপনার দ্বিতীয় অনুচ্ছেদের সাথে একমত নই। আমি মনে করি না শ্রীকান্তের মূল শর্তসাপেক্ষ সম্ভাবনা পাল্টা স্বজ্ঞাত, এবং কেবল কারণ এটি উত্তর দেওয়া একটি কঠিন প্রশ্ন কারণ এটি একটি বিরোধী নয়। আমি মনে করি না যে আপনার 9900 থেকে 10100 এর মধ্যে মিথ্যা কথা বলার একরকম সম্ভাবনা মোটেই কোনও অর্থবোধ করে না, যদিও এটি প্রদর্শনের উদ্দেশ্যে কার্যকর।
অ্যান্ডি ডব্লু

2

বায়েশিয়ান ব্যাখ্যার জন্য আপনার মিথ্যা মুদ্রা উল্টানো দ্বারা রিপোর্টিত ফলাফলগুলির উপর পূর্ব সম্ভাবনা বন্টনের পাশাপাশি মিথ্যা বলার পূর্ব সম্ভাবনাও দরকার। যখন আপনি এমন কোনও মান দেখেন যা মিথ্যা বিতরণের অধীনে এলোমেলোভাবে উল্টে যায় তার চেয়ে অনেক বেশি সম্ভাবনা থাকে যা আপনার উত্তরোত্তর সম্ভাবনাটিকে অনেক বেশি করে দেয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.