এক্সকেসিডি জেলি শিম কমিক ব্যাখ্যা করুন: কী এটিকে মজার করে তোলে?


59

আমি দেখতে পাচ্ছি যে বিশ মোট পরীক্ষার তারা রান আউট এক সময় , তাই তারা ভুলভাবে বিশ পরীক্ষার এক সময় অনুমান, ফলে উল্লেখযোগ্য ( 0.05 = 1 / 20 )।p<0.050.05=1/20

xkcd জেলি শিম কমিক - "উল্লেখযোগ্য"

  • শিরোনাম: তাৎপর্যপূর্ণ
  • পাঠ্যটি হোভার করুন: "'তাই, আহ, আমরা আবার সবুজ গবেষণা করেছি এবং কোনও লিঙ্ক পাই নি probably সম্ভবত এটিই ছিল' G 'গ্রিন জেলি বিন / ACNE লিঙ্কে অন্বেষণ করুন; আরও পড়াশুনার প্রস্তাব দেওয়া হয়েছে!"

xkcd কমিক 882 - "উল্লেখযোগ্য"


8
95% আত্মবিশ্বাসের অর্থ দাঁড়ায় যে গড়ে 5% পরীক্ষায় (20 এর মধ্যে একটি) আমরা একটি বিপরীত উপসংহার পাব। এখানে যা ঘটেছে ঠিক তেমনটাই ঘটে। যেমন, আপনি যদি কমলা জেলি শিমের সাথে একই পরীক্ষা 1000 বার করেন তবে এর মধ্যে 50 ডলার ইতিবাচক ফলাফল দেবে give :)
সাশকেলো

19
কে বলেছে এটা মজার?
whuber

3
funniness>0funniness<0(p<.05)


3
@ গ্লেেন_ বি, প্রিয় ডেটা বিশ্লেষণ কার্টুন থ্রেড যথাযথ সিডব্লিউ, তবে, এটি হওয়ার কোনও কারণ আমি দেখতে পাচ্ছি না। 'কেন হাস্যকর', প্রশ্নটি কার্টুনে ইস্যুতে সংখ্যার পরিসংখ্যানগত বিন্দু বোঝার জন্য জিজ্ঞাসা করে, যার উত্তর থাকতে পারে এবং বিষয়টিতে থাকা উচিত এবং সিডাব্লু না হওয়া উচিত (এবং যা আমি মনে করি আপনি নীচে ভালভাবে পরিচালনা করেছেন)।
গুং - মনিকা পুনরায়

উত্তর:


68

রসিকতা একটি খুব ব্যক্তিগত জিনিস - কিছু লোক এটি মজাদার বলে মনে করবে তবে এটি সবার কাছে মজাদার নাও হতে পারে - এবং মজার কিছু যা মজার করে তোলে তা বোঝানোর চেষ্টা করার পরেও তারা অন্তর্নিহিত বিষয়টি ব্যাখ্যা করলেও। প্রকৃতপক্ষে সমস্ত এক্সকেসিডি এমনকি মজার হওয়ার উদ্দেশ্যে নয়। অনেকে যাইহোক এমন ভাবে গুরুত্বপূর্ণ বিষয়গুলি তৈরি করে যা ভাবা হয় যে উজ্জীবিত করে, এবং কমপক্ষে কখনও কখনও তারা তা করার সময় মজা করে। (আমি ব্যক্তিগতভাবে এটি মজাদার বলে মনে করি, তবে আমার কাছে কী স্পষ্টভাবে তা মজার করে তুলেছে তা স্পষ্টভাবে ব্যাখ্যা করা আমার পক্ষে কঠিন মনে হয়েছে I আমি মনে করি আংশিকভাবে এটি কোনও সন্দেহজনক বা সন্দেহজনক ফলাফলকে মিডিয়া সার্কাসে পরিণত করার উপায়ের স্বীকৃতি ( যার দিকে এই পিএইচডি কমিকটিও দেখুন ), এবং সম্ভবত কিছু গবেষণা আসলে কীভাবে করা যেতে পারে - এটি যদি সচেতনভাবে না হয় তবে আংশিকভাবে স্বীকৃতি)

যাইহোক, কেউ আপনার মজাদার হোনটিকে সুগন্ধযুক্ত করে কিনা সে বিষয়টির প্রশংসা করতে পারে।

বিষয়টি হ'ল 5% এর মতো কিছু মধ্যম তাত্পর্য পর্যায়ে একাধিক হাইপোথিসিস পরীক্ষা করা এবং তারপরে তাৎপর্যপূর্ণভাবে প্রকাশিত একটিকে প্রকাশ করা। অবশ্যই আপনি যদি এমন 20 টি পরীক্ষা করেন তবে যখন সত্যিকার অর্থে কোনও গুরুত্বের কিছু নেই তখন those পরীক্ষাগুলির একটি উল্লেখযোগ্য ফলাফল দেওয়ার প্রত্যাশিত সংখ্যাটি 1। জন্য একটি মোটামুটি অভ্যন্তরীণ করণn1n

কমিকটিতে, র্যান্ডাল 20 টি টেস্ট চিত্রিত করেছিল, সুতরাং এটি তার বিন্দুতে সন্দেহ নেই (যে কিছু হচ্ছে না এমনকী আপনি একটি উল্লেখযোগ্য হয়ে উঠবেন বলে আশা করছেন)। কাল্পনিক সংবাদপত্রের নিবন্ধটি এমনকি "কাকতালীয়তার মাত্র 5% সম্ভাবনা!" উপ-শিরোনামে সমস্যাটিকে জোর দিয়েছিল। (গবেষণাগুলিতে শেষ হওয়া একটি পরীক্ষা যদি কেবলমাত্র একটাই হয়ে থাকে, তবে এটি হতে পারে))


অবশ্যই, সূক্ষ্ম বিষয়টিও রয়েছে যে কোনও পৃথক গবেষক আরও বেশি যুক্তিসঙ্গত আচরণ করতে পারেন তবে মিথ্যা ইতিবাচক প্রচারের সমস্যাটি এখনও ঘটে। ধরা যাক যে এই গবেষকরা কেবল 1% পর্যায়ে 5 টি পরীক্ষা করেন, সুতরাং তাদের মতো একটি বোগাস ফলাফল আবিষ্কারের সামগ্রিক সম্ভাবনা প্রায় পাঁচ শতাংশ।

এ পর্যন্ত সব ঠিকই. তবে এখন কল্পনা করুন যে এই জাতীয় 20 টি গবেষণা গ্রুপ রয়েছে, প্রতিটি পরীক্ষার মধ্যে যে কোনও বর্ণের র্যান্ডম উপসেট তারা মনে করে যে তাদের চেষ্টা করার কারণ রয়েছে। বা 100 টি গবেষণা গ্রুপ ... এখন কমিকের মতো একটি শিরোনাম হওয়ার কী সুযোগ?

সুতরাং আরও বিস্তৃতভাবে, কমিক আরও সাধারণভাবে প্রকাশনার পক্ষপাতিত্ব উল্লেখ করতে পারে। যদি কেবলমাত্র গুরুত্বপূর্ণ ফলাফলগুলি ট্রাম্পড করা হয়, তবে আমরা কয়েক ডজন দলকে গ্রিন জেলিবেনের জন্য কিছুই পাইনি, কেবল সেগুলিই করিনি।

প্রকৃতপক্ষে, এই নিবন্ধটি তৈরি করা হচ্ছে এমন একটি প্রধান পয়েন্ট , যা গত কয়েক মাসে খবরে প্রকাশিত হয়েছিল ( উদাহরণস্বরূপ , যদিও এটি 2005 সালের নিবন্ধ)।

একজন যে নিবন্ধটি প্রতিক্রিয়া রেপ্লিকেশন জন্য প্রয়োজন জোর দেয়। মনে রাখবেন যে অধ্যয়নটি প্রকাশিত হয়েছে তার বেশ কয়েকটি প্রতিলিপি থাকলে, "ব্রণর সাথে যুক্ত সবুজ জেলিবেইনস" এর ফলাফলটি দাঁড়ানোর খুব সম্ভাবনা থাকবে না।

(এবং প্রকৃতপক্ষে, কমিকের জন্য হোভার পাঠ্য একই পয়েন্টটির জন্য একটি চৌকস রেফারেন্স তৈরি করে))


11

প্রকাশের সিদ্ধান্তে অনুমানের পরীক্ষার প্রভাবটি পঞ্চাশেরও বেশি বছর আগে ১৯৫৯ সালে জাসার গবেষণাপত্রের প্রকাশনা সংক্রান্ত সিদ্ধান্তে এবং টেস্টের তাত্পর্য থেকে অঙ্কিত ইনফারেন্সগুলিতে তাদের সম্ভাব্য প্রভাব - বা ভাইস ভার্সা (পে-ওলের জন্য দুঃখিত) হিসাবে বর্ণনা করা হয়েছে।

কাগজটির ওভারভিউ পেপারে প্রমাণ প্রমাণিত হয়েছে যে বৈজ্ঞানিক কাগজপত্রের প্রকাশিত ফলাফলগুলি সমস্ত গবেষণার ফলাফলের প্রতিনিধি নমুনা নয়। লেখক চারটি প্রধান মনোবিজ্ঞানের জার্নালে প্রকাশিত কাগজপত্র পর্যালোচনা করেছেন। পর্যালোচনা করা 97% গবেষণাপত্র তাদের বড় বৈজ্ঞানিক অনুমানের জন্য পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফলাফলের রিপোর্ট করেছেন।

লেখক এই পর্যবেক্ষণের একটি সম্ভাব্য ব্যাখ্যার অগ্রগতি করেছেন: যে গবেষণা যা অযৌক্তিক ফলাফল দেয় তা প্রকাশিত হয় না। অন্যান্য তদন্তকারীদের কাছে অজানা এ জাতীয় গবেষণার অবশেষে কোনও উল্লেখযোগ্য ফলাফল (এক ধরণের 1 ত্রুটি) উপস্থিত হওয়ার পরে প্রকাশিত না হওয়া পর্যন্ত স্বাধীনভাবে পুনরাবৃত্তি হতে পারে। এটি সম্ভাবনার দ্বার উন্মুক্ত করে যে প্রকাশিত বৈজ্ঞানিক সাহিত্যে পরিসংখ্যানগত তাত্পর্য পরীক্ষায় টাইপ 1 ত্রুটির ফলে ফলস্বরূপ ভুল ফলাফলগুলির অত্যধিক উপস্থাপনা অন্তর্ভুক্ত থাকতে পারে - ঠিক যে দৃশ্যটি আসল এক্সকেসিডি কমিকের মজাদার ছিল।

এই সাধারণ পর্যবেক্ষণ পরবর্তীতে যাচাই করা হয়েছে এবং মধ্যবর্তী বছরগুলিতে পুনরায় আবিষ্কার করা যেতে পারে। আমি বিশ্বাস করি যে ১৯৫৯ সালের জাসা পত্রিকাটি ছিল প্রথম অনুমানকে এগিয়ে নেওয়া। সেই কাগজের লেখক ছিলেন আমার পিএইচডি সুপারভাইজার। আমরা 35 বছর পরে তার 1959 পত্রটি আপডেট করেছি এবং একই সিদ্ধান্তে পৌঁছেছি। প্রকাশনা সংক্রান্ত সিদ্ধান্তগুলি পুনর্বিবেচনা: প্রকাশ ও সিদ্ধান্তের সিদ্ধান্তের উপর পরিসংখ্যান পরীক্ষার ফলাফলের প্রভাব। আমেরিকান পরিসংখ্যানবিদ, খণ্ড 49, নং 1, ফেব্রুয়ারি 1995 1995


অবশ্যই - আমি কাগজের একটি ওভারভিউ অন্তর্ভুক্ত করতে আমার উত্তরটি সম্পাদনা করেছি।
উইল্ফ রোজেনবাউম


-2

লোকেরা যা উপেক্ষা করে তা হ'ল সবুজ জেলি শিম কেসের জন্য আসল পি-মান 505 নয় তবে কাছাকাছি 64৪। কেবল ভান (নামমাত্র) পি-মান হয় .05। বাস্তব ও ভান পি-মানগুলির মধ্যে পার্থক্য রয়েছে। 20 টির মধ্যে 1 খুঁজে পাওয়ার সম্ভাবনা যা নামমাত্র স্তরে পৌঁছায় এমনকি যদি সমস্ত নাল সত্য হয় তবে তা 0 .05 নয়, তবে .64। অন্যদিকে, আপনি যদি তুলনামূলক সম্ভাবনার দিকে তাকিয়ে প্রমাণের মূল্যায়ন করেন error ত্রুটি সংক্রান্ত পরিসংখ্যানের দিক থেকে সর্বাধিক জনপ্রিয় দৃষ্টিভঙ্গি (যার মধ্যে পি-মানগুলি থাকে) আপনি বলবেন যে এইচ এর প্রমাণ রয়েছে: সবুজ জেলি শিমগুলি সত্যিকার অর্থে ব্রণর সাথে সম্পর্কযুক্ত। এটি কারণ পি (এক্স; কোনও প্রভাব নেই) <পি (এক্স; এইচ)। বাম দিকটি <.05, যেখানে ডান দিকটি মোটামুটি উঁচু: যদি সবুজ জেলি শিম ব্রণর কারণ হয়ে থাকে তবে পর্যবেক্ষিত সমিতিটি খুঁজে পাওয়া সম্ভাব্য। সম্ভাবনাগুলি একা ত্রুটি হওয়ার সম্ভাবনাগুলি গ্রহণ করতে ব্যর্থ হয় কারণ তারা প্রাপ্ত প্রকৃত ডেটাতে শর্ত। সবুজ জেলি মটরশুটি এবং ব্রণর সবেমাত্র এটির একটি পরীক্ষা করা হয়েছিল তার চেয়ে মূল্যায়নের কোনও পার্থক্য নেই। সুতরাং যদিও এই কার্টুনটি প্রায়শই পি-মানগুলি নিয়ে মজা করার জন্য দেখা যায়, তবে এটি সম্পর্কে মজার বিষয়টিই বোঝায় যে কেন আমাদের সামগ্রিক ত্রুটির সম্ভাবনা বিবেচনা করা প্রয়োজন (যেমন নন-প্রেন্ডেট পি মানগুলি করে) এবং কেবল সম্ভাবনাগুলি নয়। বায়েশিয়ান অনুমানটি ত্রুটির সম্ভাবনাগুলি উপেক্ষা করে ফলাফলের উপরও শর্তযুক্ত। একজন বয়েশিয়ানের পক্ষে এইচ-এর প্রমাণ খুঁজে না পাওয়া একমাত্র উপায় হ'ল এইচ-এর চেয়ে কম আগে হওয়া উচিত But তবে আমরা যে-বিষয়ই বিবেচনা করি না কেন এবং বন্দীদের উপর নির্ভর না করেই পি-মানটি সামঞ্জস্য করব কারণ শিকারের পদ্ধতিটি ব্যবহার করা হয়েছিল অনুমানের পরীক্ষা করার জন্য। এমনকি যে এইচটি শিকার করা হয়েছিল তা বিশ্বাসযোগ্য হলেও এটি ' এখনও একটি লম্পট পরীক্ষা। Errorstatistics.com


2
এই পোস্টটি ঠিক কী বলার চেষ্টা করছে তা বলা খুব শক্ত। আমি এর একটি অংশে ফোকাস করি, এই আশায় যে কোনও ব্যাখ্যা দিয়ে বাকিটির অর্থ প্রকাশিত হতে পারে: "সামগ্রিক ত্রুটির সম্ভাবনা" বলতে কী বোঝ?
whuber

2
@ যেহেতু আমি বিশ্বাস করি যে পোস্টটি একাধিক তুলনা সমস্যার কথা উল্লেখ করছে।
ম্যাট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.