একটি ভাল, দৃ conv়প্রত্যয়ী উদাহরণ কোনটি যেখানে পি-মানগুলি কার্যকর?


64

শিরোনামে আমার প্রশ্নটি স্ব-বর্ণনামূলক, তবে আমি এটিকে কিছু প্রসঙ্গে দিতে চাই।

এএসএ এই সপ্তাহের শুরুর দিকে " পি-ভ্যালু: প্রসঙ্গ, প্রক্রিয়া এবং উদ্দেশ্য সম্পর্কে " একটি বিবৃতি প্রকাশ করেছিল , পি-মান সম্পর্কিত বিভিন্ন সাধারণ ভুল ধারণাটির রূপরেখা তৈরি করে এবং প্রসঙ্গ এবং চিন্তাভাবনা ব্যতীত এটিকে ব্যবহার না করার ক্ষেত্রে সতর্কতার আহ্বান জানিয়েছিল (যা সম্পর্কে কেবল বলা যেতে পারে) কোনও পরিসংখ্যান পদ্ধতি, সত্যই)।

এএসএর প্রতিক্রিয়া হিসাবে, অধ্যাপক ম্যাটলফ একটি ব্লগ পোস্ট লিখেছিলেন: শিরোনামের ১৫০ বছর পরে, এএসএ পি-ভ্যালুগুলিকে না বলে । তারপরে অধ্যাপক বেনজামিনী (এবং আমি) পি-ভ্যালুগুলির দোষ নয় - শীর্ষক একটি প্রতিক্রিয়া পোস্ট লিখেছিলেন - সাম্প্রতিক এএসএ বিবৃতিটির প্রতিচ্ছবি । এর জবাবে অধ্যাপক ম্যাটলফ একটি ফলোআপ পোস্টে জিজ্ঞাসা করলেন :

আমি যা দেখতে চাই [... এটি] - একটি ভাল, দৃinc়প্রত্যয়ী উদাহরণ, যাতে পি-মানগুলি কার্যকর। এটি সত্যই নীচের অংশ হতে হবে।

মূল্যের কার্যকারিতার বিরুদ্ধে তার দুটি প্রধান যুক্তি উদ্ধৃত করতে :p

  1. বড় নমুনাগুলি সহ, তাত্পর্য পরীক্ষা থেকে ক্ষুদ্র, গুরুত্বহীন প্রস্থানগুলি তাত্পর্য পরীক্ষা করে।

  2. বাস্তব বিশ্বে প্রায় কোনও নাল হাইপোথেসিসই সত্য নয়, সুতরাং তাদের উপর একটি তাত্পর্য পরীক্ষা করা অবাস্তব এবং উদ্ভট।

অন্যান্য ক্রসওয়েলিফায়েড সম্প্রদায়ের সদস্যরা এই প্রশ্ন / যুক্তিগুলি সম্পর্কে কী ভাবেন এবং এতে কীভাবে একটি ভাল প্রতিক্রিয়া তৈরি হতে পারে সে সম্পর্কে আমি খুব আগ্রহী।


5
এই বিষয়টির সাথে সম্পর্কিত আরও দুটি থ্রেড লক্ষ্য করুন: stats.stackexchange.com/questions/200500/… এবং stats.stackexchange.com/questions/200745/…
টিম

2
ধন্যবাদ টিম আমার সন্দেহ হয় যে আমার প্রশ্নটি যথেষ্ট আলাদা যে এটি তার নিজস্ব থ্রেডের জন্য প্রাপ্য (বিশেষত যেহেতু আপনি যে দুটি জবাব দিয়েছেন তার জবাব দেওয়া হয়নি)। তবুও, লিঙ্কগুলি খুব আকর্ষণীয়!
তাল গালিলি

3
এটি প্রাপ্য এবং আকর্ষণীয় (অতএব আমার +1), আমি লিঙ্কগুলি কেবলমাত্র এফআইআই :) সরবরাহ করেছি :)
টিম

3
আমি অবশ্যই বলব যে ম্যাটলফ এই বিষয়ে কী লিখেছেন তা আমি এখনও (এখনও) পড়িনি, তবে তবুও, আপনার প্রশ্নটি নিজে থেকে দাঁড়ানোর জন্য, আপনি সম্ভবত সংক্ষেপে সংক্ষেপে বলতে পারেন কেন তিনি পি-মান ব্যবহারের কোনও আদর্শ উদাহরণ খুঁজে পান না " ভাল / বিশ্বাসী "? উদাহরণস্বরূপ কেউ যদি নির্দিষ্ট পরীক্ষামূলক হেরফের একটি নির্দিষ্ট দিকের মধ্যে পশুর আচরণ পরিবর্তন করে; সুতরাং একটি পরীক্ষামূলক এবং একটি নিয়ন্ত্রণ গ্রুপ পরিমাপ করা হয় এবং তুলনা করা হয়। এই জাতীয় কাগজের পাঠক হিসাবে আমি পি-মানটি (যেমন তারা আমার পক্ষে দরকারী) দেখে খুশি, কারণ এটি যদি বড় হয় তবে আমার দৃষ্টি দেওয়ার দরকার নেই। এই উদাহরণ কি যথেষ্ট নয়?
অ্যামিবা

1
@ অ্যামিবা - তিনি সেগুলি এখানে তালিকাভুক্ত করেছেন: matloff.wordpress.com/2016/03/07/… ----- তার যুক্তি উদ্ধৃত করে: ১) বড় নমুনা সহ, গুরুত্বের পরীক্ষাগুলি নাল হাইপোথিসিস থেকে ক্ষুদ্র, গুরুত্বহীন প্রস্থানগুলিতে ঝাঁপিয়ে পড়ে। ২) বাস্তব বিশ্বে প্রায় কোনও নাল হাইপোথেসিসই সত্য নয়, সুতরাং তাদের উপর তাত্পর্যপূর্ণ পরীক্ষা করা অবাস্তব এবং উদ্ভট। ----- আমার এগুলি গ্রহণ করা উচিত (যা পরে আমি আনুষ্ঠানিকভাবে জানাতে চাই) তবে আমি নিশ্চিত যে এর উত্তর দেওয়ার অন্তর্দৃষ্টিপূর্ণ উপায়গুলি অন্যের কাছে থাকবে।
তাল গালিলি

উত্তর:


44

আমি ম্যাটলফের দুটি বিষয়ই বিবেচনা করব:

  1. বড় নমুনাগুলি সহ, তাত্পর্য পরীক্ষা থেকে ক্ষুদ্র, গুরুত্বহীন প্রস্থানগুলি তাত্পর্য পরীক্ষা করে।

    এখানে যুক্তিটি হ'ল যদি কেউ অত্যন্ত উল্লেখযোগ্য প্রতিবেদন করে তবে কেবল এই সংখ্যাটি থেকে আমরা প্রভাবটি বড় এবং গুরুত্বপূর্ণ বা অপ্রাসঙ্গিকভাবে ক্ষুদ্র (বড় সাথে ঘটতে পারে ) ক্ষুদ্র কিনা তা আমরা বলতে পারি না । আমি এই যুক্তিটি অদ্ভুত বলে মনে করি এবং এর সাথে মোটেই সংযোগ করতে পারি না, কারণ আমি এমন গবেষণা কখনও দেখিনি যা প্রভাব আকারের [কিছু সমতুল্য] রিপোর্ট না করে কোনও মূল্যকে প্রতিবেদন করবে । যে সমস্ত সমীক্ষায় আমি পড়তে যেমন would বলে (এবং সাধারণত একটি চিত্র দেখাবেন) যে গ্রুপ একটি অমুক অমুক গড়, গ্রুপ বি অমুক অমুক গড় ছিল এবং তারা অমুক অমুক সঙ্গে উল্লেখযোগ্যভাবে ভিন্ন ছিল -value। এ এবং বি এর মধ্যে পার্থক্য বড় বা ছোট হলে আমি স্পষ্টতই নিজের জন্য বিচার করতে পারি।p=0.0001npp

    (মন্তব্যে, @ রবিনএকম্যান আমাকে জিলিয়াক অ্যান্ড ম্যাকক্লোস্কির (১৯৯ 1996 , ২০০৪ ) বেশ কয়েকটি উচ্চ-উদ্ধৃত গবেষণার দিকে লক্ষ্য করেছিলেন, যিনি পর্যবেক্ষণ করেছেন যে বেশিরভাগ অর্থনীতির পেপারের প্রভাবের আকারের দিকে বেশি মনোযোগ না দিয়ে ট্রাম্পের "পরিসংখ্যানিক তাত্পর্য" রয়েছে। এর "ব্যবহারিক তাত্পর্য" (যা, জেডএন্ডএমএসের যুক্তি, প্রায়শই বিয়োগাত্মক হতে পারে) এটি স্পষ্টত খারাপ অনুশীলন। তবে, @ ম্যাটটিওএস নীচে ব্যাখ্যা করেছেন, প্রভাবের আকারগুলি (রিগ্রেশন অনুমান) সর্বদা রিপোর্ট করা হয়, তাই আমার যুক্তি দাঁড়ায়)

  2. বাস্তব বিশ্বে প্রায় কোনও নাল হাইপোথেসিসই সত্য নয়, সুতরাং তাদের উপর একটি তাত্পর্য পরীক্ষা করা অবাস্তব এবং উদ্ভট।

    এই উদ্বেগটি প্রায়শই বলা হয়, তবে এখানে আবার আমি এটির সাথে সত্যই সংযোগ দিতে পারি না। এটি উপলব্ধি করা গুরুত্বপূর্ণ যে গবেষকরা তাদের বিজ্ঞাপন ইনফিনিটাম বাড়ায় না । আমি যে স্নায়ুবিজ্ঞানের সাথে পরিচিত, সেই শাখায় লোকেরা বা সম্ভবত দিয়ে পরীক্ষা করবে say যদি কোনও প্রভাব দেখা যায় না তবে উপসংহারে বলা যায় যে প্রভাবটি আকর্ষণীয় হওয়ার পক্ষে যথেষ্ট বড় নয়। আমি জানি কেউই প্রজনন, প্রশিক্ষণ, রেকর্ডিং এবং ইঁদুর উত্সর্গ করতে যাবেন তা দেখানোর জন্য এখানে কিছু পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ তবে ক্ষুদ্র প্রভাব রয়েছে। এবং যদিও এটি সত্য হতে পারে যে প্রায় কোনও বাস্তব প্রভাব হুবুহু হয় না, এটি হয়n n=20n=50n=5000 অবশ্যই সত্য যে যুক্তিসঙ্গত গবেষকরা প্রকৃতপক্ষে তাদের ভাল বিচার অনুশীলন করে ব্যবহার করছেন এমন যুক্তিসঙ্গত নমুনার আকারগুলির সাথে সনাক্ত করার জন্য অনেকগুলি আসল প্রভাবগুলি যথেষ্ট ছোট।

    (এখানে একটি বৈধ উদ্বেগ রয়েছে যে নমুনার আকারগুলি প্রায়শই পর্যাপ্ত পরিমাণে বড় হয় না এবং অনেকগুলি অধ্যয়নও নিরক্ষিত হয় So তাই সম্ভবত অনেক ক্ষেত্রে গবেষকদের লক্ষ্য করা উচিত, পরিবর্তে বলুন Still তবুও, নমুনার আকার যাই হোক না কেন , এটি প্রভাবের আকারের উপর একটি সীমা রাখে যা গবেষণায় সনাক্ত করার ক্ষমতা রয়েছে))n=100n=20

    তদতিরিক্ত, আমি মনে করি না যে আমি প্রায় কোনও নাল হাইপোথেসিস সত্য নয়, কমপক্ষে পরীক্ষামূলক র্যান্ডমাইজড স্টাডিতে না (পর্যবেক্ষণের বিপরীতে) not দুটি কারণ:

    • খুব প্রায়শই ভবিষ্যদ্বাণীটির একটি দিকনির্দেশনা থাকে যা পরীক্ষা করা হয়; গবেষক প্রকট যে কিছু প্রভাব ইতিবাচক লক্ষ্যে কাজ করে । কনভেনশন অনুসারে এটি সাধারণত একটি দ্বিপক্ষীয় পরীক্ষা দিয়ে বিন্দু নাল ধরে ধরে তবে বাস্তবে এটি বরং একতরফা পরীক্ষা যা প্রত্যাখ্যান করার চেষ্টা করছে । (@ CliffAB এর উত্তর, +1 একটি সংশ্লিষ্ট বিন্দু করে তোলে।) এটি এমন করতে অবশ্যই সত্য হতে।δ>0H0:δ=0H0:δ<0

    • এমনকি "নীল" নাল সম্পর্কে কথা কেন আমি কখনই সত্য হয় না তা আমি দেখতে পাই না। কিছু জিনিস কেবল কার্যকারিতা হিসাবে অন্যান্য জিনিসের সাথে সম্পর্কিত হয় না। মনোবিজ্ঞানের অধ্যয়নগুলি দেখুন যা গত বছরগুলিতে প্রতিরূপ করতে ব্যর্থ হচ্ছে: লোকেরা ভবিষ্যত অনুভব করছে; ডিম্বস্ফোটনের সময় লাল পোশাকে মহিলারা; পুরানো-বয়স সম্পর্কিত শব্দের গতি প্রভাবিত শব্দ সঙ্গে priming; ইত্যাদি এটা খুব ভাল হতে পারে এ সব এখানে কোন কার্যকারণ লিঙ্ক এবং তাই সত্য প্রভাব আছে ঠিক শূন্য।H0:δ=0

নিজেই, নরম ম্যাটলফ ভ্যালুগুলির পরিবর্তে আত্মবিশ্বাসের ব্যবধানগুলি ব্যবহার করার পরামর্শ দেয় কারণ তারা প্রভাবের আকারটি দেখায়। আত্মবিশ্বাসের ব্যবধানগুলি ভাল, তবে ভ্যালুয়ের তুলনায় একটি আত্মবিশ্বাসের ব্যবধানের একটি অসুবিধা লক্ষ্য করুন : আত্মবিশ্বাসের ব্যবধানটি একটি নির্দিষ্ট কভারেজ মান, যেমন জন্য রিপোর্ট করা হয় । একটি আত্মবিশ্বাসের ব্যবধানটি দেখানো আমাকে জানায় না যে আস্থা অন্তর কতটা বিস্তৃত হবে। তবে একটি একক মূল্যকে যে কোনও pha সাথে তুলনা করা যেতে পারে এবং বিভিন্ন পাঠকের মনে বিভিন্ন বর্ণ থাকতে পারে।pp95%95%99%pα

অন্য কথায়, আমি মনে করি যে কেউ আত্মবিশ্বাসের ব্যবধানগুলি ব্যবহার করতে পছন্দ করেন তাদের জন্য, ভ্যালুটি রিপোর্ট করার জন্য একটি দরকারী এবং অর্থবহ অতিরিক্ত পরিসংখ্যান।p


আমি আমার প্রিয় ব্লগার স্কট আলেকজান্ডারের কাছ থেকে মূল্যগুলির ব্যবহারিক উপযোগিতা সম্পর্কে একটি দীর্ঘ উদ্ধৃতি দিতে চাই ; তিনি কোনও পরিসংখ্যানবিদ নন (তিনি একজন সাইকিয়াট্রিস্ট) তবে মনস্তাত্ত্বিক / চিকিত্সা সাহিত্য পড়ার এবং এতে পরিসংখ্যানগুলি যাচাই-বাছাই করার প্রচুর অভিজ্ঞতা রয়েছে। উক্ত নকল চকোলেট অধ্যয়নের বিষয়ে তাঁর ব্লগ পোস্টটি থেকে আমি যা সুপারিশ করছি। জোর আমার।p

[...] তবে ধরুন আমাদের ভ্যালু করার অনুমতি নেই । আমি শুধু আপনাকে বলি "হ্যাঁ, পনেরো জনের সাথে একটি গবেষণা ছিল যা চকোলেট ইনসুলিন প্রতিরোধের সাথে সহায়তা করেছিল" এবং আপনি আমার মুখে হাসেন। প্রভাব আকার এটি যে সাহায্য করবে বলে মনে করা হয়। তবে ধরুন আমি আপনাকে বলি "পনেরো জনের সাথে একটি গবেষণা ছিল যা চকোলেট ইনসুলিন প্রতিরোধের সাথে সহায়তা করেছিল। প্রভাবের আকার ছিল ।" এলোমেলো শোরগোলের সাথে সামঞ্জস্যপূর্ণ কিনা তা নিয়ে আমার মোটেই কোন অনুজ্ঞান নেই। আপনি কি? ঠিক আছে, তারপরে তারা বলবে আমাদের আত্মবিশ্বাসের ব্যবধানগুলি প্রতিবেদন করার কথা। এর আস্থা অন্তর সহ এফেক্টের আকার ছিলp0.60.695%[0.2,1.0]। ঠিক আছে. সুতরাং আমি আত্মবিশ্বাসের ব্যবধানের নীচের সীমানাটি পরীক্ষা করে দেখি, এটি শূন্যের থেকে পৃথক। তবে এখন আমি মূল্যকে ছাড়িয়ে যাচ্ছি না । আমি নিজেই এর এক ধরণের ক্লডজি গণনা করে পি-মানটি ব্যবহার করছি - " আত্মবিশ্বাসের ব্যবধানে শূন্য অন্তর্ভুক্ত হয় না" " ভ্যালুও চেয়ে কম " হিসাবে একই ।p95%p0.05

(কল্পনা করুন যে, যদিও আমি জানি আস্থা অন্তরটি শূন্যের অন্তর্ভুক্ত নয়, আমি ভাবতে শুরু করি যে আত্মবিশ্বাস অন্তর অন্তর্গত হয় কিনা । কেবল যদি এমন কিছু পরিসংখ্যান থাকত যা আমাকে এই তথ্য দেয়!)95%99%

কিন্তু মূল্যগুলি থেকে মুক্তি পাওয়া " হ্যাকিং" রোধ করবে না ? হতে পারে, তবে এটি কেবল "ডি-হ্যাকিং" এর পথ দেবে। আপনি বিশটি বিপাকীয় পরামিতিগুলির জন্য পরীক্ষা করতে পারেন এবং কেবল সর্বোচ্চ প্রভাব আকারের সাথে প্রতিবেদন করতে পারেন বলে আপনি মনে করেন না? শুধু পার্থক্য হবে যে P-হ্যাকিং সম্পূর্ণরূপে স্বচ্ছ - আপনি বিশ পরীক্ষা এবং একটি রিপোর্ট এর , আমি জানি তুমি একটা নির্বোধ - কিন্তু ডি-ফাটান অবর্ণনীয় হবে। আপনি যদি বিশটি পরীক্ষা করেন এবং প্রতিবেদন করেন যে তাদের মধ্যে একটির পেয়েছে , তা কি চিত্তাকর্ষক? [...]ppp0.05d=0.6

তবে ভ্যালু থেকে এফেক্ট আকারে স্যুইচ করা লোককে ক্ষুদ্রতর প্রভাব সম্পর্কে বড় কথাবার্তা থেকে বিরত রাখবে না যা তবুও পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ? হ্যাঁ, তবে কখনও কখনও আমরা সংক্ষিপ্ত প্রভাবগুলি সম্পর্কে বড় কথা বলতে চাই যা তবুও পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ! মনে করুন যে কোকা-কোলা একটি নতুন পণ্য সংযোজনকারী পরীক্ষা করছে, এবং বৃহত মহামারীবিজ্ঞানের গবেষণায় দেখা গেছে যে এটি প্রতি বছরে এক হাজার মানুষকে অতিরিক্ত মৃত্যুর কারণ করে। এটি প্রায় শূন্যের একটি প্রভাব আকার, তবে এটি এখনও পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হতে পারে। এবং যেহেতু প্রতিবছর বিশ্বব্যাপী প্রায় এক বিলিয়ন মানুষ কোক পান করে, এটিই দশ হাজার মানুষের মৃত্যু। কোক যদি বলেন, "না, প্রভাবের আকারটি খুব ছোট, ভেবে দেখার মতো নয়", তারা প্রায় দুই মিলি-হিটলারের লোককে হত্যা করবে।p


মূল্যগুলির (বায়েশিয়ানগুলি সহ) বিভিন্ন বিকল্পের আরও কিছু আলোচনার জন্য, এএসএতে আমার উত্তর দেখুন মূল্যগুলির সীমাবদ্ধতা নিয়ে আলোচনা - বিকল্পগুলি কী কী?pp


1
দ্বিতীয় যুক্তিতে আপনার প্রতিক্রিয়াটি আমার মতে পয়েন্টটি মিস করে। কেউই পরামর্শ দিচ্ছে না যে প্রকৃত গবেষকরা তাদের নমুনা আকারের বিজ্ঞাপন বাড়িয়ে তোলেন। বিন্দুটি (যেমনটি আমি দেখতে পাচ্ছি) হ'ল "প্রভাব = 0" ফর্মের যে কোনও নাল অনুমানের যে কোনও গবেষক পরীক্ষার জন্য আগ্রহী তা মিথ্যা হতে চলেছে, এবং যদি নাল অনুমানটি ইতিমধ্যে থাকে তবে অনুমানের পরীক্ষা করার কোনও মূল্য নেই মিথ্যা হিসাবে পরিচিত। এটি অবশ্যই ধরে নিয়েছে যে আমরা যা দেখতে আগ্রহী তা হ'ল নমুনার বৈশিষ্ট্যগুলির চেয়ে প্রাসঙ্গিক জনসংখ্যা প্যারামিটার (গুলি)।
999

1
তবে আমি স্বীকার করি যে "যে কোনও নাল হাইপোথিসিস ... মিথ্যা হতে চলেছে" এটি কেবল একটি অনুমান মাত্র।
999

1
আমার স্বীকার করা উচিত যে এখানে আমার যুক্তিটি বরং অনানুষ্ঠানিক ছিল এবং আমি কখনই এটি আনুষ্ঠানিক করার চেষ্টা করিনি। সম্ভবত এই যুক্তিটিকে কাজ করার জন্য, আমার এটি বলা উচিত নয় যে আকর্ষণীয় এবং আগ্রহী প্রভাবের আকারগুলির মধ্যে একটি স্পষ্ট সীমানা রয়েছে। বরং এটি শূন্য থেকে আরও দূরে বাড়ার আগ্রহ সহকারে একটি ধারাবাহিকতা এবং "যুক্তিসঙ্গত" নমুনা আকারটি খুব আকর্ষণীয় প্রভাবের আকারগুলিকে খুব আকর্ষণীয়গুলিকে ছোট শক্তি দিতে হবে, তবে কোনও থ্রেশহোল্ড নেই। আমি ভাবছি যে কেউ নেইমন-পিয়ারসন লাইনের সাথে এটি সঠিকভাবে আনুষ্ঠানিক করতে পারেন কিনা।
অ্যামিবা বলেছেন

6
হতে পারে আপনি "এমন কোনও গবেষণা কখনও দেখেন নি যা প্রভাবের আকারের [কিছু সমতুল্য] রিপোর্ট না করেই ভ্যালু রিপোর্ট করবে ", তবে জিলিয়াক এবং ম্যাকক্লোস্কি মাত্র দু' দশকের মধ্যে মাত্র একটি জার্নাল, দ্য আমেরিকান ইকোনমিক রিভিউতে প্রকাশিত প্রায় 300 এর মতো প্রবন্ধ খুঁজে পেয়েছেন। । এই জাতীয় কাগজপত্রগুলি যে সমস্ত কাগজপত্র তারা দেখেছিল তার 70% এরও বেশি made p
রবিন একমান

3
@ অ্যামিবা: %০% দাবির উত্সটি ২০০ 2006 এর অ্যাবস্ট্রাক্টে দ্ব্যর্থহীন বাক্য হতে পারে: "১৯৮০ এর দশকে [এইআর] তে প্রকাশিত ১৮২ পূর্ণ দৈর্ঘ্যের গবেষণাপত্রের মধ্যে %০% অর্থনৈতিক পরিসংখ্যানগত তাত্পর্য থেকে আলাদা হয়নি"। এগুলি দ্বারা - উভয় গবেষণাপত্রে ব্যাখ্যা করা - এর অর্থ তারা হ'ল প্রায়শই কেবল পরবর্তী ব্যক্তির উপরই মন্তব্য করা হয় এবং নির্ভরশীল ভেরিয়েবল (তাদের জার্গনে "অর্থনৈতিক তাত্পর্য") সম্পর্কিত রিগ্রেশন সহগের তাত্পর্য যতটা বিস্তৃতভাবে বিশ্লেষণ করা হয় না । তবে সর্বদা এটি রিপোর্ট করা হয়। আমি আপনাকে :-)
ম্যাটটিওস

29

নিম্নলিখিত দুটি আইডিয়াতে আমি দুর্দান্ত অপরাধ করি:

  1. বড় নমুনাগুলি সহ, তাত্পর্য পরীক্ষা থেকে ক্ষুদ্র, গুরুত্বহীন প্রস্থানগুলি তাত্পর্য পরীক্ষা করে।

  2. বাস্তব বিশ্বে প্রায় কোনও নাল হাইপোথেসিসই সত্য নয়, সুতরাং তাদের উপর একটি তাত্পর্য পরীক্ষা করা অবাস্তব এবং উদ্ভট।

এটি পি-মান সম্পর্কে এমন স্ট্রোম্যান যুক্তি। পরিসংখ্যানের বিকাশের জন্য উত্সাহিত করে এমন খুব ভিত্তিগত সমস্যাটি আসে কোনও প্রবণতা দেখে এবং আমরা যা দেখি তা সুযোগ দ্বারা হয় কি না বা পদ্ধতিগত প্রবণতার প্রতিনিধি কিনা তা জানতে আগ্রহী।

এই বিষয়টি মাথায় রেখে, এটি সত্য যে আমরা পরিসংখ্যানবিদ হিসাবে সাধারণত বিশ্বাস করি না যে নাল-অনুমানটি সত্য (যেমন , যেখানে দুটি দলের মধ্যে কিছু পরিমাপের মধ্যবর্তী পার্থক্য)। তবে, দুটি তরফা পরীক্ষা দিয়ে, আমরা জানি না কোন বিকল্প অনুমানটি সত্য! একটি দ্বিপক্ষীয় পরীক্ষায় আমরা বলতে চাই যে আমরা 100% নিশ্চিত যে ডেটা দেখার আগে । তবে আমরা জানি না যে বা । সুতরাং আমরা যদি আমাদের পরীক্ষা এবং এই সিদ্ধান্তে যে , আমরা কে প্রত্যাখ্যান করেছি (যেমন ম্যাটলফ বলতে পারে; নিরর্থক উপসংহারে) তবে আরও গুরুত্বপূর্ণ, আমরাও প্রত্যাখ্যান করেছিHo:μd=0μdμd0μd>0μd<0μd>0μd=0μd<0 (আমি বলছি; দরকারী উপসংহার)। @ অ্যামিবা যেমন উল্লেখ করেছেন, এটি একতরফা পরীক্ষার ক্ষেত্রেও প্রযোজ্য যা দ্বিপক্ষীয় হওয়ার সম্ভাবনা রয়েছে, যেমন ওষুধের ইতিবাচক প্রভাব রয়েছে কিনা তা পরীক্ষা করা।

এটি সত্য যে এটি আপনাকে প্রভাবের প্রবণতাটি বলে না। তবে এটি আপনাকে প্রভাবের দিকটি বলে দেয়। সুতরাং আসুন ঘোড়া আগে গাড়ীটি না রাখা; আমি প্রভাবটির প্রবণতা সম্পর্কে সিদ্ধান্তগুলি আঁকতে শুরু করার আগে, আমি আত্মবিশ্বাসী হতে চাই যে আমি এফেক্টের দিকটি সঠিক পেয়েছি!

একইভাবে, "পি-মানগুলি ক্ষুদ্র, গুরুত্বহীন প্রভাবগুলির উপর চাপ দেয়" এই যুক্তিটি আমার কাছে যথেষ্ট ত্রুটিযুক্ত বলে মনে হয়। যদি আপনি ডেটা আপনার উপসংহারের দিকটিকে কতটা সমর্থন করে তার পরিমাপ হিসাবে একটি পি-ভ্যালু মনে করেন , তবে অবশ্যই নমুনার আকার যথেষ্ট পরিমাণে বড় হলে আপনি এটি ছোট প্রভাবগুলি তুলতে চান। এর অর্থ তারা কার্যকর না বলে আমার কাছে খুব বিস্ময়কর: এই গবেষণার ক্ষেত্রগুলি কি পি-ভ্যালুতে ভুগেছে যেগুলি এত বেশি ডেটা রয়েছে তাদের অনুমানের নির্ভরযোগ্যতা মূল্যায়ন করার প্রয়োজন নেই? একইভাবে, যদি আপনার সমস্যাগুলি সত্যিই পি-মানগুলি "ক্ষুদ্র প্রভাবের আকারের উপর চাপ দেয়" হয় তবে আপনি সহজেই হাইপোথেসিগুলি এবংএইচ 2 : μ ডি < - 1H1:μd>1H2:μd<1(ধরে নিলে আপনি 1 কে ন্যূনতম গুরুত্বপূর্ণ প্রভাবের আকার বলে মনে করছেন)। এটি প্রায়শই ক্লিনিকাল ট্রায়ালগুলিতে করা হয়।

এটি আরও চিত্রিত করার জন্য, ধরুন আমরা কেবল আত্মবিশ্বাসের অন্তর এবং ত্যাগ করা পি-মানগুলিতে নজর রেখেছি। আত্মবিশ্বাসের ব্যবধানে আপনি প্রথম যা যা যাচাই করবেন? ফলাফলগুলি খুব গুরুত্ব সহকারে নেওয়ার আগে প্রভাবটি কঠোরভাবে ইতিবাচক (বা নেতিবাচক) ছিল কিনা। যেমন, পি-মান ব্যতীত, আমরা অনানুষ্ঠানিকভাবে অনুমানের পরীক্ষাও করবো।

পরিশেষে, ওপি / ম্যাটলফের অনুরোধের প্রসঙ্গে, "পি-ভ্যালুগুলি উল্লেখযোগ্যভাবে উন্নত হওয়ার একটি দৃinc়প্রত্যয়ী যুক্তি দিন", আমি মনে করি প্রশ্নটি কিছুটা বিশ্রী। আমি এটি বলছি কারণ আপনার দৃষ্টিভঙ্গির উপর নির্ভর করে এটি স্বয়ংক্রিয়ভাবে নিজের জবাব দেয় ("আমাকে একটি দৃ concrete় উদাহরণ দিন যেখানে একটি হাইপোথিসিস পরীক্ষা না করে সেগুলি পরীক্ষা না করা ভাল")। তবে, একটি বিশেষ ক্ষেত্রে যা আমি প্রায় অনস্বীকার্য বলে মনে করি তা হ'ল আরএনএএসেকের ডেটা। এই ক্ষেত্রে, আমরা সাধারণত দুটি ভিন্ন গ্রুপে (যেমন রোগাক্রান্ত, নিয়ন্ত্রণ) আরএনএর প্রকাশের স্তরের দিকে তাকাচ্ছি এবং দুটি গ্রুপে পৃথকভাবে প্রকাশিত জিনগুলি অনুসন্ধান করার চেষ্টা করছি। এই ক্ষেত্রে, প্রভাব আকার নিজেই এমনকি সত্যই অর্থবহ নয়। এটি কারণ বিভিন্ন জিনের এক্সপ্রেশন স্তরগুলি এত বন্যভাবে পরিবর্তিত হয় যে কিছু জিনের জন্য 2x উচ্চতর এক্সপ্রেশন থাকা কোনও অর্থই বোঝায় না, অন্যান্য কঠোরভাবে নিয়ন্ত্রিত জিনগুলির ক্ষেত্রে, 1.2x উচ্চতর এক্সপ্রেশন মারাত্মক। সুতরাং গ্রুপের সাথে প্রথম তুলনা করার সময় এফেক্ট আকারের প্রকৃত পরিমাণটি আসলে কিছুটা উদ্বেগজনক। কিন্তু তুমিপ্রকৃতপক্ষে, জেনের প্রকাশটি গ্রুপ এবং পরিবর্তনের দিকের মধ্যে পরিবর্তিত হয় কিনা তা জানতে চাই! তদুপরি, একাধিক তুলনা সম্পর্কিত সমস্যাগুলি (যেগুলির জন্য আপনি তাদের মধ্যে এক হাজারে 20,000 করতেই পারেন) পি-মানগুলির তুলনায় আস্থার ব্যবধানের সাথে সমাধান করা আরও বেশি কঠিন difficult


2
আমি একমত নই যে এফেক্টের দিকনির্দেশনা জানা নিজেই দরকারী in যদি আমি মাটিতে থুথু ফেলি তবে আমি জানি এটি উদ্ভিদের বৃদ্ধি উন্নত বা বাধাগ্রস্থ করবে (অর্থাত্ কোনও প্রভাবের নাল অনুমানটি মিথ্যা নয়)। এর প্রভাবটির দিকনির্দেশ সম্পর্কে কোনও তথ্য ছাড়াই জেনে কীভাবে সহায়ক? তা সত্ত্বেও এই হল শুধুমাত্র জিনিস পি আপনার দুটি একতরফা পরীক্ষা থেকে -value / দুই একতরফা পরীক্ষা (ধরণের) আপনি বলে! (বিটিডাব্লু, আমি মনে করি যে 'মাটিতে থুথু' উদাহরণটি বেশ কয়েক বছর আগে পড়া পি- মূল্যবোধের কোনও কাগজ থেকে নেওয়া হয়েছিল , তবে আমি কোনটি মনে করতে পারি না।)
কার্ল ওভে হাফটামার

3
@ কার্লওভেহুফামহ্যামার: ঘোড়ার আগে কার্ট। আমার প্রভাব থামানো উচিত না কারণ আমি প্রভাবের দিকটি জানি। তবে আমার যত্ন নেওয়া উচিত যে আমি প্রশস্ততা সম্পর্কে চিন্তা করতে শুরু করার আগে আমার দিকটি সঠিক ছিল। আপনি কী ভাবেন যে পি-ভ্যালুগুলি যাচাই না করে বৈজ্ঞানিক সম্প্রদায়টি বড় প্রাক্কলিত প্রভাব সহ সবকিছুকে আলিঙ্গন করে আরও ভাল হবে?
ক্লিফ এবি

3
তদুপরি, "পি-মানগুলি আপনাকে দরকারী তথ্য দেয় না" এই ধারণাটি হ'ল হাইপোথিসিস টেস্টিংয়ের opালু ব্যবহার। আপনি সহজেই এবং এর পরীক্ষা করতে পারেন যদি আপনি মনে করেন যে কোনওভাবে অর্থবহ হওয়ার জন্য কোনও প্রভাবের আকার 1 এর চেয়ে বেশি মাত্রার হতে হবে। (এটি প্রতিফলিত করার জন্য উত্তরটি সম্পাদনা করেছেন, কারণ আমি বিশ্বাস করি এটি একটি গুরুত্বপূর্ণ বিষয় it এটি আনার জন্য ধন্যবাদ)এইচ একটি : μ < - 1Ha:μd>1Ha:μd<1
ক্লিফ এবি

2
আপনি সম্পাদনাগুলি বেশ কয়েকটি খুব ভাল পয়েন্ট করেছেন। আমি আপনার উত্তর এখন সত্যিই পছন্দ!
অ্যামিবা

3
আমার stats.stackexchange.com/Qestions/200500 আমার উত্তর নিয়ে কাজ করার সময় আমি ওয়াগেনমেকারস এট এর সাম্প্রতিক প্রিপ্রিন্ট জুড়ে এসেছি যেখানে তারা মূলত দিকনির্দেশনা সম্পর্কে আপনার বক্তব্যটি তুলে ধরেছেন : "একতরফা পি মানগুলিকে একটি আনুমানিক পরীক্ষা হিসাবে বায়েশিয়ান ব্যাখ্যা দেওয়া যেতে পারে দিকনির্দেশ, এটি একটি সুপ্ত প্রভাব নেতিবাচক বা ধনাত্মক কিনা তা পরীক্ষা। " এটি আকর্ষণীয় কারণ ওয়াগনমেকার্স একজন ডাই-হার্ড বায়েশিয়ান, তিনি পি-মূল্যবোধের বিরুদ্ধে অনেক লিখেছিলেন। তবুও, আমি এখানে কিছু ধারণামূলক চুক্তি দেখতে পাচ্ছি।
অ্যামিবা

6

আমার কটূক্তি ক্ষমা করুন, তবে পি-মানগুলির ইউটিলিটির একটি স্পষ্ট ভাল উদাহরণ প্রকাশিত হ'ল। পি-ভ্যালু তৈরির জন্য আমার কাছে একটি পরীক্ষার্থী আমার কাছে এসেছিলেন ... তিনি বৃদ্ধির উন্নতির জন্য একটি একক উদ্ভিদে ট্রান্সজিন প্রবর্তন করেছিলেন। সেই একক উদ্ভিদ থেকে তিনি একাধিক ক্লোন তৈরি করেছিলেন এবং বৃহত্তম ক্লোনটি বেছে নিয়েছিলেন, একটি উদাহরণ যেখানে পুরো জনসংখ্যা গণনা করা হয়। তার প্রশ্ন, পর্যালোচক একটি পি-মান দেখতে চায় যে এই ক্লোনটি সবচেয়ে বড়। আমি উল্লেখ করেছি যে এই ক্ষেত্রে পরিসংখ্যানের কোনও প্রয়োজন নেই কারণ তাঁর হাতে পুরো জনসংখ্যা ছিল, তবে কোনও ফলসই হয়নি।

আরও গুরুতরভাবে, আমার বিনীত মতে, একাডেমিক দৃষ্টিকোণ থেকে আমি এই আলোচনাটি আকর্ষণীয় এবং উদ্দীপক মনে করি ঠিক যেমন কয়েক বছর আগে ঘন ঘনবাদী বনাম বয়েশিয়ান বিতর্কগুলির মতো। এটি এই ক্ষেত্রের সেরা মনের বিবিধ দৃষ্টিভঙ্গি এনেছে এবং পদ্ধতিগুলির সাথে জড়িত অনেক অনুমান / ক্ষতিগুলি আলোকিত করে যা সাধারণত সহজেই অ্যাক্সেসযোগ্য হয় না।

বাস্তবে, আমি মনে করি যে সর্বোত্তম পদ্ধতির বিষয়ে তর্ক করার পরিবর্তে এবং অন্যটির আগে যেমন একটি ত্রুটিযুক্ত গজ প্রতিস্থাপনের পরামর্শ দেওয়া হয়েছিল, আমার জন্য এটি বরং অন্তর্নিহিত সিস্টেমিক সমস্যার উদ্ভাস এবং সর্বোত্তম খুঁজে পাওয়ার চেষ্টা করার দিকে মনোনিবেশ করা উচিত সমাধান। উদাহরণস্বরূপ, কেউ এমন পরিস্থিতি উপস্থাপন করতে পারে যেখানে পি-মান এবং সিআই একে অপরের পরিপূরক হয় এবং এমন পরিস্থিতিতে যেখানে একজন অপরটির চেয়ে নির্ভরযোগ্য। জিনিসগুলির দুর্দান্ত পরিকল্পনায়, আমি বুঝতে পারি যে সমস্ত অনুমানমূলক সরঞ্জামগুলির নিজস্ব ত্রুটি রয়েছে যা কোনও প্রয়োগেই বোঝা দরকার যাতে চূড়ান্ত লক্ষ্যের দিকে স্টিমি অগ্রগতি না ঘটে .. অধ্যয়নের পদ্ধতির গভীর উপলব্ধি।


6

আমি কীভাবে পি-ভ্যালুগুলি ব্যবহার এবং রিপোর্ট করা উচিত তার অনুকরণীয় কেস দেব। এটি সিইআরএন-এর লার্জ হ্যাড্রন কলাইডার (এলএইচসি) সম্পর্কিত একটি রহস্যময় কণার সন্ধানের একটি সাম্প্রতিক রিপোর্ট ।

কয়েক মাস আগে এলএইচসিতে একটি বড় কণা সনাক্ত হওয়ার সম্ভাবনা সম্পর্কে উচ্চ শক্তি পদার্থবিজ্ঞানের চেনাশোনাগুলিতে প্রচুর উত্তেজিত বকবক হয়েছিল। মনে রাখবেন এটি হিগস বোসন আবিষ্কারের পরে ছিল । এখানে থেকে উদ্ধৃতাংশ কাগজ দ্বারা "এ √s এ পিপি দুর্ঘটনায় = এটলাস আবিষ্কারক 13 TeV এর 3.2 FB-1 জোড়া ফোটন থেকে ক্ষয়িষ্ণু রেজোন্যান্স জন্য অনুসন্ধান করুন" এটলাস সাহায্য ডিসেম্বর 15 2015 এবং আমার মন্তব্য অনুসরণ করুন:

এখানে চিত্র বর্ণনা লিখুন

তারা এখানে যা বলছে তা হ'ল স্ট্যান্ডার্ড মডেল যে ভবিষ্যদ্বাণী করে তার চেয়ে বেশি ইভেন্টের গণনা । কাগজ থেকে নীচের চিত্রটি একটি কণার ভরয়ের ক্রিয়া হিসাবে অতিরিক্ত ইভেন্টগুলির পি-মানগুলি দেখায়। আপনি দেখুন কীভাবে পি-ভ্যালু 750 জিভের উপরে ডাইভ করে। সুতরাং, তারা বলছেন যে 750 গিগা চতুর্থ সমান ভর দিয়ে একটি নতুন কণা সনাক্ত হওয়ার সম্ভাবনা রয়েছে । চিত্রের পি-মানগুলি "স্থানীয়" হিসাবে গণনা করা হয়। গ্লোবাল পি-মানগুলি অনেক বেশি। যদিও আমাদের কথোপকথনের জন্য এটি গুরুত্বপূর্ণ নয়।

গুরুত্বপূর্ণটি হ'ল পি-মানগুলি পদার্থবিদদের সন্ধানের ঘোষণার জন্য এখনও "যথেষ্ট পরিমাণে কম" নয়, তবে উত্তেজিত হওয়ার জন্য "যথেষ্ট কম" থাকে। সুতরাং, তারা গণনা চালিয়ে যাওয়ার পরিকল্পনা করছেন এবং আশা করছেন যে পি-মানগুলি আরও কমবে।

এখানে চিত্র বর্ণনা লিখুন

আগস্ট 2016, এর কয়েক মাস এগিয়ে জুম শিকাগো একটি সম্মেলন উপর ওয়াকিবহালসিএমএস সহযোগিতায় এবার "প্রোটন-প্রোটন সংঘর্ষের 12.9 fb − 1 ব্যবহার করে উচ্চ ম্যাস ফোটন জোড়গুলির অনুরণনমূলক উত্পাদন অনুসন্ধান এবং এইবার সিএমএস সহযোগিতায় 8 এবং 13 টিভিতে অনুসন্ধানের সম্মিলিত ব্যাখ্যা উপস্থাপন করা হয়েছে একটি নতুন প্রতিবেদন ছিল " । এখানে আমার মন্তব্যের সাথে উদ্ধৃত অংশগুলি আবার:

এখানে চিত্র বর্ণনা লিখুন

সুতরাং, ছেলেরা ইভেন্ট সংগ্রহ করা অব্যাহত রেখেছে, এবং এখন 750 জিভিতে অতিরিক্ত ইভেন্টের ব্লিপ শেষ হয়ে গেছে। কাগজ থেকে নীচের চিত্রটি পি-মানগুলি দেখায় এবং আপনি দেখতে পাচ্ছেন যে প্রথম প্রতিবেদনের তুলনায় পি-মান কীভাবে বৃদ্ধি পেয়েছে। সুতরাং, তারা দুঃখের সাথে সিদ্ধান্ত নিয়েছে যে 750 জিভিতে কোনও কণা সনাক্ত করা যায়নি।

এখানে চিত্র বর্ণনা লিখুন

আমি মনে করি পি-ভ্যালুগুলি এভাবেই ব্যবহার করার কথা। তারা সম্পূর্ণরূপে একটি ধারণা তৈরি করে এবং তারা পরিষ্কারভাবে কাজ করে। আমি মনে করি এর কারণ হ'ল ঘনত্ববাদী পদ্ধতিগুলি পদার্থবিদ্যায় সহজাতভাবে প্রাকৃতিক। কণা বিক্ষিপ্তকরণ সম্পর্কিত বিষয়গত কিছুই নেই। আপনি যথেষ্ট পরিমাণে এএ নমুনা সংগ্রহ করেন এবং এটি উপস্থিত থাকলে আপনি একটি পরিষ্কার সংকেত পাবেন।

আপনি যদি সত্যিই এখানে পি-ভ্যালুগুলি গণনা করা হয় তার মধ্যে থাকেন তবে এই কাগজটি পড়ুন : কোয়ান এট আল দ্বারা "নতুন পদার্থবিজ্ঞানের সম্ভাবনা-ভিত্তিক পরীক্ষার জন্য অ্যাসেম্পটোটিক সূত্র"


2
প্রত্যেকে আশা করছিল যে 750 জিভের শিখরটি বাস্তব এবং এটি এখন দুঃখজনক। তবে আমি আশা করছিলাম যে এটি একটি ওঠানামাতে পরিণত হবে (এবং এটি বাজি ধরতে পারে) এবং এখন স্বস্তি পেয়েছি। আমি মনে করি এটি দুর্দান্ত যে স্ট্যান্ডার্ড মডেলটি এত ভাল কাজ করে। স্ট্যান্ডার্ড মডেল ছাড়িয়ে যাওয়ার জ্বলন্ত ইচ্ছাকে পুরোপুরি বুঝতে পারবেন না (যেন পদার্থবিদ্যার সমস্ত কিছুর সমাধান হয়ে যায়)। যাইহোক, +1, ভাল উদাহরণ।
অ্যামিবা বলছেন মনিকাকে

2

অন্যান্য ব্যাখ্যাগুলি সবই ঠিক আছে, আমি কেবল চেষ্টা করতে চেয়েছিলাম এবং আমার মাথার মধ্যে যে প্রশ্নটি এসে গেছে তার একটি সংক্ষিপ্ত এবং সরাসরি উত্তর দিতে চাই।

এলোমেলোভাবে পরীক্ষায় কোভারিয়েট ভারসাম্য পরীক্ষা করা হচ্ছে

আপনার দ্বিতীয় দাবি (অবাস্তব নাল অনুমানের বিষয়ে) সত্য নয় যখন আমরা র্যান্ডমাইজড পরীক্ষায় কোভারিয়েট ব্যালেন্স পরীক্ষা করে দেখি যেখানে আমরা জানি যে র্যান্ডমাইজেশন সঠিকভাবে করা হয়েছিল। এই ক্ষেত্রে, আমরা জানি যে নাল অনুমানটি সত্য। আমরা যদি কিছু সংখ্যক তুলনার জন্য অবশ্যই নিয়ন্ত্রণের পরে - কিছু কোওরিয়েটে চিকিত্সা এবং নিয়ন্ত্রণ গোষ্ঠীর মধ্যে একটি উল্লেখযোগ্য পার্থক্য পাই তবে অবশ্যই এটি আমাদেরকে জানায় যে আমরা এলোমেলোভাবে একটি "খারাপ ড্র" পেয়েছি এবং কারণ হিসাবে আমাদের সম্ভবত কারণ হিসাবে বিশ্বাস করা উচিত নয় অনেক। এটি কারণ আমাদের মনে হতে পারে যে এই "" খারাপ ড্র "র্যান্ডমাইজেশন থেকে আমাদের চিকিত্সার প্রভাবের অনুমানগুলি" ভাল ড্র "থেকে প্রাপ্ত অনুমানের চেয়ে সত্য চিকিত্সার প্রভাব থেকে আরও দূরে রয়েছে।

আমি মনে করি এটি পি-মানগুলির নিখুঁত ব্যবহার। এটি পি-মানের সংজ্ঞাটি ব্যবহার করে: নাল অনুমান অনুসারে একটি মান বা তার চেয়ে বেশি চরম প্রাপ্তির সম্ভাবনা। ফলাফলটি যদি খুব বেশি সম্ভাবনা না থাকে তবে আমরা আসলে "খারাপ ড্র" পেয়েছিলাম।

কার্যনির্বাহী তথ্যাদি (যেমন, মিল, প্রাকৃতিক পরীক্ষা) করার জন্য পর্যবেক্ষণমূলক ডেটা ব্যবহার করার সময় ভারসাম্য সারণী / পরিসংখ্যানগুলিও সাধারণ। যদিও এই ক্ষেত্রে ব্যালেন্স টেবিলগুলি অনুমানের জন্য একটি "কার্যকারণ" লেবেলকে ন্যায়সঙ্গত করার পক্ষে যথেষ্ট নয়।


আমি একমত নই যে এটি পি-মানগুলির একটি নিখুঁত (বা এমনকি ভাল) ব্যবহার। আপনি কীভাবে একটি "খারাপ ড্র" সংজ্ঞায়িত করেন?
999

2
@মার্ক, ঠিক আছে। আমি মনে করি ম্যাট দূরে থাকাকালীন আমি আপনার শেষ প্রশ্নের জবাব দিতে পারি: অবশ্যই নমুনায়। 50 জন ব্যক্তির সাথে এলোমেলোভাবে পরীক্ষাটি কল্পনা করুন। কল্পনা করুন যে এটি ঠিক এমন ঘটেছে যে গ্রুপ এ এর ​​25 টি লোকই পুরুষ হয়ে উঠেছে এবং বি গ্রুপের 25 টি লোকই মহিলা হয়ে উঠেছে। এটি অত্যন্ত সুস্পষ্ট যে এটি অধ্যয়নের যে কোনও সিদ্ধান্তে গুরুতর সন্দেহ ফেলতে পারে; এটি একটি "খারাপ ড্র" উদাহরণ। ম্যাট এ এবং বি এর মধ্যে লিঙ্গ (কোভেরিয়েট) পার্থক্যের জন্য একটি পরীক্ষা চালানোর পরামর্শ দিয়েছিলেন যে আমি কীভাবে ম্যাট এর উত্তরকে আলাদাভাবে ব্যাখ্যা করতে পারি তা দেখছি না। এখানে যুক্তিযুক্ত কোনও জনসংখ্যা নেই।
অ্যামিবা বলছেন মনিকাকে

1
@ চিহ্ন 999 তবে 12/25 এবং 13/25 এর মধ্যে পার্থক্যের জন্য একটি পরীক্ষা স্পষ্টতই উচ্চ অ-তাত্পর্যপূর্ণ পি-মান অর্জন করবে, সুতরাং আমি এখানে আপনার বক্তব্য কী তা নিশ্চিত নই। ম্যাট একটি পরীক্ষা চালানোর এবং একটি লাল পতাকা হিসাবে একটি কম পি-মান বিবেচনা করার পরামর্শ দিয়েছিল। আপনার উদাহরণে কোনও লাল পতাকা নেই। আমি মনে করি আমি এখানে থামব এবং ম্যাট চাইলে ডায়ালগটি চালিয়ে যেতে দিন।
অ্যামিবা বলেছেন মোনিকা

4
নং 'ব্যালেন্স পরীক্ষার ভ্রান্তি' দেখুন: gking.harvard.edu/files/matchse.pdf আপনি এমন একটি মামলার বর্ণনা দিয়েছেন যেখানে পরীক্ষার পরিসংখ্যান নিজেই ভাল হতে পারে (হ্রাস করতে দূরত্ব পরিমাপ হিসাবে ব্যবহৃত হয়) তবে এর জন্য পি-মান কোনও লাভ করে না অনুভূতি.
কনজুগেটপায়ার

2
মনোবিজ্ঞান এবং স্নায়ুবিজ্ঞানের ক্ষেত্রে এটি আরও সাম্প্রতিক পরীক্ষার জন্য একটি নতুন আরক্সিব প্রিপ্রিন্ট রয়েছে । যখন আপনি ভারসাম্য বজায় রাখার জন্য ইত্যাদি বিবেচনা করছেন, আপনি এলোমেলো নমুনা নন এবং এমনকি আপনি থাকলেও পরীক্ষাগুলি নমুনায় ভারসাম্য না রাখায় জনসংখ্যার ভারসাম্য সম্পর্কে ভিন্ন ভিন্ন অনন্য প্রশ্নটির উত্তর দেয়।
লিভিয়াস

2

ত্রুটি হার নিয়ন্ত্রণ উত্পাদন উত্পাদন মানের নিয়ন্ত্রণের অনুরূপ। একটি প্রোডাক্ট লাইনের একটি রোবটের একটি অংশটি ত্রুটিযুক্ত এমন সিদ্ধান্ত নেওয়ার নিয়ম রয়েছে যা খতিয়ে দেখা যায় না এমন একটি ত্রুটিযুক্ত অংশের নির্দিষ্ট হারকে ছাড়িয়ে যাওয়ার গ্যারান্টি দেয়। একইভাবে, যে এজেন্সি "সৎ" পি-মানের উপর ভিত্তি করে ওষুধ অনুমোদনের সিদ্ধান্ত নেয়, তার নিয়মিত পর্যায়ে পরীক্ষার দীর্ঘমেয়াদী নির্মাণের মাধ্যমে সংজ্ঞা দ্বারা নিয়ন্ত্রিত স্তরে মিথ্যা প্রত্যাখ্যানের হার রাখার উপায় রয়েছে। এখানে, "সৎ" অর্থ অনিয়ন্ত্রিত পক্ষপাতিত্বের অনুপস্থিতি, গোপন নির্বাচন ইত্যাদি means

যাইহোক, রোবট, না এজেন্সিটির কোনও নির্দিষ্ট ড্রাগ বা বিধানসভা কনভেয়ারের মধ্য দিয়ে যায় এমন কোনও অংশে ব্যক্তিগত অংশ নেই। অন্যদিকে বিজ্ঞানের ক্ষেত্রে আমরা পৃথক তদন্তকারীরা আমাদের প্রিয় জার্নালটিতে জমা দেওয়া জালিয়াতির দাবির অনুপাতের চেয়ে আমরা যে নির্দিষ্ট অনুমানটি অধ্যয়ন করি সে সম্পর্কে সবচেয়ে বেশি যত্নশীল। আমরা যে প্রতিবেদন করছি তার বিশ্বাসযোগ্যতা সম্পর্কে পি-মান প্রবণতা বা একটি আত্মবিশ্বাসের ব্যবধান (সিআই) এর সীমানা উভয়ই সরাসরি আমাদের প্রশ্নের উল্লেখ করে না। যখন আমরা সিআই সীমানা তৈরি করি তখন আমাদের বলা উচিত যে দুটি সংখ্যার একমাত্র অর্থ অন্যান্য বিজ্ঞানীরা যদি তাদের গবেষণায় একই রকম সিআই গণনা করেন তবে ৯৫% বা যা কিছু কভারেজ পুরোপুরি বিভিন্ন গবেষণায় বজায় রাখা হবে ।

এই আলোকে, আমি বিড়ম্বনাজনকভাবে দেখেছি যে পি-মানগুলি জার্নালদের দ্বারা "নিষিদ্ধ" করা হচ্ছে, বিবেচনা করে যে প্রতিলিপি সঙ্কটের ঘনত্বে তাদের গবেষণাপত্র জমা দেওয়ার চেয়ে গবেষকরা তাদের গবেষণাপত্র জমা দেওয়ার চেয়ে জার্নাল সম্পাদকদের কাছে বেশি মূল্যবান হন, এটি ব্যবহারিক উপায় হিসাবে দীর্ঘমেয়াদে বে, একটি জার্নাল দ্বারা রিপোর্ট করা স্পুরিয়াস অনুসন্ধানের হার। ফিল্টারিংয়ে পি-মানগুলি ভাল, বা আইজে গুড যেমন লিখেছেন, তারা পরিসংখ্যানের পিছনের প্রান্তটি সুরক্ষার জন্য ভাল তবে ক্লায়েন্টের পিছনের দিকটি এতটা নয়।

পিএস আমি একাধিক পরীক্ষার মাধ্যমে অধ্যয়ন জুড়ে নিঃশর্ত প্রত্যাশা নেওয়া বেনজামিনী এবং হচবার্গের ধারণার এক বিশাল অনুরাগী। গ্লোবাল "নাল" এর অধীনে, "ঘন ঘনবাদী" এফডিআর এখনও নিয়ন্ত্রিত - একটি বা একাধিক প্রত্যাখ্যান সহ অধ্যয়নগুলি একটি নিয়মিত হারে একটি জার্নালে পপ আপ হয়, যদিও, এই ক্ষেত্রে, যে সমস্ত গবেষণায় কিছু প্রত্যাখ্যান করা হয়েছে সেখানে অনুপাত রয়েছে এক সমান মিথ্যা প্রত্যাখ্যান।


1

আমি ম্যাট এর সাথে একমত যে নাল অনুমানটি সত্য হলে পি-মানগুলি কার্যকর।

আমি মনে করতে পারি সবচেয়ে সহজ উদাহরণটি এলোমেলো নম্বর জেনারেটরের পরীক্ষা করা। যদি জেনারেটর সঠিকভাবে কাজ করে থাকে তবে আপনি যথাযথ নমুনার আকারের যথাযথ ব্যবহার করতে পারেন এবং অনেকগুলি নমুনার উপরে ফিটের পরীক্ষা করার সময়, পি-মানগুলির একটি অভিন্ন বিতরণ হওয়া উচিত। যদি তারা করেন তবে এটি সঠিক বাস্তবায়নের জন্য ভাল প্রমাণ। যদি তা না করে তবে আপনি জানেন যে আপনি কোথাও একটি ত্রুটি করেছেন।

অন্যান্য অনুরূপ পরিস্থিতি ঘটে যখন আপনি জানেন যে কোনও পরিসংখ্যান বা র্যান্ডম ভেরিয়েবলের একটি নির্দিষ্ট বিতরণ হওয়া উচিত (আবার, সর্বাধিক সুস্পষ্ট প্রসঙ্গটি সিমুলেশন)। পি-মানগুলি অভিন্ন হলে, আপনি বৈধ বাস্তবায়নের জন্য সমর্থন পেয়েছেন। যদি তা না হয় তবে আপনি জানেন যে আপনার কোডটিতে কোথাও কোনও সমস্যা আছে।


1

পরীক্ষামূলক উচ্চ শক্তি পদার্থবিজ্ঞানে আমি উদাহরণস্বরূপ ভাবতে পারি যে পি-মানগুলি কার্যকর। চিত্র দেখুন 1 এই প্লটটি এই কাগজটি থেকে নেওয়া হয়েছে: এলএইচসিতে এটিএলএলএস সনাক্তকারীর সাথে স্ট্যান্ডার্ড মডেল হিগস বোসনের সন্ধানে একটি নতুন কণা পর্যবেক্ষণ

5σH125

এখানে চিত্র বর্ণনা লিখুন


1
পটভূমি এবং এটি কীভাবে আসল প্রশ্নকে সম্বোধন করে তা আপনাকে প্লট সম্পর্কে আরও তথ্য সরবরাহ করতে হবে। এটি প্রায় পর্যাপ্ত তথ্য নয়।
গ্রিনপার্কার

@ গ্রিনপার্কার, প্লটের কিছু পটভূমি যুক্ত করার চেষ্টা করেছিলেন।
নিকোলাস গুতেরেস

±1σ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.