পি-মানগুলির বিতরণের উচ্চ বৈকল্পিকতা (তালেব ২০১ 2016-তে একটি যুক্তি)


17

আমি তালেব, ২০১,, স্ট্যান্ডার্ড পি-ভ্যালুগুলির মেটা-বিতরণে তৈরি বড় চিত্র দাবিটি বোঝার চেষ্টা করছি ।

এতে, তালেব পি-মানটির অবিশ্বাস্যতার জন্য নিম্নলিখিত যুক্তিটি তৈরি করেছেন (যেমনটি আমি এটি বুঝতে পারি):

কিছু বিতরণ আউটপুট এপি মান থেকে ডাটা পয়েন্টগুলিতে অপারেশন করে এমন একটি অনুমান পদ্ধতি procedure যদি আমরা এই বিতরণ থেকে আরও পয়েন্ট আঁকতে এবং অন্য একটি পি মান আউটপুট করে, আমরা তথাকথিত "সত্যিকারের পি-মান" সীমাতে প্রাপ্ত এই পি-মানগুলিকে গড় করতে পারি।nX

এই "সত্য পি-মান "টিকে একটি বিঘ্নজনকভাবে উচ্চ বৈকল্পিক হিসাবে দেখানো হয়েছে, যাতে" সত্যিকারের পি মান " সহ একটি বিতরণ + পদ্ধতিটি সময়ের 60% সময় <.05 এর একটি পি-মানের প্রতিবেদন করে।.12

প্রশ্ন : ভ্যালুয়ের পক্ষে এটি কীভাবে প্রচলিত যুক্তির সাথে মিলিত হতে পারে । যেহেতু আমি এটি বুঝতে পেরেছি, পি-মানটি আপনাকে বলেছে যে আপনার পদ্ধতি আপনাকে সঠিক সময়সীমা (বা যা কিছু) দেবে তার কত শতাংশ সময়। যাইহোক, এই কাগজটি মনে হচ্ছে যে এই ব্যাখ্যাটি বিভ্রান্তিমূলক, যেহেতু আপনি যদি আবার পদ্ধতিটি চালনা করেন তবে পি-মানটি একই হবে না।p

আমি কি বিন্দু মিস করছি?


1
এই "traditionalতিহ্যবাহী তর্ক" বলতে কি বোঝাতে পারেন? আমি নিশ্চিত নই যে আপনি কী যুক্তি বিবেচনা করছেন তা আমি পরিষ্কার।
গ্লেন_বি -রিনস্টেট মনিকা

প্রশ্নটি আকর্ষণীয় এবং এমন একটি সাহিত্যের সাথে সম্পর্কিত যার জন্য সিভিতে একটি ট্যাগও রয়েছে, সংশ্লেষিত-পি-মানগুলি সংযোজন করা উচিত যা আপনি এটি উপযুক্ত মনে করলে যুক্ত করতে পছন্দ করতে পারেন।
mdewey

1
আমি বিশ্বাস করি পি-মানগুলির পুনরুত্পাদনযোগ্যতা সম্পর্কে প্রশ্নটি এর সাথে খুব ঘনিষ্ঠভাবে সম্পর্কিত হতে পারে। সম্ভবত এখানে বিশ্লেষণগুলি এখানে উল্লিখিত মতটির (বা এমনকি একই) মিল রয়েছে।
হোবার

উত্তর:


13

একটি পি-মান একটি এলোমেলো পরিবর্তনীয়।

অধীনে (কমপক্ষে ক্রমাগত-বিতরণিত পরিসংখ্যানের জন্য), পি-মানটির একটি অভিন্ন বিতরণ হওয়া উচিতH0

ধারাবাহিক পরীক্ষার জন্য, এর অধীনে পি-মানটি সীমাতে 0 হওয়া উচিত কারণ নমুনা আকারগুলি অনন্তের দিকে বাড়ায়। একইভাবে, প্রভাব আকারগুলি পি-ভ্যালুগুলির বিতরণ বৃদ্ধির সাথে সাথে 0 এর দিকেও বদলে যায় তবে এটি সর্বদা "ছড়িয়ে পড়ে"।H1

"সত্য" পি-মানটির ধারণাটি আমার কাছে বোকামির মতো। এর অর্থ কী হবে, বা এইচ 1 এর অধীনে ? আপনি উদাহরণস্বরূপ বলতে পারেন যে আপনি " কিছু নির্দিষ্ট প্রভাবের আকার এবং নমুনা আকারে পি-মানগুলির বিতরণের গড়" বলতে চাইছেন , তবে কীভাবে আপনি সংশ্লেষণ করবেন যেখানে স্প্রেডটি সঙ্কুচিত হবে? আপনি ধ্রুবক ধরে রাখার সময় আপনি নমুনার আকার বাড়িয়ে দিতে পারেন এমনটি নয়।H0H1

এখানে একটি নমুনা টি-পরীক্ষা এবং নীচে একটি ছোট প্রভাবের আকারের একটি উদাহরণ । নমুনার আকার ছোট হলে পি-মানগুলি প্রায় অভিন্ন হয় এবং নমুনার আকার বৃদ্ধির সাথে সাথে বিতরণটি ধীরে ধীরে 0 এর দিকে মনোনিবেশ করে।H1

এখানে চিত্র বর্ণনা লিখুন

ঠিক এইভাবে পি-মানগুলি আচরণ করার কথা বলে - একটি মিথ্যা শূন্যতার জন্য, নমুনার আকার বাড়ার সাথে সাথে পি-মানগুলি কম মানগুলিতে আরও বেশি কেন্দ্রীভূত হওয়া উচিত, তবে যখন মূল্যবোধগুলি গ্রহণ করা হয় তখন তা বন্টন করার পরামর্শ দেওয়ার মতো কিছুই নেই একটি টাইপ II ত্রুটি করুন - যখন পি-মানটি আপনার তাত্পর্য স্তরটির চেয়ে উপরে থাকে - তবে কোনওভাবে সেই তাত্পর্য স্তরটির "কাছাকাছি" থাকা উচিত।

α=0.05

বিকল্পের অধীনে আপনি যে পরীক্ষা সংক্রান্ত পরিসংখ্যান ব্যবহার করেন তা বিতরণে কী ঘটছে এবং বিতরণে যে রূপান্তর রূপে নলের নীচে সিডিএফ প্রয়োগ করবেন তা বিতরণে কী করবে তা বিবেচনা করা প্রায়শই সহায়ক that নির্দিষ্ট বিকল্প)। আপনি যখন এই পদগুলিতে ভাবেন তখন আচরণটি যেমন হয় তেমনি প্রায়শই দেখা শক্ত হয় না।

যে বিষয়টি আমি দেখতে পাচ্ছি তা এতটা নয় যে পি-ভ্যালু বা অনুমানের পরীক্ষা করার কোনও অন্তর্নিহিত সমস্যা নেই, অনুমান করা যায় যে অনুমানের পরীক্ষাটি আপনার নির্দিষ্ট সমস্যার জন্য একটি ভাল হাতিয়ার বা অন্য কিছু আরও উপযুক্ত হবে কিনা of যে কোনও বিশেষ ক্ষেত্রে - এটি ব্রড-ব্রাশের পোলিমিকদের পক্ষে পরিস্থিতি নয় তবে অনুমানের পরীক্ষার যে প্রশ্নগুলির ঠিকানা এবং আপনার পরিস্থিতিগুলির বিশেষ প্রয়োজনগুলি পরীক্ষা করে সে ধরণের প্রশ্নগুলির বিষয়ে সতর্কতার সাথে বিবেচনা করা। দুর্ভাগ্যক্রমে এই বিষয়গুলির যত্ন সহকারে বিবেচনা করা খুব কমই করা হয় - সবসময়ই কেউ ফর্মের একটি প্রশ্ন দেখে "আমি এই ডেটাগুলির জন্য কী পরীক্ষা ব্যবহার করব?" আগ্রহের প্রশ্নটি কী হতে পারে তার কোনও বিবেচনা ছাড়াই, কিছু অনুমানের পরীক্ষাটি এটির সমাধান করার ভাল উপায় কিনা তা ছেড়ে দেওয়া যাক।

একটি অসুবিধা হ'ল হাইপোথিসিস টেস্টগুলি উভয়ই বিভ্রান্তিকর এবং ব্যাপকভাবে অপব্যবহার করা হয়; লোকেরা প্রায়শই মনে করে যে তারা আমাদের এমন জিনিস বলে যা তারা দেয় না। পি-মান সম্ভবত অনুমান পরীক্ষা সম্পর্কে একক সবচেয়ে ভুল বোঝাবুঝি জিনিস।


pnm

nnn

1
H1H1

3
n

3
+1 টি। এর সাথে সম্পর্কিত - এবং মজাদার - বিশ্লেষণ যা আমার মনে আসে তা হ'ল জিফ কামিং "পি-ভ্যালুগুলির একটি নাচ" বলেছেন: youtube.com/watch?v=5OL1RqHrZQ8 দেখুন ("নৃত্য" প্রায় 9 মিনিটের চিহ্নে ঘটে) । এই পুরো সামান্য উপস্থাপনাটি মূলত জোর দেয় যে তুলনামূলকভাবে উচ্চ শক্তির জন্য পি-মানগুলি কতটা পরিবর্তনশীল। আমি কামিংয়ের মূল বক্তব্যটির সাথে একমত নই যে আত্মবিশ্বাসের ব্যবধানগুলি পি-ভ্যালুগুলির তুলনায় অনেক ভাল (এবং আমি এটি ঘৃণা করি যে তিনি "নতুন পরিসংখ্যান" বলেছেন) তবে আমি মনে করি যে এই পরিমাণের পরিবর্তনশীলতা অনেক লোকের জন্য আশ্চর্যজনক এবং "নাচ" এটি প্রদর্শনের একটি দুর্দান্ত উপায়।
অ্যামিবা বলছেন মনিকাকে

11

গ্লেন_ বি এর উত্তর স্পট (+1; খনি পরিপূরক বিবেচনা করুন)। তালেব দ্বারা আপনি যে কাগজটি উল্লেখ করেছেন সেটি হ'ল পি-ভ্যালুগুলির বিতরণ বিশ্লেষণ থেকে কী ধরণের তথ্য সংগ্রহ করতে পারে সে সম্পর্কে মনোবিজ্ঞান এবং পরিসংখ্যান সাহিত্যের একাধিক কাগজের সাথে খুব মিল (লেখকরা পি-কার্ভকে কী বলে ; তাদের সাইটের সাথে একটি দেখুন এখানে পি-কার্ভ বিশ্লেষণ অ্যাপ্লিকেশন সহ গুচ্ছ সংস্থানগুলি )।

লেখক পি-কার্ভের দুটি প্রাথমিক ব্যবহারের প্রস্তাব দিয়েছেন:

  1. আপনি সাহিত্যের পি-বক্র বিশ্লেষণ করে কোনও সাহিত্যের স্পষ্টতামূলক মূল্যকে মূল্যায়ন করতে পারেন । এটি ছিল তাদের প্রথম প্রকাশিত পি-কার্ভের ব্যবহার। মূলত, যেমন গ্লেন_বি বর্ণনা করেছেন, আপনি যখন নন-শূন্য প্রভাবের মাপের সাথে কাজ করছেন, তখন আপনাকে পি-কার্ভগুলি দেখতে হবে যা পি <.05 এর প্রচলিত প্রান্তিকের নীচে ইতিবাচকভাবে আঁকা রয়েছে, কারণ পি-মানগুলি পি-এর চেয়ে বেশি হওয়া উচিত মান পি= .05 যখন কোনও প্রভাব (বা প্রভাবগুলির গ্রুপ) "বাস্তব" হয়। অতএব আপনি বোধগম্য মান হিসাবে একটি পরীক্ষা হিসাবে উল্লেখযোগ্য ধনাত্মক স্কিউ জন্য একটি পি-বক্র পরীক্ষা করতে পারেন। বিপরীতভাবে, বিকাশকারীরা প্রস্তাব দেয় যে আপনি যদি একটি নির্দিষ্ট সেট প্রভাবগুলি বিভিন্ন প্রশ্নবিদ্ধ বিশ্লেষণমূলক অনুশীলনের অধীন হয়ে থাকে তবে পরীক্ষার উপায় হিসাবে আপনি নেতিবাচক স্কিউ (অর্থাত্ আরও বর্ডারলাইন তাৎপর্যপূর্ণ পি-মূল্যবান ছোট ছোট) পরীক্ষা করতে পারেন।
  2. আপনি প্রকাশিত পি-মানগুলি সহ পি-কার্ভ ব্যবহার করে প্রভাবের আকারের একটি প্রকাশনার পক্ষপাত মুক্ত মেটা-অ্যানালিটিক হিসাব গণনা করতে পারেন । এইটি সংক্ষিপ্তভাবে ব্যাখ্যা করার জন্য কিছুটা কৌশলযুক্ত এবং এর পরিবর্তে, আমি আপনাকে তাদের প্রভাব-আকার-অনুমানের দৃষ্টি নিবদ্ধ করা কাগজপত্রগুলি (সিমোনসোহান, নেলসন, এবং সিমন্স, ২০১৪ এ, ২০১৪ বি) পরীক্ষা করে দেখুন এবং নিজে নিজে পদ্ধতিগুলি পড়তে পরামর্শ দিন। তবে মূলত, লেখকরা পরামর্শ দেন যে মেটা-বিশ্লেষণ পরিচালনা করার সময়, পি-কার্ভটি ফাইল-ড্রয়ারের প্রভাবের সমস্যাটি স্কার্ট করতে ব্যবহার করা যেতে পারে।

সুতরাং, আপনার বিস্তৃত প্রশ্ন হিসাবে:

এটি কীভাবে পি-ভ্যালুর পক্ষে চিরায়ত যুক্তির সাথে মিলিত হতে পারে?

আমি বলব যে তালেবের (এবং অন্যান্য) মতো পদ্ধতিগুলি পি-মানগুলি পুনর্নির্মাণের একটি উপায় খুঁজে পেয়েছে, যাতে আমরা পি-ভ্যালুগুলির গ্রুপগুলি বিশ্লেষণ করে সমগ্র সাহিত্যের সম্পর্কে দরকারী তথ্য পেতে পারি , যেখানে একটি পি-ভ্যালু নিজেই হতে পারে আরও অনেক কিছু তার উপযোগিতা সীমিত।

তথ্যসূত্র

সিমোনসোহন, মার্কিন যুক্তরাষ্ট্র, নেলসন, এলডি, এবং সিমন্স, জেপি (2014 এ)। পি-কার্ভ: ফাইল ড্রয়ারের একটি কী। পরীক্ষামূলক মনোবিজ্ঞানের জার্নাল: সাধারণ , 143 , 534-5547।

সিমোনসোহন, মার্কিন যুক্তরাষ্ট্র, নেলসন, এলডি, এবং সিমন্স, জেপি (2014 বি)। পি-কার্ভ এবং এফেক্টের আকার: কেবলমাত্র উল্লেখযোগ্য ফলাফল ব্যবহার করে প্রকাশনা বায়াসের জন্য সংশোধন করা। মনোবিজ্ঞান বিজ্ঞানের উপর দৃষ্টিভঙ্গি , 9 , 666-681।

সিমোনসোহন, মার্কিন যুক্তরাষ্ট্র, সিমন্স, জেপি, এবং নেলসন, এলডি (2015)। আরও ভাল পি-কার্ভস: পি-কার্ভ বিশ্লেষণ ত্রুটি, জালিয়াতি এবং উচ্চাভিলাষী পি-হ্যাকিংয়ের প্রতি আরও শক্তিশালী করা, উলিখ এবং মিলারকে জবাব (২০১৫)। পরীক্ষামূলক মনোবিজ্ঞানের জার্নাল: সাধারণ , 144 , 1146-1152।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.