আমরা যাকে পি-হ্যাকিং বলি তা একাধিকবার একটি তাত্পর্য পরীক্ষা প্রয়োগ করে কেবল তাত্পর্যপূর্ণ ফলাফলের প্রতিবেদন করে। এটি ভাল বা খারাপ তা পরিস্থিতিগতভাবে নির্ভর।
ব্যাখ্যা করতে, আসুন নালাগুলি এবং বিকল্প অনুমানের পরিবর্তে বায়েশিয়ান পদগুলিতে সত্যিকারের প্রভাবগুলি সম্পর্কে ভাবা যাক। যতক্ষণ আমরা বিশ্বাস করি আমাদের আগ্রহের প্রভাবগুলি অবিচ্ছিন্ন বিতরণ থেকে আসে, তারপরে আমরা জানি নাল অনুমানটি মিথ্যা। তবে, দ্বি-পার্শ্বিক পরীক্ষার ক্ষেত্রে এটি ইতিবাচক বা নেতিবাচক কিনা তা আমরা জানি না। এই আলোর অধীনে, আমরা আমাদের প্রমাণের সঠিক দিক (যেমন, ইতিবাচক বা নেতিবাচক প্রভাব) রয়েছে তা প্রমাণের পক্ষে কতটা শক্তিশালী তা পরিমাপ হিসাবে আমরা দুটি তরফা পরীক্ষার জন্য পি-মানগুলির কথা ভাবতে পারি।
p<α
এখন, আপনি আরও ডেটা পেতে পিছনে যেতে থাকলে কী ঘটে তা বিবেচনা করুন। প্রতিবার আপনি আরও ডেটা পাবেন, পর্যাপ্ত ডেটাতে দিকনির্দেশনা সঠিক শর্তযুক্ত পাওয়ার সম্ভাবনা কেবল আপনার উপরে উঠে যায়। সুতরাং এই দৃশ্যের অধীনে, আমাদের আরও ডেটা পাওয়ার মাধ্যমে উপলব্ধি করা উচিত, যদিও আমরা আসলে টাইপ আই ত্রুটির সম্ভাবনা বাড়িয়ে দিচ্ছি, আমরা ভুলভাবে ভুল দিকটি অবলম্বন করার সম্ভাবনাও হ্রাস করছি।
এটিকে পি-হ্যাকিংয়ের আরও সাধারণ ব্যবহারের বিপরীতে নিন; আমরা ১০০ এর প্রভাব আকারকে পরীক্ষা করি যার খুব ছোট হওয়ার সম্ভাবনা রয়েছে এবং কেবলমাত্র তাৎপর্যগুলি প্রতিবেদন করে। মনে রাখবেন যে এই ক্ষেত্রে, যদি সমস্ত প্রভাবগুলি ছোট হয়, তাত্পর্যটি প্রকাশ করার সময় আমাদের কাছে দিকটি ভুল হওয়ার প্রায় 50% সম্ভাবনা থাকে।
অবশ্যই, এই ডেটা-ডাবল-ডাউন থেকে উত্পাদিত পি-মানগুলি এখনও লবণের দানা দিয়ে আসা উচিত। সাধারণভাবে, কোনও ব্যক্তির প্রভাবের আকার সম্পর্কে আরও সুনিশ্চিত হওয়ার জন্য আরও তথ্য সংগ্রহের ক্ষেত্রে আপনার সমস্যা হওয়া উচিত নয়, এটি অন্য উপায়ে অপব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, একজন চৌকস পিআই বুঝতে পারে যে একবারে সমস্ত ১০০ ডেটা পয়েন্ট সংগ্রহ করার পরিবর্তে তারা একগুচ্ছ অর্থ সাশ্রয় করতে পারে এবং প্রথমে ৫০ টি তথ্য পয়েন্ট সংগ্রহ করে, ডেটা বিশ্লেষণ করে এবং তারপরে পরবর্তী ৫০ টি সংগ্রহ করতে পারে যদি তা উল্লেখযোগ্য না হয় । এই দৃশ্যে, তারা তাত্পর্যপূর্ণ তাত্পর্য ঘোষণার উপর প্রভাবের দিকটি ভুল শর্ত সাপেক্ষ হওয়ার সম্ভাবনা বাড়ায়, যেহেতু তারা 100 টি ডাটা পয়েন্টের তুলনায় 50 টি ডাটা পয়েন্টের সাথে প্রভাবের দিকনির্দেশের ভুল পাওয়ার সম্ভাবনা বেশি।
এবং পরিশেষে, যখন আমাদের কোনও তুচ্ছ ফলাফল হয় তখন আরও ডেটা না পাওয়ার ইঙ্গিতগুলি বিবেচনা করুন । এটি ইঙ্গিত দেয় না যে এই বিষয়ে আরও তথ্য সংগ্রহ করা, যা বিজ্ঞানকে সত্যিকার অর্থে এগিয়ে নিয়ে যায় না, তাই না? একটি আন্ডার পাওয়ারযুক্ত অধ্যয়ন পুরো ক্ষেত্রটিকে হত্যা করবে।