নিম্নলিখিত দুটি আইডিয়াতে আমি দুর্দান্ত অপরাধ করি:
বড় নমুনাগুলি সহ, তাত্পর্য পরীক্ষা থেকে ক্ষুদ্র, গুরুত্বহীন প্রস্থানগুলি তাত্পর্য পরীক্ষা করে।
বাস্তব বিশ্বে প্রায় কোনও নাল হাইপোথেসিসই সত্য নয়, সুতরাং তাদের উপর একটি তাত্পর্য পরীক্ষা করা অবাস্তব এবং উদ্ভট।
এটি পি-মান সম্পর্কে এমন স্ট্রোম্যান যুক্তি। পরিসংখ্যানের বিকাশের জন্য উত্সাহিত করে এমন খুব ভিত্তিগত সমস্যাটি আসে কোনও প্রবণতা দেখে এবং আমরা যা দেখি তা সুযোগ দ্বারা হয় কি না বা পদ্ধতিগত প্রবণতার প্রতিনিধি কিনা তা জানতে আগ্রহী।
এই বিষয়টি মাথায় রেখে, এটি সত্য যে আমরা পরিসংখ্যানবিদ হিসাবে সাধারণত বিশ্বাস করি না যে নাল-অনুমানটি সত্য (যেমন , যেখানে দুটি দলের মধ্যে কিছু পরিমাপের মধ্যবর্তী পার্থক্য)। তবে, দুটি তরফা পরীক্ষা দিয়ে, আমরা জানি না কোন বিকল্প অনুমানটি সত্য! একটি দ্বিপক্ষীয় পরীক্ষায় আমরা বলতে চাই যে আমরা 100% নিশ্চিত যে ডেটা দেখার আগে । তবে আমরা জানি না যে বা । সুতরাং আমরা যদি আমাদের পরীক্ষা এবং এই সিদ্ধান্তে যে , আমরা কে প্রত্যাখ্যান করেছি (যেমন ম্যাটলফ বলতে পারে; নিরর্থক উপসংহারে) তবে আরও গুরুত্বপূর্ণ, আমরাও প্রত্যাখ্যান করেছিHo:μd=0μdμd≠0μd>0μd<0μd>0μd=0μd<0 (আমি বলছি; দরকারী উপসংহার)। @ অ্যামিবা যেমন উল্লেখ করেছেন, এটি একতরফা পরীক্ষার ক্ষেত্রেও প্রযোজ্য যা দ্বিপক্ষীয় হওয়ার সম্ভাবনা রয়েছে, যেমন ওষুধের ইতিবাচক প্রভাব রয়েছে কিনা তা পরীক্ষা করা।
এটি সত্য যে এটি আপনাকে প্রভাবের প্রবণতাটি বলে না। তবে এটি আপনাকে প্রভাবের দিকটি বলে দেয়। সুতরাং আসুন ঘোড়া আগে গাড়ীটি না রাখা; আমি প্রভাবটির প্রবণতা সম্পর্কে সিদ্ধান্তগুলি আঁকতে শুরু করার আগে, আমি আত্মবিশ্বাসী হতে চাই যে আমি এফেক্টের দিকটি সঠিক পেয়েছি!
একইভাবে, "পি-মানগুলি ক্ষুদ্র, গুরুত্বহীন প্রভাবগুলির উপর চাপ দেয়" এই যুক্তিটি আমার কাছে যথেষ্ট ত্রুটিযুক্ত বলে মনে হয়। যদি আপনি ডেটা আপনার উপসংহারের দিকটিকে কতটা সমর্থন করে তার পরিমাপ হিসাবে একটি পি-ভ্যালু মনে করেন , তবে অবশ্যই নমুনার আকার যথেষ্ট পরিমাণে বড় হলে আপনি এটি ছোট প্রভাবগুলি তুলতে চান। এর অর্থ তারা কার্যকর না বলে আমার কাছে খুব বিস্ময়কর: এই গবেষণার ক্ষেত্রগুলি কি পি-ভ্যালুতে ভুগেছে যেগুলি এত বেশি ডেটা রয়েছে তাদের অনুমানের নির্ভরযোগ্যতা মূল্যায়ন করার প্রয়োজন নেই? একইভাবে, যদি আপনার সমস্যাগুলি সত্যিই পি-মানগুলি "ক্ষুদ্র প্রভাবের আকারের উপর চাপ দেয়" হয় তবে আপনি সহজেই হাইপোথেসিগুলি এবংএইচ 2 : μ ডি < - 1H1:μd>1H2:μd<−1(ধরে নিলে আপনি 1 কে ন্যূনতম গুরুত্বপূর্ণ প্রভাবের আকার বলে মনে করছেন)। এটি প্রায়শই ক্লিনিকাল ট্রায়ালগুলিতে করা হয়।
এটি আরও চিত্রিত করার জন্য, ধরুন আমরা কেবল আত্মবিশ্বাসের অন্তর এবং ত্যাগ করা পি-মানগুলিতে নজর রেখেছি। আত্মবিশ্বাসের ব্যবধানে আপনি প্রথম যা যা যাচাই করবেন? ফলাফলগুলি খুব গুরুত্ব সহকারে নেওয়ার আগে প্রভাবটি কঠোরভাবে ইতিবাচক (বা নেতিবাচক) ছিল কিনা। যেমন, পি-মান ব্যতীত, আমরা অনানুষ্ঠানিকভাবে অনুমানের পরীক্ষাও করবো।
পরিশেষে, ওপি / ম্যাটলফের অনুরোধের প্রসঙ্গে, "পি-ভ্যালুগুলি উল্লেখযোগ্যভাবে উন্নত হওয়ার একটি দৃinc়প্রত্যয়ী যুক্তি দিন", আমি মনে করি প্রশ্নটি কিছুটা বিশ্রী। আমি এটি বলছি কারণ আপনার দৃষ্টিভঙ্গির উপর নির্ভর করে এটি স্বয়ংক্রিয়ভাবে নিজের জবাব দেয় ("আমাকে একটি দৃ concrete় উদাহরণ দিন যেখানে একটি হাইপোথিসিস পরীক্ষা না করে সেগুলি পরীক্ষা না করা ভাল")। তবে, একটি বিশেষ ক্ষেত্রে যা আমি প্রায় অনস্বীকার্য বলে মনে করি তা হ'ল আরএনএএসেকের ডেটা। এই ক্ষেত্রে, আমরা সাধারণত দুটি ভিন্ন গ্রুপে (যেমন রোগাক্রান্ত, নিয়ন্ত্রণ) আরএনএর প্রকাশের স্তরের দিকে তাকাচ্ছি এবং দুটি গ্রুপে পৃথকভাবে প্রকাশিত জিনগুলি অনুসন্ধান করার চেষ্টা করছি। এই ক্ষেত্রে, প্রভাব আকার নিজেই এমনকি সত্যই অর্থবহ নয়। এটি কারণ বিভিন্ন জিনের এক্সপ্রেশন স্তরগুলি এত বন্যভাবে পরিবর্তিত হয় যে কিছু জিনের জন্য 2x উচ্চতর এক্সপ্রেশন থাকা কোনও অর্থই বোঝায় না, অন্যান্য কঠোরভাবে নিয়ন্ত্রিত জিনগুলির ক্ষেত্রে, 1.2x উচ্চতর এক্সপ্রেশন মারাত্মক। সুতরাং গ্রুপের সাথে প্রথম তুলনা করার সময় এফেক্ট আকারের প্রকৃত পরিমাণটি আসলে কিছুটা উদ্বেগজনক। কিন্তু তুমিপ্রকৃতপক্ষে, জেনের প্রকাশটি গ্রুপ এবং পরিবর্তনের দিকের মধ্যে পরিবর্তিত হয় কিনা তা জানতে চাই! তদুপরি, একাধিক তুলনা সম্পর্কিত সমস্যাগুলি (যেগুলির জন্য আপনি তাদের মধ্যে এক হাজারে 20,000 করতেই পারেন) পি-মানগুলির তুলনায় আস্থার ব্যবধানের সাথে সমাধান করা আরও বেশি কঠিন difficult