পি-ভ্যালুটি কি মূলত অকেজো এবং ব্যবহারে বিপজ্জনক?


36

এনওয়াই টাইমসের " দ্য অডস, ক্রমাগত আপডেট" নিবন্ধটি আমার দৃষ্টি আকর্ষণ করার জন্য ঘটেছে। সংক্ষেপে বলা যায় যে এটি

[বায়েশিয়ান পরিসংখ্যান] জটিল সমস্যাগুলির কাছে বিশেষত কার্যকর হিসাবে প্রমাণিত হচ্ছে, ২০১৩ সালে নিখোঁজ জেলে, জন অলড্রিজ (যদিও এখনও পর্যন্ত, মালয়েশিয়া এয়ারলাইন্সের ফ্লাইট ৩ 37০ এর সন্ধানে) খুঁজে পেতে কোস্ট গার্ডের মতো সন্ধান করা হয়েছিল ... ......, বায়সিয়ান পরিসংখ্যান পদার্থবিজ্ঞান থেকে ক্যান্সার গবেষণা, বাস্তুশাস্ত্র থেকে মনোবিজ্ঞান সব কিছুর মধ্যে ছড়িয়ে পড়েছে ...

নিবন্ধে, ঘন ঘনবাদীর পি-মান সম্পর্কে কিছু সমালোচনাও রয়েছে, উদাহরণস্বরূপ:

পি-মান 5 শতাংশের কম হলে ফলাফলগুলি সাধারণত "পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" হিসাবে বিবেচিত হয়। তবে এই traditionতিহ্যের মধ্যে একটি বিপদ রয়েছে বলে জানিয়েছেন কলম্বিয়ার পরিসংখ্যান অধ্যাপক অ্যান্ড্রু গ্যালম্যান। এমনকি বিজ্ঞানীরা সবসময় গণনাগুলি সঠিকভাবে করে থাকলেও - এবং তারা না বলে - 5 শতাংশের পি-ভ্যালু দিয়ে সমস্ত কিছু গ্রহণ করা মানে 20 এর মধ্যে একটি "পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ" ফলাফলগুলি এলোমেলো গোলমাল ছাড়া কিছুই নয়।

উপরের পাশাপাশি সম্ভবত পি-মানটির সমালোচনা করার জন্য সর্বাধিক বিখ্যাত কাগজটি হ'ল - "বৈজ্ঞানিক পদ্ধতি: প্রকৃতি থেকে রেজিনা নুজো দ্বারা রচিত" পরিসংখ্যানগত ত্রুটি " , যেখানে পি-মান পদ্ধতির দ্বারা উত্থাপিত প্রচুর বৈজ্ঞানিক বিষয় নিয়ে আলোচনা করা হয়েছে, যেমন প্রজনন উদ্বেগ, পি-মান হ্যাকিং, ইত্যাদি

পি মানগুলি, পরিসংখ্যানগত বৈধতার 'স্বর্ণের মান', অনেক বিজ্ঞানী মনে করেন তত নির্ভরযোগ্য নয়। ...... সম্ভবত সবচেয়ে খারাপ অবলম্বন হ'ল আত্ম-প্রতারণার প্রবণতা যার জন্য পেনসিলভেনিয়া বিশ্ববিদ্যালয়ের মনোবিজ্ঞানী উরি সিমোনসোহান এবং তাঁর সহযোগীরা পি-হ্যাকিং শব্দটি জনপ্রিয় করেছেন; এটি ডেটা ড্রেজিং, স্নুপিং, ফিশিং, তাত্পর্য-তাড়া এবং ডাবল-ডাইপিং নামেও পরিচিত। সিমোনসোহন বলেছেন, “পি-হ্যাকিং, আপনার পছন্দসই ফলাফল না পাওয়া পর্যন্ত একাধিক জিনিস চেষ্টা করছে” - এমনকি অজ্ঞান হয়েও। ...... "এই সন্ধানটি পি-হ্যাকিংয়ের মাধ্যমে পাওয়া গেছে বলে মনে হয়, লেখকরা একটি শর্ত এড়িয়ে গেছেন যাতে সামগ্রিক পি-মানটি .05 এর চেয়ে কম হয়ে যায়", এবং "তিনি পি-হ্যাকার, তথ্য সংগ্রহের সময় তিনি সবসময় নজর রাখেন। "

আরেকটি বিষয় হ'ল একটি আকর্ষণীয় প্লট এখানে থেকে প্লট সম্পর্কে মন্তব্য সহ নিম্নরূপ :

আপনার প্রভাব যত ছোট হোক না কেন, আপনি <<.05 এর প্রান্তিকতাটি পাস করার জন্য ডেটা সংগ্রহের কঠোর পরিশ্রমটি সর্বদা করতে পারেন। আপনি যে প্রভাবটি অধ্যয়ন করছেন ততক্ষণ প-মানগুলি পরিমাপ করে আপনি ডেটা সংগ্রহের ক্ষেত্রে কতটা প্রচেষ্টা করেছেন।

এখানে চিত্র বর্ণনা লিখুন

সর্বোপরি আমার প্রশ্নগুলি হ'ল:

  1. দ্বিতীয় ব্লকের উদ্ধৃতিতে অ্যান্ড্রু গেলম্যানের যুক্তিটি সঠিকভাবে কী বোঝায়? কেন তিনি 5-শতাংশ পি-মানটিকে "20 টির মধ্যে একটি হিসাবে পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফলাফল লক্ষণীয় তবে এলোমেলো গোলমাল" বলে ব্যাখ্যা করেছিলেন? আমি নিশ্চিত নই যেহেতু আমার কাছে পি-মানটি একটি একক গবেষণায় অনুমান করতে ব্যবহৃত হয়। তার বক্তব্য একাধিক পরীক্ষার সাথে সম্পর্কিত বলে মনে হচ্ছে।

    আপডেট: এন্ড্রু গেলম্যানের ব্লগটি চেক করুন: না, আমি এটি বলিনি! (ক্রেডিটস @ স্পোর্টচি, @ হুবহু)।

  2. পি-ভ্যালু সম্পর্কে সমালোচনা দেওয়া, এবং এআইসি, বিআইসিসি, যেমন মডেলটির তাত্পর্য মূল্যায়নের জন্য (তাই ভেরিয়েবল), আমাদের কি ভেরিয়েবল নির্বাচনের জন্য পি-মান ব্যবহার করা উচিত নয় , এমন অনেক তথ্যের মানদণ্ড রয়েছে কিন্তু সেই মডেল নির্বাচনের মানদণ্ড ব্যবহার করবেন?সিপি

  3. পরিসংখ্যান বিশ্লেষণের জন্য পি-মান ব্যবহারের কোনও ভাল ব্যবহারিক নির্দেশিকা রয়েছে যা আরও নির্ভরযোগ্য গবেষণার ফলাফলের দিকে নিয়ে যেতে পারে?
  4. কিছু পরিসংখ্যানবিদ হিসাবে অ্যাডভোকেট হিসাবে বায়েশিয়ান মডেলিং কাঠামো আরও ভাল উপায় অনুসরণ করা হবে? বিশেষত, বায়েশিয়ান পদ্ধতির মাধ্যমে ডেটা সম্পর্কিত সমস্যাগুলি বা মিথ্যা সন্ধানের সমাধানের সম্ভাবনা বেশি থাকে? বায়েশিয়ান পদ্ধতির পূর্বের বিষয়টি খুব বিষয়গত বিধায় আমি এখানেও বিশ্বাসী নই। এমন কোনও ব্যবহারিক এবং সুপরিচিত গবেষণা রয়েছে যা বাইয়েশিয়ান পদ্ধতির ঘনত্বের পি-ভ্যালু থেকে ভাল বা কমপক্ষে কিছু নির্দিষ্ট ক্ষেত্রে দেখায়?

    আপডেট: আমি বিশেষভাবে আগ্রহী যে বায়েশিয়ান পদ্ধতির ঘনত্বের পি-মান পদ্ধতির চেয়ে নির্ভরযোগ্য reliable "নির্ভরযোগ্য" দ্বারা, আমার অর্থ বায়েশিয়ান পদ্ধতির পছন্দসই ফলাফলগুলির জন্য ডেটা কারসাজির সম্ভাবনা কম। কোন পরামর্শ?


আপডেট 6/9/2015

সবেমাত্র সংবাদটি লক্ষ্য করেছেন, এবং ভেবেছিলেন এটি এখানে আলোচনার জন্য রেখে দেওয়া ভাল।

মনোবিজ্ঞান জার্নাল পি মান নিষিদ্ধ

একটি বিতর্কিত পরিসংখ্যান পরীক্ষা শেষ পর্যন্ত শেষ হয়েছে, কমপক্ষে একটি জার্নালে। এই মাসের শুরুতে, বেসিক এবং ফলিত সামাজিক মনোবিজ্ঞানের (বিএএসপি) সম্পাদকরা ঘোষণা করেছিলেন যে জার্নালটি আর পি মান সহ কাগজপত্র প্রকাশ করবে না কারণ পরিসংখ্যানগুলি প্রায়শই নিম্নমানের গবেষণাকে সমর্থন করার জন্য ব্যবহৃত হত।

সাম্প্রতিক একটি কাগজের পাশাপাশি, পিচ মান সম্পর্কে প্রকৃতি থেকে "চঞ্চল পি মান অপরিবর্তনীয় ফলাফল উত্পন্ন করে"

5/8/2016 আপডেট করুন

মার্চ মাসে আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশন (এএসএ) পরিসংখ্যানগত তাত্পর্য এবং পি-মূল্যবোধের বিষয়ে বিবৃতি প্রকাশ করে, ".... এএসএ বিবৃতিটি 'পি <0.05 পরবর্তী যুগ' নিয়ে গবেষণা চালানোর উদ্দেশ্যে করা হয়েছে।"

এই বিবৃতিতে 6 টি মূলনীতি রয়েছে যা পি-মানটির অপব্যবহারের বিষয়ে আলোচনা করে:

  1. পি-মানগুলি নির্দিষ্ট পরিসংখ্যানের মডেলটির সাথে ডেটাটি কতটা বেমানান তা নির্দেশ করতে পারে।
  2. পি-মানগুলি অধ্যয়ন করা অনুমানের সত্যতা বা ডেটা একা এলোমেলো সুযোগ দ্বারা উত্পাদিত হওয়ার সম্ভাবনাটি পরিমাপ করে না।
  3. বৈজ্ঞানিক সিদ্ধান্ত এবং ব্যবসা বা নীতি সংক্রান্ত সিদ্ধান্তগুলি কেবলমাত্র পি-মান একটি নির্দিষ্ট প্রান্তিক স্থানে যায় কিনা তার ভিত্তিতে হওয়া উচিত নয়।
  4. যথাযথ অনুমানের জন্য সম্পূর্ণ প্রতিবেদন এবং স্বচ্ছতা প্রয়োজন।
  5. একটি পি-মান, বা পরিসংখ্যানগত তাত্পর্য কোনও প্রভাবের আকার বা ফলাফলের গুরুত্ব পরিমাপ করে না।
  6. নিজেই, একটি পি-মান কোনও মডেল বা হাইপোথিসিস সম্পর্কিত প্রমাণের একটি ভাল পরিমাপ সরবরাহ করে না।

বিশদ: "পি-মানগুলির বিষয়ে এএসএ'র বক্তব্য: প্রসঙ্গ, প্রক্রিয়া এবং উদ্দেশ্য"


11
0.050.05


4
ভাল সন্ধান করুন, @ স্কোর্টচি! রেকর্ডের জন্য - লিঙ্কটি খারাপ হওয়ার ক্ষেত্রে - জেলম্যান দৃ emp়তার সাথে এনওয়াই টাইমস বৈশিষ্ট্যটি প্রত্যাখ্যান করেছেন (যদিও খুব কৌশলে) এবং লিখেছেন "5 শতাংশের পি-ভ্যালু দিয়ে সমস্ত কিছু গ্রহণ করা উদ্দীপক অনুসন্ধানে নেতৃত্ব দিতে পারে - এমন ঘটনা যেখানে দেখা যায়" পরিসংখ্যানগতভাবে উল্লেখযোগ্য "ডেটাতে প্যাটার্ন জনসংখ্যার সাথে সম্পর্কিত প্যাটার্নকে প্রতিফলিত করে না - সময়ের চেয়ে 5 শতাংশেরও বেশি" "
হুবুহু

3
আপনার মন্তব্যের প্রসঙ্গে "আপনি যতক্ষণ প্রভাব নিয়ে পড়াশোনা করছেন ততক্ষণ অস্তিত্ব নেই", এটিই পি মানগুলির সাথে জড়িত অধ্যয়নের বিষয় you're এটি নির্ধারণ করা যে আপনি যে প্রভাবটি অধ্যয়ন করছেন তা সত্যই উপস্থিত রয়েছে বা যদি বিশেষত আপনার সংগ্রহ করা ডেটা কেবল এলোমেলো সুযোগের কারণে due নমুনার আকার বৃদ্ধির সাথে পি মান হ্রাস করা সম্পূর্ণ গাণিতিকভাবে শব্দ এবং প্রকৃতপক্ষে একমাত্র বিকল্প। আপনি কোনওভাবেই পি-মানটি "হ্যাকিং" করছেন না। একটি স্বজ্ঞাত দৃষ্টিভঙ্গি থেকে, এটি বোঝা যায় যে ডেটা সংগ্রহের জন্য আরও বেশি প্রচেষ্টা করা আপনার এ থেকে প্রাপ্ত সিদ্ধান্তে একটি উচ্চ আত্মবিশ্বাসের মধ্যে অনুবাদ করে।
ডেভিড ওয়েব

1
@ ডেভিডওয়েব একমত যদি প্রভাবটির আকার ছোট হয় তবে তা ঠিক আছে এবং আরও ডেটা সহ প্রভাবটি কত বড় বা ছোট তা বলা সহজ হবে। আপনি যদি আরও ডেটা পেতে পারেন তবে আপনার উচিত।
26:55

উত্তর:


25

এখানে কিছু চিন্তা আছে:

  1. 80%100/118,7584%
  2. পি
  3. পি
  4. আমি গোপনে বায়েশিয়ান পদ্ধতি ব্যবহারের বিরোধী নই, তবে আমি বিশ্বাস করি না যে তারা এই সমস্যাটি সমাধান করবে। উদাহরণস্বরূপ, আপনি যতক্ষণ মান প্রত্যাখ্যান করতে চান বিশ্বাসযোগ্য ব্যবধানটি আর অন্তর্ভুক্ত না করা পর্যন্ত আপনি কেবল ডেটা সংগ্রহ করা চালিয়ে যেতে পারেন। সুতরাং আপনার 'বিশ্বাসযোগ্য ইন্টারভেল-হ্যাকিং' রয়েছে। আমি এটি দেখতে পাচ্ছি, সমস্যাটি হ'ল অনেক অনুশীলনকারীরা তাদের ব্যবহারের পরিসংখ্যান বিশ্লেষণের সাথে স্বতঃস্ফূর্ত আগ্রহী নন, তাই তারা কল্পনাশক্তি এবং যান্ত্রিক উপায়ে তাদের যে কোনও পদ্ধতিটি ব্যবহার করবেন use আমার দৃষ্টিকোণ সম্পর্কে এখানে আরও জানতে আমার উত্তরটি পড়তে সাহায্য করতে পারে: তাত্পর্য পরীক্ষার জন্য অনুমান হিসাবে প্রভাব আকার

10
(+1) একটি বিশ্বাসযোগ্য ব্যবধান হ্যাক করার একটি সহজ উপায় হ'ল ঠিক আগে :-) গ্রহণ করা। অবশ্যই কোনও উপযুক্ত অনুশীলনকারী এটি করবেন না - গেলম্যান সংবেদনশীলতা মূল্যায়ন, অজানা ধারণা হাইপারপ্রাইয়ারস ইত্যাদি ব্যবহারের উপর জোর দিয়েছিলেন then তবে আবার অনুমানের পরীক্ষার কোনও সক্ষম ব্যবহারকারী পি-ভ্যালু হ্যাকিং করবেন না, তাই না? অন্যদিকে, কোনও বায়েসীয় বিশ্লেষণে এটি কী করা হচ্ছে তা আড়াল করা আরও কঠিন হতে পারে - ধরে নেওয়া পূর্বেরটি স্পষ্টভাবে প্রকাশিত হয়েছে - পি-ভ্যালু হ্যাকিংয়ের সাথে জড়িত থাকতে পারে এমন সমস্ত অননুমোদিত বিশ্লেষণের তুলনায় ।
হুবুহু

1
@ হুবুহু, এটি সত্য, তবে আমি মনে করি আমরা কোনও সমস্যা ডাব্লু / পূর্ববর্তীর অনুপযুক্তি বা সাবজেক্টিভিটি বাদ দিতে পারি। সত্যিকারের প্রভাবটি যদি ঠিক 0 না হয় তবে ডাব্লু / পর্যাপ্ত ডেটা বিশ্বাসযোগ্য ব্যবধান অবশেষে 0 টি অন্তর্ভুক্ত করে না, ঠিক যেমন পি <<.05 (সিএফ, শেষ উদ্ধৃতি) হবে, সুতরাং আপনি যতক্ষণ না পাচ্ছেন কেবল তথ্য সংগ্রহ করতে পারবেন ফলাফল আপনি পূর্ব নির্বিশেষে চান।
গুং - মনিকা পুনরায়

4
ভাল দিক. আমি 10,000,000 এর মধ্যে কোনও ব্যর্থতা পর্যবেক্ষণ করার পরে 10,000 পণ্যগুলিতে ব্যর্থতা সম্পর্কে ভবিষ্যদ্বাণী সম্পর্কে সাম্প্রতিক প্রশ্নের স্মরণ করিয়ে দিচ্ছি। উত্তরটি পূর্বের তুলনায় বেশ সংবেদনশীল কারণ ব্যর্থতা এত বিরল। এটি এক প্রকার ব্যতিক্রমী পরিস্থিতি হতে পারে যা "নিয়মকে প্রমাণ করে"; এটি দেখায় যে বাস্তবে পছন্দসই ফলাফল অর্জনের জন্য পর্যাপ্ত তথ্য সংগ্রহ করা অবর্ণনীয় হতে পারে। ঠিক তখনই যখন কিছু ক্লায়েন্টরা পছন্দসই ফলাফল অর্জনের জন্য পরিসংখ্যানবিদকে "তাদের যাদু করতে" অনুরোধ করতে শুরু করেন! সম্ভবত অনেক পাঠক এই চাপটি অনুভব করেছেন আগে ...।
হোবল

1
@ গ্যাং, ব্যবহারিক ক্লিনিক পরীক্ষায়, পরীক্ষার জন্য আরও বেশি বিষয় নিয়োগের জন্য বিভিন্ন পর্যায়ে সর্বদা থামার মানদণ্ড রয়েছে। সেই অর্থে, বেইসিয়ান পদ্ধতির বিশ্বাসযোগ্য ব্যবধানকে এভাবে গবেষণার উপসংহারে হেরফের করার সম্ভাবনা কম মনে হবে?
হারুন জেং

2
অ্যারোনজেং, আমার কাছে মনে হয়েছে যে স্পষ্টভাবে থামানোর মানদণ্ড ফ্রিকোয়েন্সিস্ট এবং বায়েশিয়ান দৃষ্টিভঙ্গিতে সমানভাবে প্রযোজ্য। আমি এখানে কোনও নেট সুবিধা / অসুবিধা দেখতে পাচ্ছি না।
গুং - মনিকা পুনরায়

8

আমার কাছে, পি-হ্যাকিং বিতর্ক সম্পর্কে একটি আকর্ষণীয় বিষয় হ'ল পি <= 0.05 এর পুরো ইতিহাস পরিসংখ্যানিক তাত্পর্য হিসাবে "একবারে একটি নীল চাঁদে" স্ট্যান্ডার্ড হিসাবে, জোসেফ কালডান ফরেনসিক পরিসংখ্যান সম্পর্কিত জাসার একটি নিবন্ধে উল্লেখ করেছেন নব্বইয়ের দশকে ফিরে, যা কিছু হোক না কেন একেবারে কোনও পরিসংখ্যানতত্ত্বের উপর নির্ভর করে। এটি একটি কনভেনশন, সাধারণ তাত্ত্বিক এবং থাম্বের নিয়ম যা আরএ ফিশার দিয়ে শুরু হয়েছিল এবং এর পরে এটি বর্তমান "প্রশ্নাতীত" স্থিতিতে সংশোধিত বা পবিত্র করা হয়েছে। বায়েশিয়ান বা না, এই মেট্রিক স্ট্যান্ডার্ডকে চ্যালেঞ্জ জানাতে বা কমপক্ষে সন্দেহের উপযুক্ত হওয়ার জন্য সময়টি অনেক বেশি সময়সীমার।

এটি বলেছিল যে, জেলম্যানের বক্তব্য সম্পর্কে আমার ব্যাখ্যাটি হ'ল, যেমনটি সুপরিচিত রয়েছে, সমমর্যাদার পর্যালোচনা প্রক্রিয়াটি ইতিবাচক পরিসংখ্যানগত তাত্পর্যকে পুরস্কৃত করে এবং সেই কাগজগুলি প্রকাশ না করে তুচ্ছ ফলাফলের শাস্তি দেয়। এটি কোনও তুচ্ছ তদন্ত প্রকাশ করা কিনা তা নির্বিশেষে কোনও প্রদত্ত ডোমেনের জন্য চিন্তাভাবনা এবং তাত্ত্বিকতার উপর সম্ভাব্যভাবে বড় প্রভাব ফেলবে কিনা তা নির্বিশেষে। গ্যালম্যান, সিমোনশোহান এবং অন্যান্যরা প্যারানর্মাল, সামাজিক এবং মানসিক গবেষণায় হাস্যকর, তবুও পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ গবেষণার উদাহরণ ধরে ধরে পিয়ার-পর্যালোচনা এবং প্রকাশিত গবেষণায় 0.05 তাত্পর্য স্তরটির অপব্যবহারের দিকে বারবার ইঙ্গিত করেছেন। সর্বাধিক গুরুতর এক পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ সন্ধানটি পাওয়া যায় যে গর্ভবতী মহিলারা লাল পোশাক পরার সম্ভাবনা বেশি থাকে। গেলম্যান বজায় রেখেছেন, পরিসংখ্যানগত ফলাফলের পক্ষে যৌক্তিক চ্যালেঞ্জের অভাবে,সম্ভাব্য অর্থহীন ব্যাখ্যা। এখানে তিনি অত্যধিক প্রযুক্তিগত এবং গর্ভবতী যুক্তি দিয়ে শিল্পের পেশাগত বিপত্তির কথা উল্লেখ করছেন যা শ্রোতাদের মাঝে বিতর্ককে এগিয়ে নিতে সামান্য বা কিছুই করে না।

এই বিষয়টি গ্যারি কিং যখন তাত্পর্যপূর্ণভাবে বৈজ্ঞানিক, প্রযুক্তিগত প্রতিবেদন যেমন "এপি <= 0.05 স্তরে উল্লেখযোগ্য ছিল" থামাতে এবং আরও তাত্পর্যপূর্ণ ব্যাখ্যার দিকে এগিয়ে যাওয়ার জন্য পরিমাণগত রাজনৈতিক বিজ্ঞানীদের কাছে (এবং প্রসারিতভাবে, সমস্ত পরিমাণে) অনুরোধ করেন তখন তিনি তীব্রভাবে আলোচনা করেন makes । এখানে তাঁর একটি কাগজ থেকে উদ্ধৃতি,

(1) সর্বাধিক স্থিতিশীল আগ্রহের পরিমাণের সংখ্যার যথাযথ প্রাক্কলন জানাতে, (২) সেই অনুমানগুলি সম্পর্কে অনিশ্চয়তার যুক্তিসঙ্গত ব্যবস্থা অন্তর্ভুক্ত করা হয় এবং (3) বুঝতে খুব সামান্য বিশেষ জ্ঞান প্রয়োজন require নিম্নলিখিত সাধারণ বিবৃতিটি আমাদের মাপদণ্ডকে সন্তুষ্ট করে: 'অন্যান্য জিনিস সমান হওয়ায় শিক্ষার একটি অতিরিক্ত বছর আপনার বার্ষিক আয়কে গড়ে গড়ে 1,500 ডলার, প্রায় 500 ডলার বা মাইনাস দ্বারা বৃদ্ধি করবে।' যে কোনও স্মার্ট উচ্চ বিদ্যালয়ের শিক্ষার্থী সেই বাক্যটি বুঝতে পারে, পরিসংখ্যানের মডেলটি যত পরিশীলিত এবং কম্পিউটারগুলি এটির জন্য ব্যবহৃত শক্তিশালী তা বিবেচনা করে না।

কিংয়ের বক্তব্যটি খুব ভালভাবে গ্রহণ করা হয়েছে এবং বিতর্কটি যে দিকনির্দেশনার প্রয়োজন তা নির্ধারণ করে।

পরিসংখ্যানগত বিশ্লেষণ সর্বাধিক করা: ব্যাখ্যার উপস্থাপনা এবং উপস্থাপনা উন্নীত করা, কিং, টমজ এবং উইটেনবার্গ, ২০০২, পোলি সায়ার এম জার


2
+1 থ্রেডে এই পাঠযোগ্য, তথ্যবহুল এবং চিন্তাশীল অবদানের জন্য আপনাকে ধন্যবাদ।
হোবল

@ শুভ উদার শব্দটির জন্য ধন্যবাদ। অন্যান্য অংশগ্রহণকারীরা এটির সাথে একমত হন কি না তা সময় জানাবে।
মাইক হান্টার

2
আমি বিভ্রান্ত হতে পারি, তবে আমি ভাবতে চাই যে আমাদের সক্রিয় ভোটারদের মধ্যে কিছু (বেশিরভাগ না হলেও) চুক্তি বা মতবিরোধের ভিত্তিতে ভোট দেয় না, তবে কোনও পোস্ট মূল প্রশ্নের প্রতিক্রিয়া এমনভাবে দেয় কিনা তা পরিষ্কার এবং অনুমোদনযোগ্য । সর্বোপরি, আপভোট আইকনের উপরে থাকা হোভার পাঠ্যটি "এই উত্তরটি কার্যকর," না "আমি এই লোকটির সাথে একমত নই reads" (এটি আমাদের মেটা সাইটে ভোটদানের সাথে বিভ্রান্ত হওয়ার দরকার নেই , যা চুক্তির মাত্রা নির্দেশ করে)) এই ধারণাটির জন্য কিছু প্রমাণ পুরষ্কার প্রাপ্ত অনেক ক্রীড়াবিদ ব্যাজ দ্বারা সরবরাহ করা হয়।
হোবার

@ ভুবার আপনি যে উপমাটি দেখিয়েছেন তা যথাযথভাবে লক্ষ করা যায়।
মাইক হান্টার

@ যেহেতু এই থ্রেডটি ছিল অন্য দিন আমাদের আড্ডায় বিভ্রান্ত শব্দটি আমার ব্যবহারের উত্স ।
মাইক হান্টার

5

সমস্ত অন্তর্দৃষ্টিপূর্ণ মন্তব্য এবং উত্তর পড়ার পরে প্রশ্ন 3 সম্পর্কে আমার কিছু ধারণাগুলি এখানে রয়েছে।

পি-ভ্যালু হ্যাকিং এড়ানোর জন্য পরিসংখ্যানগত বিশ্লেষণের সম্ভবত একটি ব্যবহারিক নির্দেশিকা হ'ল পরিবর্তে বৈজ্ঞানিকভাবে (বা, জৈবিকভাবে, চিকিত্সা, ইত্যাদি) উল্লেখযোগ্য / অর্থবহ প্রভাবের আকারের দিকে নজর দেওয়া।

θ

এইচ0:θ=0বনামগুলিএইচএকটি:θ0,
এইচ0:θ<δবনামগুলিএইচএকটি:θδ,
δ

এছাড়াও, প্রভাবটি সনাক্ত করতে খুব বেশি পরিমাণে নমুনা আকার ব্যবহার এড়াতে, প্রয়োজনীয় নমুনা আকারটিও বিবেচনায় নেওয়া উচিত। এটি হ'ল, আমাদের পরীক্ষার জন্য ব্যবহৃত সর্বাধিক নমুনার আকারের প্রতিবন্ধকতা রাখা উচিত।

সংক্ষেপে,

  1. তাত্পর্যপূর্ণ আকারের জন্য তাত্পর্যটি প্রকাশের জন্য আমাদের একটি প্রান্তিক সংজ্ঞা প্রয়োজন;
  2. অর্থবহ প্রভাবের আকারটি কীভাবে সনাক্তযোগ্য তা নির্ধারণের জন্য আমাদের পরীক্ষায় ব্যবহৃত নমুনা আকারের একটি প্রান্তিক সংজ্ঞা নির্ধারণ করতে হবে;

উপরের সাথে, সম্ভবত আমরা একটি বিশাল নমুনা আকার দ্বারা দাবি করা ছোট "তাত্পর্যপূর্ণ" প্রভাব এড়াতে পারি।


[আপডেট 6/9/2015]

প্রশ্ন 3 সম্পর্কিত, প্রকৃতি থেকে সাম্প্রতিক কাগজের উপর ভিত্তি করে এখানে কিছু পরামর্শ দেওয়া হয়েছে : " প্রশ্নটির অংশে আমি উল্লেখ করেছি যে " চঞ্চল পি মান অপরিবর্তনীয় ফলাফল উত্পন্ন করে "

  1. প্রভাবের আকারের অনুমান এবং তাদের যথার্থতা প্রতিবেদন করুন, অর্থাৎ 95% আত্মবিশ্বাসের ব্যবধান, যেহেতু এই আরও তথ্যবহুল তথ্যের মধ্যে ঠিক ততই বড় পার্থক্য, বা সম্পর্ক বা সম্পর্ক কতটা শক্তিশালী প্রশ্নগুলির উত্তর দেয়;
  2. নির্দিষ্ট আকারের বৈজ্ঞানিক গবেষণা / প্রশ্নগুলির প্রসঙ্গে প্রভাবের আকারের অনুমান এবং 95% সিআই রাখুন এবং এই প্রশ্নগুলির উত্তর দেওয়ার ক্ষেত্রে তাদের প্রাসঙ্গিকতার দিকে মনোনিবেশ করুন এবং চঞ্চল পি মানটি ছাড় করুন;
  3. নির্ভুলতার একটি নির্ধারিত ডিগ্রীতে পৌঁছানোর জন্য প্রভাবের আকারটি অনুমান করার জন্য প্রয়োজনীয় নমুনা আকার নির্ধারণের জন্য " নির্ভুলতার জন্য পরিকল্পনা " দিয়ে শক্তি বিশ্লেষণকে প্রতিস্থাপন করুন ।

[শেষ আপডেট 6/9/2015]


4
এইচ0:θ=δ

অ্যান্ডিডাব্লু, মন্তব্যের জন্য ধন্যবাদ আমি আমার উত্তর অনুযায়ী পরিবর্তন করেছি। যে শব্দ আরও ভাল বিকল্প হবে?
অ্যারন জেং

2
প্রকৃতি নিবন্ধের রেফারেন্সের জন্য +1। এতে কিছু আশ্চর্যজনক ভুল তথ্য রয়েছে, যেমন, পি-মানগুলির (অঘোষিত) বয়েশিয়ান ব্যাখ্যা: "উদাহরণস্বরূপ, যদি কোনও গবেষণা পি = 0.03 অর্জন করে, তবে 90% সম্ভাবনা রয়েছে যে কোনও প্রতিলিপি অধ্যয়ন কোথাও পি মান ফিরিয়ে আনবে 0-0.6 (90% পূর্বাভাস অন্তর) এর বিস্তৃত পরিসরের মধ্যে, যখন পি <0.05 এর সম্ভাবনা মাত্র 56% is " আমি ভাবছি লেখকরা কোন পূর্ব বিতরণ ধরে নিচ্ছেন - এবং কেন এটি প্রাসঙ্গিক?
whuber

অ্যান্ডিডাব্লু এবং অ্যারন জেনগ, পার্থক্যের জন্য উভয় পরীক্ষার ফলাফল এবং সমতার জন্য পরীক্ষাগুলির ফলাফল একত্রিত করা আরও ভাল । এইভাবে, একটি প্রাসঙ্গিক প্রভাবের আকার এবং পরিসংখ্যানগত শক্তি উভয়ই একটি সিদ্ধান্তে পৌঁছানোর জন্য স্পষ্টভাবে স্থান দেয় (প্রাসঙ্গিক পরীক্ষার বিভাগটি দেখুন)।
অ্যালেক্সিস

3

পি(ডি|এইচ0)αএইচ0এইচ0

  1. এটি সূচিত করে যে 1/20 এর ফলাফলগুলি নথিকে বাতিল করতে পারে যখন তাদের না থাকা উচিত। যদি বিজ্ঞান ভিত্তিক এটি একক পরীক্ষায় উপসংহারে পৌঁছে যায় তবে বিবৃতিটি ডিফেন্সেবল হবে। অন্যথায়, যদি পরীক্ষাগুলি পুনরাবৃত্তিযোগ্য হয় তবে তা বোঝায় যে 19/20 টি প্রত্যাখাত হবে না। গল্পটির নৈতিকতা হচ্ছে পরীক্ষাগুলি পুনরাবৃত্তিযোগ্য হওয়া উচিত।

  2. বিজ্ঞান একটি "ecজেক্টিভিটি" ভিত্তিতে রীতিত একটি soতিহ্য তাই "উদ্দেশ্য সম্ভাবনা" প্রাকৃতিকভাবে আবেদন করে। মনে করুন যে পরীক্ষাগুলি অধ্যয়নের বাইরের কারণগুলির জন্য প্রায়শই ব্লক ডিজাইন এবং এলোমেলোকরণ নিয়োগ করে এমন একটি উচ্চ মাত্রার নিয়ন্ত্রণ প্রদর্শন করে। সুতরাং, এলোমেলো সাথে তুলনা করা অর্থবোধ করে না কারণ অন্য সমস্ত বিষয়গুলি অধ্যয়নের অধীনে ব্যতীত নিয়ন্ত্রিত হওয়ার কথা। এই কৌশলগুলি বিজ্ঞানে চালিত হওয়ার আগে কৃষি এবং শিল্পে অত্যন্ত সফল ছিল successful

  3. আমি নিশ্চিত নই যে তথ্যের অভাব কি আসলেই সমস্যা ছিল। এটি উল্লেখযোগ্য যে অ-গাণিতিক বিজ্ঞানের অনেকের কাছে যে পরিসংখ্যানগুলি টিকিয়ে রাখার জন্য কেবল একটি বাক্স।

  4. আমি সিদ্ধান্ত তত্ত্ব সম্পর্কে একটি সাধারণ পড়ার পরামর্শ দেব যা দুটি কাঠামোকে এক করে দেয়। এটি কেবল আপনার যতটা তথ্য ব্যবহার করতে নেমে আসে। মডেলগুলিতে ঘনঘনবাদী পরিসংখ্যানগুলি অনুমান করে যে নির্দিষ্ট বন্টন থেকে অজানা মান রয়েছে। মডেলগুলির প্যারামিটারগুলি মডেলগুলি ধরে নেয় যা আমরা জানি তা দ্বারা শর্তযুক্ত বিতরণ থেকে আসে Bay একটি সঠিক উত্তরোত্তর থেকে আপডেট করার জন্য যদি পূর্ব এবং পর্যাপ্ত তথ্য গঠনের পর্যাপ্ত তথ্য থাকে তবে তা দুর্দান্ত। যদি তা না থাকে তবে আপনি আরও খারাপ ফলাফলের সাথে শেষ করতে পারেন।


1

পরিসংখ্যান পরীক্ষার ফলাফলের পুনরুত্পাদনযোগ্যতা

পরিসংখ্যান পরীক্ষার উপর ভিত্তি করে সিদ্ধান্তগুলির পুনরুত্পাদনযোগ্যতার মূল্যায়ন করার জন্য এটি একটি ছোট, সাধারণ অনুশীলন।

H1 এবং H2 সমন্বিত বিকল্প অনুমানের সেট সহ একটি নাল অনুমান H0 বিবেচনা করুন। যদি এইচ 1 সত্য হয়, তবে 0.8 পাওয়ার পাওয়ার জন্য 0.05 এর একটি তাত্পর্য পর্যায়ে পরিসংখ্যান অনুমানের পরীক্ষা পদ্ধতি সেটআপ করুন। আরও ধরে নিন যে এইচ 2 এর পাওয়ারটি 0.5 হয়। পরীক্ষার ফলাফলের পুনঃ প্রজননযোগ্যতা নির্ধারণের জন্য, পরীক্ষাটি পরীক্ষা পদ্ধতিটি দু'বার কার্যকর করার বিষয়ে বিবেচনা করা হয়। পরিস্থিতি দিয়ে শুরু করে, যেখানে এইচ 0 সত্য, যৌথ পরীক্ষার ফলাফলের সম্ভাবনাগুলি সারণি 1 এ প্রদর্শিত হবে। সিদ্ধান্তগুলি পুনরুত্পাদন করতে সক্ষম না হওয়ার সম্ভাবনা 0.095 is

সারণী 1. ফ্রিকোয়েন্সি, যদি H0 সত্য হয়

এফRকুইতোমার দর্শন লগ করাএনYআমিগুলিআমিএনআরটিএইচ0আরটিএকটিআমিএনএইচ0আরটিএইচ00,00250,0475আরটিএকটিআমিএনএইচ00,04750,9025

প্রকৃতির প্রকৃত অবস্থা পরিবর্তনের সাথে সাথে ফ্রিকোয়েন্সিগুলি পরিবর্তিত হয়। এইচ 1 সত্য বলে ধরে নিলে, এইচ 0 টি 0.8 পাওয়ার হিসাবে ডিজাইন করা হিসাবে প্রত্যাখ্যান করা যাবে। যৌথ পরীক্ষার বিভিন্ন ফলাফলের জন্য প্রাপ্ত ফ্রিকোয়েন্সিগুলি টেবিল 2-এ প্রদর্শিত হয় সিদ্ধান্তগুলি পুনরুত্পাদন করতে সক্ষম না হওয়ার সম্ভাবনা 0.32।

সারণী 2. ফ্রিকোয়েন্সি, যদি এইচ 1 সত্য হয়

এফRকুইতোমার দর্শন লগ করাএনYআমিগুলিআমিএনআরটিএইচ0আরটিএকটিআমিএনএইচ0আরটিএইচ00.640.16আরটিএকটিআমিএনএইচ00.160.04

এইচ 2 সত্য বলে ধরে নিলে, H0 0.5 এর সম্ভাব্যতার সাথে প্রত্যাখ্যাত হবে। যৌথ পরীক্ষার বিভিন্ন ফলাফলের জন্য প্রাপ্ত ফ্রিকোয়েন্সিগুলি টেবিল 3-এ প্রদর্শিত হয় সিদ্ধান্তগুলি পুনরুত্পাদন করতে সক্ষম না হওয়ার সম্ভাবনা 0.5%।

সারণী 3. ফ্রিকোয়েন্সি, যদি H2 সত্য হয়

এফRকুইতোমার দর্শন লগ করাএনYআমিগুলিআমিএনআরটিএইচ0আরটিএকটিআমিএনএইচ0আরটিএইচ00.250.25আরটিএকটিআমিএনএইচ00.250.25

পরীক্ষার পদ্ধতিটি টাইপ প্রথম ত্রুটিগুলি নিয়ন্ত্রণের জন্য তৈরি করা হয়েছিল (নাল অনুমানের প্রত্যাখাত যদিও এটি সত্য) 0.05 এর সম্ভাব্যতা এবং সীমা টাইপ II ত্রুটিগুলি (নাল অনুমানের প্রত্যাখ্যান না হলেও এটি ভুল এবং এইচ 1 সত্য) 0.2 এ। উভয় ক্ষেত্রেই, এইচ 0 বা এইচ 1 হ'ল সত্য হিসাবে ধরে নেওয়া হলেও, একই পরীক্ষা দু'বার পুনরাবৃত্তি করা হলে এটি "অ-প্রজননযোগ্য", "বিপরীতমুখী" সিদ্ধান্তগুলির যথাক্রমে অবহেলিত ফ্রিকোয়েন্সি, 0.095 এবং 0.32 এর দিকে পরিচালিত করে। "অ-প্রজননযোগ্য", "পরস্পরবিরোধী" সিদ্ধান্তগুলির জন্য ০.৫ পর্যন্ত ফ্রিকোয়েন্সি সহ পরিস্থিতি আরও খারাপ হয়ে যায়, যদি প্রকৃতির সত্যিকারের অবস্থাটি নাল- এবং পরীক্ষার নকশা করার জন্য ব্যবহৃত বিকল্প অনুমানের মধ্যে থাকে।

পরিস্থিতি আরও উন্নত হতে পারে - যদি টাইপ 1 ত্রুটিগুলি আরও কঠোরভাবে নিয়ন্ত্রণ করা হয়, বা প্রকৃতির প্রকৃত অবস্থা শূন্য থেকে অনেক দূরে থাকে, যার ফলস্বরূপ 1 টির নিকটে থাকা শূন্যটিকে প্রত্যাখ্যান করার শক্তি তৈরি হয়।

সুতরাং, আপনি যদি আরও পুনরুত্পাদনযোগ্য সিদ্ধান্ত নিতে চান তবে তাগিরি স্তর এবং আপনার পরীক্ষার শক্তি বৃদ্ধি করুন। খুব অবাক করা নয় ...


(+1) তবে আপনি পরীক্ষার আগে পি-মান 5% এ সেট করতে পারবেন না - মনে করেন আপনি "তাত্পর্য স্তর" মানে mean
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

ধন্যবাদ. শেষ বাক্যে একই জিনিস: "তাত্পর্য স্তর হ্রাস করুন এবং শক্তি বৃদ্ধি করুন"
স্কোর্টচি - মনিকা পুনরায় ইনস্টল করুন

আমি মনে করি পি মানগুলির সাথে সবচেয়ে বড় সমস্যাটি হ'ল লোকেরা তাদের যথেষ্ট গুরুত্ব সহকারে বিভ্রান্ত করে। সুতরাং যদি পি <.05 এর অর্থ এটি আবিষ্কার করা প্রভাবের আকারটি যথেষ্ট পরিমাণে বড়। আমি পি-মানগুলি উত্পন্ন করে [উল্লেখযোগ্যভাবে] উল্লেখযোগ্য প্রভাব তৈরি করতে কাজ করতে বলি।
ব্যবহারকারীর 424285
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.