ফিশারের "আরও তথ্য পান গো" কীভাবে উপলব্ধি করা যায়?


26

গং এর দুর্দান্ত উত্তর উদ্ধৃত

অভিযোগ, এক গবেষক একবার 'অ-তাৎপর্যপূর্ণ' ফলাফল নিয়ে ফিশারের কাছে এসেছিলেন এবং তাঁর কী করা উচিত তা জিজ্ঞাসা করেছিলেন এবং ফিশার বলেছিলেন, 'আরও ডেটা পাবেন'।

নেইমন -পিয়ারসনের দৃষ্টিকোণ থেকে এটি নির্মম হ্যাকিং, তবে এমন কি এমন কোনও ব্যবহারের ঘটনা রয়েছে যেখানে ফিশারের আরও বেশি-ডেটা পন্থা উপলব্ধি করা যায়?p


10
ফিশার (বারবার) পরীক্ষাগুলির প্রতিরূপের গুরুত্বের উপর জোর দিয়েছিল এবং আমি প্রত্যাশা করি যে এখানেই তাঁর উদ্দেশ্য ছিল (ধরে নিলাম কথোপকথনটি ঘটেছে)। অবশ্যই ফিশার ভালভাবেই অবগত থাকতেন যে আপনি তাত্পর্যটি পরীক্ষা করতে পারবেন না এবং যদি না পেয়ে থাকেন তবে আপনার প্রাথমিক নমুনাটি প্রসারিত করতে পারেন।
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেেন_বি "পরীক্ষাগুলির প্রতিলিপি" শব্দটি আমি এর আগে শুনেছি কিন্তু বেশিরভাগেই তা পাইনি। তুমি কি বিস্তারিত বলতে পারো? বলুন, এমন কোনও পরীক্ষার দশটি প্রতিলিপি রয়েছে যার নমুনার আকারটি একক পরীক্ষার চেয়ে 10 টির চেয়ে ভাল, যার নমুনার আকার 100?
নলজোক

অনুসন্ধানের গবেষণায়, গো-গেট-মুর-ডেটা গ্রহণযোগ্য হতে পারে। নিশ্চিতকরণমূলক গবেষণায়, গ-গেট-মোর-ডেটার কোনও অবস্থান নেই।
ব্যবহারকারী 158565

5
পরিসংখ্যান চর্চা সম্পর্কে আমার বিতর্কিত মতামতের মধ্যে একটি হ'ল মিথ্যা-ইতিবাচক বিষয়টিকে বিবেচনা করা গুরুত্বপূর্ণ, আমাদের কোনও উচ্চ সংরক্ষণের জন্য প্রকার 1 ত্রুটি হার সংরক্ষণ করা উচিত নয় যা কোনও প্রকার সংরক্ষণের জন্য আমরা ডেটা থেকে শিখতে অস্বীকার করি 1 ত্রুটি হার।
ক্লিফ এবি

উত্তর:


29

ঘনঘনবাদী দৃষ্টান্ত হ'ল ফিশার এবং নেইমন-পিয়ারসনের মতামতের সংমিশ্রণ। শুধুমাত্র একটি পদ্ধতির এবং অন্য ব্যাখ্যা ব্যবহার করে সমস্যা দেখা দেয়।

যে কারও কাছে এটি আশ্চর্যজনক মনে হবে যে আরও ডেটা সংগ্রহ করা সমস্যাযুক্ত, কারণ আরও ডেটা বেশি প্রমাণ। প্রকৃতপক্ষে, সমস্যাটি আরও ডেটা সংগ্রহ করার ক্ষেত্রে নয়, তবে ভ্যালুটি করার সিদ্ধান্ত নেওয়ার ক্ষেত্রে, যখন এটি আগ্রহেরও পরিমাপ। ভ্যালুয়ের উপর ভিত্তি করে আরও ডেটা সংগ্রহ করা কেবলমাত্র হ্যাকিং যদি আপনি কোনও নতুন ভ্যালু গণনা করেন ।pppp

যদি আপনার কাছে গবেষণা প্রশ্ন সম্পর্কে সন্তোষজনক উপসংহারের জন্য পর্যাপ্ত প্রমাণ না থাকে তবে সব উপায়ে, আরও ডেটা পান। তবে, স্বীকার করুন যে আপনি এখন আপনার গবেষণার এনএইচএসটি পর্যায়ে এসেছেন, এবং আগ্রহের প্রভাবের পরিমাণের পরিবর্তে মনোনিবেশ করুন ।


একটি আকর্ষণীয় দ্রষ্টব্য হ'ল বায়েশিয়ানরা এই দ্বিধা থেকে ভোগেন না। নিম্নলিখিত হিসাবে একটি উদাহরণ হিসাবে বিবেচনা করুন:

  • যদি কোনও বার্ষিকী কোনও তাত্পর্যপূর্ণ সিদ্ধান্ত গ্রহণ না করে এবং তারপরে সমতার পরীক্ষায় চলে যায় তবে অবশ্যই মিথ্যা ইতিবাচক হার বৃদ্ধি পেয়েছে;
  • একজন বায়েশিয়ান সর্বোচ্চ ঘনত্বের ব্যবধান এবং পার্থক্যটির ব্যবহারিক সমতার অঞ্চল একই সাথে প্রকাশ করতে পারে এবং রাতে ঠিক একই ঘুমাতে পারে।

সুতরাং মূলত, বলুন যে আমি জনসংখ্যার গড় A এর সাথে জনসংখ্যার বি সমান হয় তা পরীক্ষা করতে চাই। প্রথমদিকে, আমি কিছু তথ্য পাই, জন্য একটি পরীক্ষা : "উপায় সমান", এবং আমি এটিকে প্রত্যাখ্যান করতে ব্যর্থ হই। এই ক্ষেত্রে, আমার জন্য আর একটি পরীক্ষা করা উচিত নয় : "উপায়গুলি সমান নয়"। আমি যা করতে পারি তা হ'ল উপায়গুলির গোপনীয় অন্তরগুলি অনুমান করা, এটি কি সঠিক? যদি দুটি বিরতিতে কোনও ওভারল্যাপ না থাকে তবে কী হবে? এইচ 0H0H0
নলজোক

6
"আপনি যদি নতুন কোনও পি-মান গণনা করেন তবে এটি কেবল পি-হ্যাকিং" " এটি কি পি-মান গণনা করতে ব্যবহৃত পদ্ধতির উপর নির্ভর করে না? ক্রমান্বয়ে বিশ্লেষণ এবং আরও ডেটা সংগ্রহের সিদ্ধান্তকে উপেক্ষা করার ফলে একটি ভুল পি-মান হবে। তবে, আপনি যদি পি-ভ্যালু গণনায় আরও ডেটা সংগ্রহ করার সিদ্ধান্তের নিয়মটি অন্তর্ভুক্ত করেন তবে আপনি একটি বৈধ পি-মান তৈরি করবেন।
jsk

4
@ জেএসকি আমি মনে করি এটি কম যে পরবর্তী সময়ে গণনা করা পি-মানগুলি কোনওভাবে অবৈধ এবং আপনি যখন পরীক্ষাটি "সঠিক" হন এবং সেই প্রকল্পের উপর আপনার গবেষণা হয় তখন আপনি বিচার করার জন্য একটি স্বেচ্ছাসেবী এবং অ-ডেটা চালিত মান ব্যবহার করেন " সম্পন্ন". সমস্ত অ-তাত্পর্যপূর্ণ-পি-মানগুলি ভুল, এবং যতক্ষণ না আপনার কাছে গুরুত্বপূর্ণ তথ্য পাওয়া যায় ততক্ষণ ডেটা সংগ্রহ করা এবং স্থির করা কারণ আপনি "ডান" ফলাফলটি অর্জন করেছেন তা পরীক্ষামূলক বিজ্ঞানের বিপরীত।
উপরের_ক্যাস-স্টপ হার্মিং মনিকা

1
@ উচ্চ_ক্যাস আমি পি-হ্যাকিং সম্পর্কিত পোস্টের খুব ছোট অংশে মন্তব্য করছিলাম, এজন্যই আমি এই বিভাগটি উদ্ধৃতিতে অন্তর্ভুক্ত করেছি। আপনি আমার বক্তব্যটি অনেক বেশি পড়ছেন। আমার বক্তব্যটি হ'ল যে কোনও সিদ্ধান্তের রুল যা আরও ডেটা সংগ্রহ করার সিদ্ধান্ত নেওয়ার জন্য ব্যবহৃত হয় তা অবশ্যই পি-ভ্যালু গণনায় অন্তর্ভুক্ত করতে হবে। যতক্ষণ আপনি পি-ভ্যালু গণনার মধ্যে নেওয়া সিদ্ধান্তগুলি অন্তর্ভুক্ত করেন ততক্ষণ আপনি যদি এমন চান তবে আপনি একটি বৈধ এনএইচএসটি পরিচালনা করতে পারেন। এর অর্থ এই নয় যে আমি কোনও থামার নিয়মের পক্ষে পরামর্শ দিচ্ছি যা বলছে, "যতক্ষণ না আপনি কোনও উল্লেখযোগ্য ফলাফল না পান ততক্ষণ আরও ডেটা সংগ্রহ করুন collect"
jsk

@ জেএসকি আহ, আমি এখন আপনার বক্তব্যটি আরও ভাল করে বুঝতে পারি। সুস্পষ্ট করার জন্য ধন্যবাদ.
এপার_সেস-স্টপ হার্মিং মনিকা

10

একটি বড় যথেষ্ট নমুনা আকার দেওয়া, একটি পরীক্ষা সর্বদা তাৎপর্যপূর্ণ ফলাফল প্রদর্শন করবে, যদি না এখানে আলোচিত হিসাবে সত্য প্রভাবের আকারটি ঠিক শূন্য না হয় । অনুশীলনে, প্রকৃত প্রভাবের আকারটি শূন্য নয়, সুতরাং আরও তথ্য সংগ্রহ করা অবশেষে সর্বাধিক বিয়োগ পার্থক্য সনাক্ত করতে সক্ষম হবে।

ফিশারের (আইএমও) মুখোমুখি উত্তর একটি অপেক্ষাকৃত তুচ্ছ প্রশ্নের জবাবে ছিল যে এর ভিত্তিতে 'ব্যবহারিকভাবে প্রাসঙ্গিক পার্থক্য' এর সাথে 'উল্লেখযোগ্য পার্থক্য' কে বিভ্রান্ত করছে।

এটি কোনও গবেষক আমার অফিসে এসে জিজ্ঞাসা করার সমতুল্য হবেন যে "আমি এই লিডের ওজন '25 গ্রাম 'লেবেলযুক্ত ওজন করেছি এবং এটি 25.0 গ্রাম পরিমাপ করেছে। আমি বিশ্বাস করি যে এটি ভুল বিভ্রান্তিযুক্ত, আমি কী করব?" যার জবাব আমি দিতে পারি, "আরও সুনির্দিষ্ট স্কেল পান।"

আমি বিশ্বাস করি যে প্রাথমিকভাবে পরীক্ষামূলকভাবে প্রাসঙ্গিক যে পার্থক্যটির মাত্রা সনাক্ত করতে প্রাথমিক পরীক্ষাটি খারাপভাবে ক্ষুদ্রতরভাবে চালিত হয় তবে গো-গেট-ডেটা-ডেটা পদ্ধতির পক্ষে উপযুক্ত।


যদিও মুল বক্তব্যটি হ'ল পি-মানটির গণনায় আরও ডেটা পাওয়ার জন্য আপনাকে সিদ্ধান্তটি অন্তর্ভুক্ত করতে হবে।
জেএসকে

@ জেস্ক আপনি এমনকি যদি পি-মান পরিবর্তন করেন তবে আপনি একটি উল্লেখযোগ্য ফলাফল পেতে আরও তথ্য সংগ্রহ করতে পারেন (তবে আপনার আরও বেশি ডেটা প্রয়োজন হলেও)।
আন্ডারমিনার

1
আমি পরিষ্কার হতে পারে। আমি নিশ্চিত না যে আপনি "আপনি এখনও একটি উল্লেখযোগ্য ফলাফল খুঁজে পেতে আরও ডেটা সংগ্রহ করতে পারেন" বলতে কী বোঝায়। আমি তা পেয়েছি কারণ নাল অনুমানটি সাধারণত বাস্তবে কখনও সত্য হয় না, আরও ডেটা সংগ্রহ করা অবশেষে একটি উল্লেখযোগ্য ফলাফলের দিকে নিয়ে যায়। আমি কেবল এই বিষয়টির দিকে দৃষ্টি আকর্ষণ করতে চেয়েছিলাম যে পি-মানটি গণনা করার সময় আপনাকে পি-মানটির গণনায় আরও ডেটা সংগ্রহ করার সিদ্ধান্তটি অন্তর্ভুক্ত করতে হবে। এর অর্থ হ'ল সিদ্ধান্তের নিয়মগুলি (আরও ডেটা সংগ্রহের বিষয়ে) মূল ডেটা সংগ্রহের আগে প্রাক-নির্দিষ্ট করা দরকার।
jsk

@ জেস্ক এমনকি পি-মান সামঞ্জস্য করার খুব রক্ষণশীল পদ্ধতির সাথেও (যেমন: বনফেরোনি সঠিক, উত্তর-বিশ্লেষণে প্রযোজ্য) এখানে একটি অতিরিক্ত অতিরিক্ত নমুনার আকার উপস্থিত রয়েছে যা সংশোধনটি কাটিয়ে উঠবে। কথাটি হ'ল: যদি আপনি আমাকে পি-মান সমন্বয় পদ্ধতি সরবরাহ করেন (মূল তথ্য সংগ্রহের আগে নির্দিষ্ট করা হয়) তবে আগ্রহের গোষ্ঠীর জনসংখ্যা বিতরণের মধ্যে সত্য পার্থক্য এবং তাত্পর্যপূর্ণ প্রাথমিক ফলাফল নয়; এবং আমি আপনাকে একটি বৃহত পরিমাণে নমুনার আকার সরবরাহ করতে পারি যা আপনাকে উল্লেখযোগ্য ফলাফল পাবে। সুতরাং, আরও ডেটা সবসময় একটি উত্তর।
Underminer

7

ধন্যবাদ। এখানে মনে রাখার মতো কয়েকটি বিষয় রয়েছে:

  1. উদ্ধৃতিটি অ্যাপোক্রিফাল হতে পারে।
  2. দ্বিতীয় স্টাডির (সিএফ।, @ গ্লেন_ বি এর মন্তব্য ) জন্য আরও / আরও ভাল ডেটা, বা অন্য উত্স থেকে ডেটা (আরও সুনির্দিষ্ট স্কেল, সিএফ।, @ আন্ডারমিনারের উত্তর ; বিভিন্ন পরিস্থিতি বা নিয়ন্ত্রণ; ইত্যাদি) পাওয়া যথেষ্ট যুক্তিযুক্ত । এটি হ'ল, আপনি মূল ডেটার সাথে একত্রে অতিরিক্ত তথ্য বিশ্লেষণ করবেন না: বলুন যে আপনার অ-তাত্পর্যপূর্ণ ফলাফলের সাথে এন = 10 ছিল, আপনি অন্য এন = 20 ডেটা সংগ্রহ করতে এবং তাদের একা বিশ্লেষণ করতে পারবেন (সম্পূর্ণ 30 একসাথে পরীক্ষা না করে) )। যদি উদ্ধৃতিটি অ্যাপোক্রিফাল না হয় তবে ফিশারের মনে এটিই থাকতে পারে।
  3. ফিশারের বিজ্ঞানের দর্শন মূলত পপ্পেরিয়ান ছিল । এটি হ'ল নালটি অবিচ্ছিন্নভাবে কিছু তাত্ক্ষণিকভাবে প্রত্যাখ্যান করার মতো ছিল না যাতে আপনার তত্ত্বটি নিশ্চিত করা যায়, তবে আদর্শিকভাবে নিজেই আপনার তত্ত্ব হতে পারে, যেমন প্রত্যাখ্যানের অর্থ আপনার পোষা তত্ত্বটি ভুল এবং আপনাকে আবার অঙ্কন বোর্ডে যেতে হবে। এই জাতীয় ক্ষেত্রে, টাইপ আই ত্রুটি মুদ্রাস্ফীতিটি গবেষককে কোনও উপকারে আসবে না। (অন্যদিকে, এই ব্যাখ্যাটি ফিশারকে এই পরামর্শ দেওয়ার বিরুদ্ধে বিবাদ কেটে যায় যদি না তিনি ঝগড়াটে হয়ে থাকেন, যা চরিত্রের বাইরে থাকত না।)
  4. যে কোনও হারে, এটি উল্লেখ করার মতো যে আমি যে মন্তব্যটিকে অন্তর্ভুক্ত করেছি তা হ'ল এটি দুটি পদ্ধতির প্রকৃতির পার্থক্য সম্পর্কে মৌলিক কিছু চিত্রিত করে।

1
p

যাইহোক, যদি আপনি "দুটি পদ্ধতির প্রকৃতির পার্থক্য" সম্পর্কে বিস্তারিত বর্ণনা করতে পারেন তবে দুর্দান্ত হবে। ফিশারের পদ্ধতিটি আরও বেশি ... বিষয়ভিত্তিক মনে হচ্ছে, কারণ আমার মনে হচ্ছে তিনি আসলে ত্রুটির হারের বিষয়ে চিন্তা করেন না, তবে আমি কিছু অনুভব করতে পারি।
নলজোক

1
@ নলজোক, পার্থক্যটি মূল থ্রেডে আলোচনা করা হয়েছে: নেইম্যান-পিয়ারসন পদ্ধতির ধারণা অধ্যয়নটি একটি বিচ্ছিন্ন ঘটনা, আপনি তা করেন এবং চলে যান; ফিশারের অভিমত ধরে নিয়েছে যে বিষয়টি তদন্ত অব্যাহত রয়েছে। পুনরায়: # 2, আপনি যদি ডেটাটি বিচ্ছিন্নভাবে বিশ্লেষণ করেন তবে এটি পি-হ্যাকিং নয় (যদি না আপনি একাধিক গবেষণা চালান এবং কেবল যা চান তা প্রকাশ করেন)। পুনঃ: # 3, না, নাল গ্রহণ করা হয় নি, আপনার তত্ত্বটি পরীক্ষা করার জন্য আরও ভাল উপায়গুলি সন্ধান করতে হবে।
গুং - মনিকা পুনরায়

1
pp

1
(+1) কখনও কখনও আমি মনে করি আমরা গাছে ফোকাস করি এবং বন মিস করি। বেশ কথায় কথায়, যখন আমাদের খুব সমস্যা হয় তখন সাধারণত কম ডেটার চেয়ে আরও বেশি ডেটা ভাল হয় । বেশিরভাগ ক্ষেত্রে, আরও ডেটা খুব ভাল হয় না। মেনগের অন্তর্দৃষ্টিপূর্ণ 2018 পেপার হিসাবে " স্ট্যাটিস্টিকাল প্যারাডাইজস এবং বিগ ডেটাতে প্যারোডেক্সস (আই) " পরামর্শ দিয়েছে, যখন আমরা অজানা পরিমাণটি অনুমান করার চেষ্টা করি তখন আরও ভাল ডেটা (যেমন একটি সুনির্বাচিত নমুনা) পাওয়া অনেক বেশি উপকারী । তবে আরও তথ্য সাধারণত সাহায্য করে!
usεr11852

6

আমরা যাকে পি-হ্যাকিং বলি তা একাধিকবার একটি তাত্পর্য পরীক্ষা প্রয়োগ করে কেবল তাত্পর্যপূর্ণ ফলাফলের প্রতিবেদন করে। এটি ভাল বা খারাপ তা পরিস্থিতিগতভাবে নির্ভর।

ব্যাখ্যা করতে, আসুন নালাগুলি এবং বিকল্প অনুমানের পরিবর্তে বায়েশিয়ান পদগুলিতে সত্যিকারের প্রভাবগুলি সম্পর্কে ভাবা যাক। যতক্ষণ আমরা বিশ্বাস করি আমাদের আগ্রহের প্রভাবগুলি অবিচ্ছিন্ন বিতরণ থেকে আসে, তারপরে আমরা জানি নাল অনুমানটি মিথ্যা। তবে, দ্বি-পার্শ্বিক পরীক্ষার ক্ষেত্রে এটি ইতিবাচক বা নেতিবাচক কিনা তা আমরা জানি না। এই আলোর অধীনে, আমরা আমাদের প্রমাণের সঠিক দিক (যেমন, ইতিবাচক বা নেতিবাচক প্রভাব) রয়েছে তা প্রমাণের পক্ষে কতটা শক্তিশালী তা পরিমাপ হিসাবে আমরা দুটি তরফা পরীক্ষার জন্য পি-মানগুলির কথা ভাবতে পারি।

p<α

এখন, আপনি আরও ডেটা পেতে পিছনে যেতে থাকলে কী ঘটে তা বিবেচনা করুন। প্রতিবার আপনি আরও ডেটা পাবেন, পর্যাপ্ত ডেটাতে দিকনির্দেশনা সঠিক শর্তযুক্ত পাওয়ার সম্ভাবনা কেবল আপনার উপরে উঠে যায়। সুতরাং এই দৃশ্যের অধীনে, আমাদের আরও ডেটা পাওয়ার মাধ্যমে উপলব্ধি করা উচিত, যদিও আমরা আসলে টাইপ আই ত্রুটির সম্ভাবনা বাড়িয়ে দিচ্ছি, আমরা ভুলভাবে ভুল দিকটি অবলম্বন করার সম্ভাবনাও হ্রাস করছি।

এটিকে পি-হ্যাকিংয়ের আরও সাধারণ ব্যবহারের বিপরীতে নিন; আমরা ১০০ এর প্রভাব আকারকে পরীক্ষা করি যার খুব ছোট হওয়ার সম্ভাবনা রয়েছে এবং কেবলমাত্র তাৎপর্যগুলি প্রতিবেদন করে। মনে রাখবেন যে এই ক্ষেত্রে, যদি সমস্ত প্রভাবগুলি ছোট হয়, তাত্পর্যটি প্রকাশ করার সময় আমাদের কাছে দিকটি ভুল হওয়ার প্রায় 50% সম্ভাবনা থাকে।

অবশ্যই, এই ডেটা-ডাবল-ডাউন থেকে উত্পাদিত পি-মানগুলি এখনও লবণের দানা দিয়ে আসা উচিত। সাধারণভাবে, কোনও ব্যক্তির প্রভাবের আকার সম্পর্কে আরও সুনিশ্চিত হওয়ার জন্য আরও তথ্য সংগ্রহের ক্ষেত্রে আপনার সমস্যা হওয়া উচিত নয়, এটি অন্য উপায়ে অপব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, একজন চৌকস পিআই বুঝতে পারে যে একবারে সমস্ত ১০০ ডেটা পয়েন্ট সংগ্রহ করার পরিবর্তে তারা একগুচ্ছ অর্থ সাশ্রয় করতে পারে এবং প্রথমে ৫০ টি তথ্য পয়েন্ট সংগ্রহ করে, ডেটা বিশ্লেষণ করে এবং তারপরে পরবর্তী ৫০ টি সংগ্রহ করতে পারে যদি তা উল্লেখযোগ্য না হয় । এই দৃশ্যে, তারা তাত্পর্যপূর্ণ তাত্পর্য ঘোষণার উপর প্রভাবের দিকটি ভুল শর্ত সাপেক্ষ হওয়ার সম্ভাবনা বাড়ায়, যেহেতু তারা 100 টি ডাটা পয়েন্টের তুলনায় 50 টি ডাটা পয়েন্টের সাথে প্রভাবের দিকনির্দেশের ভুল পাওয়ার সম্ভাবনা বেশি।

এবং পরিশেষে, যখন আমাদের কোনও তুচ্ছ ফলাফল হয় তখন আরও ডেটা না পাওয়ার ইঙ্গিতগুলি বিবেচনা করুন । এটি ইঙ্গিত দেয় না যে এই বিষয়ে আরও তথ্য সংগ্রহ করা, যা বিজ্ঞানকে সত্যিকার অর্থে এগিয়ে নিয়ে যায় না, তাই না? একটি আন্ডার পাওয়ারযুক্ত অধ্যয়ন পুরো ক্ষেত্রটিকে হত্যা করবে।


1
(+1) এটি একটি আকর্ষণীয় দৃষ্টিভঙ্গি, তবে আপনি কি ফিশারের পদ্ধতি এবং চতুর পিআইয়ের মধ্যে পার্থক্যটি ব্যাখ্যা করতে পারেন? উভয়ই আরও ডেটা সংগ্রহ করে কারণ প্রাথমিক পরীক্ষাটি তুচ্ছ, মনে হয়।
নলজোক

এছাড়াও, আপনারা কী বলতে চাইছেন তা আমি নিশ্চিত নই "যদিও আমরা আসলে আমি টাইপের প্রথম ধরণের ত্রুটি হওয়ার সম্ভাবনা বাড়িয়ে দিচ্ছি, আমরা ভুলভাবে ভুল দিকটি শেষ করার সম্ভাবনাও হ্রাস করছি"। এখানে নাল অনুমান কি? আইএমও আপনি যদি একতরফা পরীক্ষা করে থাকেন, তবে "ভুল দিকের সমাপ্তি" হ'ল "টাইপ আই ত্রুটি" এবং দ্বি-পার্শ্বিক পরীক্ষার জন্য আপনাকে দিকটি শেষ করা উচিত নয়।
নলজোক

আমি ভুল হলে আমাকে সংশোধন করুন, তবে আমি মনে করি আপনি দ্বি-পার্শ্ব পরীক্ষাটি উল্লেখযোগ্য না হওয়া পর্যন্ত আরও ডেটা সংগ্রহ করার পরামর্শ দিয়েছেন এবং এই ক্ষেত্রে, আমার ত্রুটির হারটি টাইপ হবে 100%।
নলজোক

1
ফিশার যা পরামর্শ দেয় এবং চতুর / নিষ্পাপ পিআইয়ের মধ্যে মূল পার্থক্য হ'ল ফিশার সেই কলটি অধ্যয়ন থেকে শেষ করে বলে মনে করেন। তার বিকল্পগুলি হয় আরও ডেটা সংগ্রহ করে, বা সিদ্ধান্ত নেয় যে সে কখনই প্রভাবের দিকটি জানতে পারবে না। অন্যদিকে, পিআই এমনকি ডেটা দেখার আগে তার প্রাথমিক অধ্যয়নকে শক্তিশালী করার সিদ্ধান্ত নিয়েছে ।
ক্লিফ এবি

1
@ নলজোক: অবশ্যই আমি নন ওয়ার্কের সময় একবার দেখে নেওয়ার চেষ্টা করব :)
ক্লিফ এবি

1

বিকল্পটির যদি একটি প্রাকৃতিক সম্ভাবনা খুব কম ছিল , তবে নালকে প্রত্যাখ্যান করতে ব্যর্থ একটি পরীক্ষা আরও আরও হ্রাস পাবে, আরও গবেষণা আরও কম ব্যয়বহুল করে তুলবে। উদাহরণস্বরূপ, ধরুন একটি অগ্রাধিকার সম্ভাবনা .01। তারপরে আপনার এনট্রপি .08 বিট। সম্ভাবনাটি যদি .001 এ কমে যায় তবে আপনার এনট্রপি এখন .01 is সুতরাং, ডেটা সংগ্রহ করা চালিয়ে যাওয়া প্রায়শই কার্যকর হয় না। এটি কার্যকরভাবে কার্যকর হওয়ার এক কারণ হ'ল জেনে রাখা এত গুরুত্বপূর্ণ যে এমনকি এনট্রপির বাকি .01 বিটগুলি হ্রাস করার পক্ষে মূল্যবান।

আর একটি কারণ যদি অগ্রাধিকার সম্ভাবনা সত্যই বেশি ছিল। যদি আপনার অগ্রাধিকারের সম্ভাবনা 50% এর বেশি ছিল, তবে নালটিকে প্রত্যাখ্যান করতে ব্যর্থ হওয়া আপনার এনট্রপিকে বাড়িয়ে তোলে, ডেটা সংগ্রহ করা চালিয়ে যাওয়া আরও ব্যয়কে কার্যকর করে তোলে। একটি উদাহরণ যখন আপনি প্রায় নিশ্চিত হন যে একটি প্রভাব আছে, কিন্তু কোন দিকে জানেন না।

উদাহরণস্বরূপ, যদি আপনি একটি পাল্টা বিরোধী এজেন্ট হন এবং আপনি নিশ্চিত যে কোনও বিভাগের একটি তিল রয়েছে এবং এটি দুটি সন্দেহভাজনকে সংকুচিত করে রেখেছেন এবং কোনটি নির্ধারণের জন্য কিছু পরিসংখ্যান বিশ্লেষণ করছেন তবে কোনও পরিসংখ্যানগতভাবে তুচ্ছ ফলাফল সংগ্রহকে ন্যায্যতা দেবে? আরও তথ্য।


কেন নাল প্রত্যাখ্যান করতে ব্যর্থ হয় তার সম্ভাবনা হ্রাস করে? যদিও প্রমাণের অনুপস্থিতি অনুপস্থিতির প্রমাণ নয়, আমি কেন বুঝতে পারি না কেন এটি অনুপস্থিতির বিরুদ্ধে প্রমাণ ।
নলজোক

@ নালজোক আমি লিখেছি "যদি বিকল্পটির যদি পূর্বের সম্ভাবনাটি কিছুটা কম থাকে তবে একটি পরীক্ষা যা শূন্যটিকে প্রত্যাখ্যান করতে ব্যর্থ হয় তা আরও কমবে" যখন "নাল" এটি "এটি" এর নিকটতম বিশেষ্য, নালটি একটি পরিমাণ নয়, এবং সুতরাং হ্রাস করতে পারে না এবং "এটি" এর জন্য কোনও বৈধ পূর্বসূরি নয়। "আরও" ইঙ্গিত করে যে "এটি" ইতিমধ্যে ছোট কিছুকে বোঝায়। এই তথ্যগুলি "এটি" বিকল্পের "ছোট একটি অগ্রাধিকার সম্ভাবনা" হওয়ার পূর্বসূরিটিকে নির্দেশ করে।
একাদিকরণ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.