কেন আমরা ০.০৫ স্তরে নাল অনুমানকে প্রত্যাখ্যান করি এবং ০.০ মাত্রায় নয় (যেমন আমরা শ্রেণিবিন্যাসে করি)


11

হাইপোথিসিস পরীক্ষাটি একটি শ্রেণিবিন্যাস সমস্যার অনুরূপ। সুতরাং বলুন, আমাদের কাছে একটি পর্যবেক্ষণ (বিষয়) - এর জন্য দুটি সম্ভাব্য লেবেল রয়েছে - গুনিটি বনাম অ-অপরাধী। অ-অপরাধীকে নাল হাইপোথেসিস হতে দিন। যদি আমরা কোনও শ্রেণিবদ্ধ দৃষ্টিভঙ্গি থেকে সমস্যাটি দেখি তবে আমরা একটি শ্রেণিবদ্ধ প্রশিক্ষণ দেব যা ডেটা প্রদত্ত, 2 টি শ্রেণীর প্রত্যেকের অন্তর্গত বিষয়টির সম্ভাবনা পূর্বাভাস দেবে। আমরা তখন সর্বোচ্চ সম্ভাবনা সহ ক্লাসটি বেছে নেব। সেক্ষেত্রে 0.5 সম্ভাবনা হ'ল প্রাকৃতিক প্রান্তিকতা। ফলস পজিটিভ বনাম ফলস নেতিবাচক ত্রুটিগুলিতে আমরা বিভিন্ন ব্যয় নির্ধারণের ক্ষেত্রে আমরা প্রান্তিকতা পরিবর্তিত করতে পারি। তবে খুব কমই আমরা ০.০৫-এ প্রান্তিকতা স্থাপনের মতো চূড়ান্তভাবে এগিয়ে যাব, অর্থাৎ সম্ভাবনা ০.৯৯ বা তার চেয়ে বেশি হলে কেবলমাত্র ক্লাস "গুনিটি" তে বিষয় নির্ধারণ করুন। তবে আমি যদি ভালভাবে বুঝতে পারি, হাইপোথেসিস পরীক্ষার সমস্যা হিসাবে একই সমস্যাটি আমরা যখন দেখি আমরা এটি একটি স্ট্যান্ডার্ড অনুশীলন হিসাবে করছি। এই পরবর্তী ক্ষেত্রে, আমরা "অ-অপরাধী" লেবেলটি "দোষী" হিসাবে নির্ধারণের জন্য প্রয়োজনীয় নয় - কেবল যদি "অ-দোষী" হওয়ার সম্ভাবনা 5% এর কম হয়। এবং সম্ভবত আমরা যদি নির্দোষ মানুষকে দোষী সাব্যস্ত করতে এড়াতে চাই তবে তা বোধগম্য হতে পারে। তবে কেন এই নিয়মটি সমস্ত ডোমেন এবং সমস্ত ক্ষেত্রে প্রাধান্য পাবে?

কোন হাইপোথিসিস গ্রহণ করবেন তা সিদ্ধান্ত নেওয়া তথ্য প্রদত্ত সত্যের একটি অনুমানের সংজ্ঞা দেওয়ার সমতুল্য। সর্বাধিক সম্ভাবনা অনুমানের মধ্যে আমরা হাইপোথেসিসকে গ্রহণ করি যা সম্ভবত ডেটা প্রদত্ত হয় - অগত্যা অপ্রতিরোধ্যভাবে বেশি হওয়ার সম্ভাবনা নেই। নীচের গ্রাফটি দেখুন:

এখানে চিত্র বর্ণনা লিখুন

সর্বাধিক সম্ভাবনার পন্থা ব্যবহার করে আমরা এই উদাহরণে বিকল্প হাইপোথিসিসের পক্ষে থাকি যদি ভবিষ্যদ্বাণীকারীর মান 3 এর উপরে হয়, উদাহরণস্বরূপ 4, যদিও নাল হাইপোথেসিস থেকে প্রাপ্ত এই মানটির সম্ভাবনা 0.05 এর চেয়ে বড় হত।

এবং যদিও আমি উদাহরণটি দিয়ে পোস্টটি শুরু করেছি তা সম্ভবত আবেগগতভাবে চার্জ করা হয়েছে, আমরা অন্যান্য ক্ষেত্রে যেমন, প্রযুক্তিগত উন্নতি সম্পর্কে ভাবতে পারি। আমাদের কেন স্থিতাবস্থায় এমন সুবিধা দেওয়া উচিত যখন ডেটা আমাদের জানায় যে নতুন সমাধানটি উন্নতি হওয়ার সম্ভাবনাটি না হওয়ার সম্ভাবনার চেয়ে বেশি?


1
মূলত এটি আরএ ফিশারের বৈজ্ঞানিক সরঞ্জাম হিসাবে পরিসংখ্যানগুলির দৃষ্টিভঙ্গির উপর ভিত্তি করে তৈরি করা হয়েছে (একসময় একটি অনুমানকে বিশ্বাস করুন, যতক্ষণ না আপনি এর বিরুদ্ধে পর্যাপ্ত প্রমাণ না পান) এবং তার অভিজ্ঞতা যে স্ট্যান্ডার্ড বিচ্যুতিগুলি নাল অনুমানকে প্রায়শই প্রত্যাখ্যান করার মধ্যে একটি দরকারী ভারসাম্য সরবরাহ করেছিল বলে মনে হয় এবং প্রায়শই পর্যাপ্ত নয়2
হেনরি

1
ওপিটি ঠিক আছে যে এখানে ভিত্তিটি ত্রুটিযুক্ত, শাস্ত্রীয় এনএইচএসটি পদ্ধতিতে এমন কোনও কিছুই নেই যা আমাদের 5% এ প্রত্যাখ্যান করতে হবে requires এটি বিতর্কযোগ্য মূল্যের একটি সাংস্কৃতিক ঘটনা।
ম্যাথু ড্রুরি

1
@Matthew Drury: "বাস্কেটবল দলের জন্য লম্বা মানুষ পছন্দ করে" একটি কৌশল হিসেবে ত্রুটিপূর্ণ নয় শুধু কারণ এটি অন্তর্ভুক্ত নয় কত লম্বা একটি সুনির্দিষ্ট নিয়ম হিসাবে। যদিও আপনারা জানেন যে প্রচুর অন্যান্য সমস্যা রয়েছে তবে ব্যবহারকারীকে লাইনটি কোথায় আঁকতে হবে তা বেছে নেওয়া NHST এর বৈশিষ্ট্য। আমার ঝুঁকিপূর্ণ প্রতিরোধের ফলে প্যারিস বা লন্ডনের সাম্প্রতিক ভ্রমণের বিষয়টি অস্বীকার করা হয়নি তবে এটি অনেক দেশ সফরকে বাতিল করে দেবে: অন্যান্য লোকেরা এই লাইনটি আলাদাভাবে আঁকবে। আমি সম্মত হই যে এতক্ষণে একটি সাংস্কৃতিক ঘটনা [sic] রয়েছে যতক্ষণে অনুমানগুলি প্রত্যাখ্যান করার বিষয়ে বিভিন্ন গোষ্ঠীর বিভিন্ন কনভেনশন রয়েছে।
নিক কক্স

আমি নিশ্চিত আপনি আমার মন্তব্য নিক যা পড়ছেন। আমি মনে করি আমার আরও পরিষ্কার হওয়া উচিত ছিল। আমি কেবলমাত্র লোকেরা নির্দিষ্ট নির্দিষ্ট প্রান্তিক মান নির্ধারণের জন্য আরও চিন্তাভাবনা করা চাই।
ম্যাথু ড্রুরি

আপনি (এডি) বলে যাচ্ছেন বলে মনে হচ্ছে যে এনএইচএসটি ত্রুটিযুক্ত কারণ এটি একটি নির্দিষ্ট প্রত্যাখ্যান স্তরকে বোঝায় না। সমস্যা-নির্দিষ্ট থ্রেশহোল্ড সম্পর্কে আমি আপনার সাথে একমত।
নিক কক্স

উত্তর:


17

বলুন আপনি আদালতে এসেছেন এবং আপনি তা করেননি। আপনি কি মনে করেন যে এটি এখনও ঠিক যে আপনার এখনও দোষী সাব্যস্ত হওয়ার 50% সম্ভাবনা রয়েছে? " যুক্তিসঙ্গত সন্দেহের বাইরে অপরাধী" নির্দোষ হওয়ার কি 50% সম্ভাবনা আছে ? আপনি কি মনে করেন যে এটি আপনার পক্ষে উপযুক্ত না হলেও আপনি দোষী সাব্যস্ত হওয়ার 5% সুযোগ পেয়েছেন? আমি আদালতে থাকলে আমি 5% যথেষ্ট রক্ষণশীল না বিবেচনা করব।

আপনি ঠিক বলেছেন যে 5% নির্বিচারে। আমরা ঠিক পাশাপাশি 2% বা 1% বা আপনি নার্দি- % বা % বেছে নিতে পারি। এমন লোকেরা আছেন যারা 10% গ্রহণ করতে ইচ্ছুক, তবে 50% কখনও গ্রহণযোগ্য হবে না।πe


আপনার প্রশ্নের সম্পাদনার জবাবে:

সমস্ত অনুমান সমানভাবে তৈরি করা হলে আপনার ধারণাটি যুক্তিসঙ্গত হবে। যাই হোক, এটা ব্যপার না। আমরা সাধারণত বিকল্প অনুমানের বিষয়ে যত্নশীল, তাই আমরা যদি কম বেছে নিই তবে আমরা আমাদের যুক্তি জোরদার করব । সেই অর্থে, আপনি যে উদাহরণটি মূলত বেছে নিয়েছেন সেটি সেই পয়েন্টটি ভালভাবে তুলে ধরে।α


6
+1 "5% নির্বিচারে"। একাডেমিয়ার পরিসংখ্যানবিদ: "আমরা কারণ তারা শিল্পে ব্যবহার করে"। শিল্পের পরিসংখ্যানবিদ: "আমরা ব্যবহার করি কারণ আমাদের বিশ্ববিদ্যালয়ে পড়ানো হয়েছিল"। α = 0.05α=0.05α=0.05
নরমসেই

8

এটি আপনারা বলার মতো - এটি মিথ্যা পজিটিভ এবং মিথ্যা নেতিবাচক ত্রুটিগুলি কতটা গুরুত্বপূর্ণ তার উপর নির্ভর করে।

আপনি যে উদাহরণটি ব্যবহার করেছেন, যেমন মার্টেন বুইস ইতিমধ্যে উত্তর দিয়েছিলেন, যদি আপনি নির্দোষ ছিলেন এমন ৫০% সম্ভাবনা থাকে তবে দোষী সাব্যস্ত হওয়া খুব কমই ন্যায্য।

এটি গবেষণায় প্রয়োগ করার সময়, এইভাবে দেখুন: আপনি কল্পনা করুন যে কোনও নতুন ওষুধ কোনও নির্দিষ্ট রোগের বিরুদ্ধে সহায়তা করে কিনা। বলুন যে আপনি চিকিত্সার পক্ষে আপনার চিকিত্সা গ্রুপ এবং আপনার নিয়ন্ত্রণ গোষ্ঠীর মধ্যে পার্থক্য খুঁজে পেয়েছেন। গ্রেট! ওষুধ অবশ্যই কাজ করবে? আপনি নাল কল্পনাটি বাতিল করতে পারেন যে ওষুধটি কার্যকর হয় না। আপনার পি -মূল্য 0.49! এর চেয়ে বেশি সম্ভাবনা রয়েছে যে আপনি যে প্রভাবটি পেয়েছেন তা সুযোগের বদলে সত্যের ভিত্তিতে ছিল!
এখন এটি বিবেচনা করুন: ওষুধের বাজে প্রতিকূল প্রভাব রয়েছে। আপনি কেবলমাত্র এটি গ্রহণ করতে চান যদি আপনি নিশ্চিত হন যে এটি কাজ করে। এবং তুমি? না, কারণ এখনও 51% সম্ভাবনা রয়েছে যে আপনি দুটি দলের মধ্যে যে পার্থক্যটি পেয়েছেন তা নিছক সুযোগের দ্বারা।

আমি কল্পনা করতে পারি যে এমন কয়েকটি ডোমেন রয়েছে যেখানে আপনি যেমন 10% সন্তুষ্ট। আমি নিবন্ধগুলি দেখেছি যেখানে 10% গৃহীত হয়। আমি নিবন্ধগুলিও দেখেছি যেখানে তারা 2% পছন্দ করেছে। এটি আপনার পক্ষে কতটা গুরুত্বপূর্ণ মনে হয় তার উপর নির্ভর করে যে আপনি নিশ্চিত যে নাল অনুমানকে প্রত্যাখ্যান করা সত্যের ভিত্তিতে হবে এবং সুযোগের ভিত্তিতে নয়। আমি এমন কোনও পরিস্থিতি খুব কমই কল্পনা করতে পারি যেখানে আপনি 50% সুযোগ নিয়ে সন্তুষ্ট যে পার্থক্যটি আপনি পেয়েছেন নিখুঁত ভাগ্যের উপর ভিত্তি করে।


5

অন্যান্য উত্তরগুলি নির্দেশ করেছে যে এটি সমস্ত নির্ভর করে যে আপনি কীভাবে বিভিন্ন সম্ভাব্য ত্রুটিগুলি তুলনামূলকভাবে মূল্যবান হন এবং বৈজ্ঞানিক প্রেক্ষাপটে সম্ভাব্যভাবে যথেষ্ট যুক্তিসঙ্গত, আরও কঠোর মানদণ্ডও সম্ভাব্য বেশ যুক্তিসঙ্গত, তবে এটি এর সম্ভাবনা কম যুক্তিসঙ্গত হতে. এটি সত্য, তবে আমাকে এটিকে অন্য দিকে নিয়ে যাওয়া এবং প্রশ্নের পিছনে থাকা অনুমানকে চ্যালেঞ্জ জানাতে দিন। .50.05.50


আপনি "[এইচ] ypothesis পরীক্ষা [যেমন] একটি শ্রেণিবিন্যাস সমস্যার অনুরূপ" নেন। এখানে আপাত সাদৃশ্য কেবলমাত্র মাত্রাতিরিক্ত; এটি একটি অর্থবহ অর্থে সত্য নয়।

বাইনারি শ্রেণিবদ্ধকরণের সমস্যায় সত্যিকার অর্থে মাত্র দুটি শ্রেণি রয়েছে; যে একেবারে এবং একটি অগ্রাধিকার প্রতিষ্ঠিত হতে পারে। হাইপোথিসিস টেস্টিং এর মতো নয়। আপনার চিত্রটি একটি নাল এবং একটি বিকল্প অনুমান প্রদর্শন করে যেহেতু তারা প্রায়শই স্ট্যাটাস 101 শ্রেণিতে কোনও শক্তি বিশ্লেষণ বা হাইপোথিসিস টেস্টিংয়ের যুক্তি চিত্রিত করার জন্য আঁকা হয়। চিত্রটি বোঝায় যে একটি নাল অনুমান এবং একটি বিকল্প অনুমান আছে। যদিও এটি (সাধারণত) সত্য যে কেবল একটি নাল রয়েছে, বিকল্পটি (বলুন) পার্থক্যটির কেবলমাত্র একক পয়েন্টের মান হিসাবে নির্ধারিত নয়। অধ্যয়নের পরিকল্পনা করার সময়, গবেষকরা প্রায়শই তারা সনাক্ত করতে সক্ষম হতে চান এমন একটি ন্যূনতম মান নির্বাচন করবেন। আসুন আমরা কিছু নির্দিষ্ট গবেষণায় এটি গড় শিফট বলে মনে করি.67.67এসডিএস। সুতরাং তারা সেই অনুযায়ী তাদের অধ্যয়নের নকশা ও ক্ষমতা তৈরি করে। এখন কল্পনা করুন যে ফলাফলটি তাৎপর্যপূর্ণ, তবে সম্ভবত কোনও মান হিসাবে দেখা যাচ্ছে না। ঠিক আছে, তারা কেবল দূরে চলে না! গবেষকরা তবুও এই সিদ্ধান্তে পৌঁছাতে পারবেন যে চিকিত্সা একটি পার্থক্য তৈরি করে, তবে তাদের ফলাফলের ব্যাখ্যা অনুসারে প্রভাবের প্রবণতা সম্পর্কে তাদের বিশ্বাসকে সামঞ্জস্য করে। যদি একাধিক অধ্যয়ন হয়, একটি মেটা-বিশ্লেষণ তথ্য জমে যাওয়ার সাথে সাথে সত্যের প্রভাবটি সংশোধন করতে সহায়তা করবে। অন্য কথায়, অধ্যয়ন পরিকল্পনার সময় যে বিকল্পটি লাভজনক হয়েছিল (এবং এটি আপনার চিত্রে অঙ্কিত হয়েছে) এটি সত্যই একক বিকল্প নয় যে গবেষকরা অবশ্যই এটির এবং নালকে তাদের একমাত্র বিকল্প হিসাবে বেছে নিতে পারেন। .67

আসুন এই সম্পর্কে একটি ভিন্ন উপায়। আপনি বলতে পারেন যে এটি বেশ সহজ: হয় নাল অনুমানটি সত্য বা এটি মিথ্যা, সুতরাং সত্যিই কেবল দুটি সম্ভাবনা রয়েছে। তবে নালটি সাধারণত একটি পয়েন্ট ভ্যালু (যেমন, ) এবং নালটি মিথ্যা হওয়া সহজভাবে বোঝায় যে ঠিক ব্যতীত অন্য কোনও মানই আসল মান। যদি আমরা মনে করি যে একটি বিন্দুর কোনও প্রস্থ নেই, তবে মূলত সংখ্যা রেখার বিকল্পটি সত্য হওয়ার সাথে মিলে যায়। সুতরাং, যদি না আপনার পর্যবেক্ষণের ফলাফল (অর্থাত্ শূন্য থেকে অসীম দশমিক স্থানে) না থাকে, আপনার ফলাফলটি (যেমন, চেয়ে কিছু অ মানের কাছাকাছি থাকবে ie0 100 % 0. ˉ 0 0 0 পি < .500100%0.0¯00p<.5)। ফলস্বরূপ, আপনি সর্বদা নাল অনুমানটি মিথ্যা বলে শেষ করবেন। এটিকে স্পষ্ট করার জন্য, আপনার প্রশ্নের ভুল ভিত্তিটি হ'ল এখানে একটি একক, অর্থবহ নীল রেখা রয়েছে (আপনার চিত্রে চিত্রিত হিসাবে) আপনার পরামর্শ অনুসারে ব্যবহার করা যেতে পারে।

উপরের প্রয়োজন সবসময় ক্ষেত্রে হওয়া উচিত নয়। এটি কখনও কখনও ঘটে যায় যে দুটি ঘটনাক্রমে একটি ঘটনা সম্পর্কে বিভিন্ন পূর্বাভাস দেয় যেখানে তত্ত্বগুলি যথাযথ পয়েন্টের অনুমান এবং সম্ভবত নমুনা বিতরণ উপস্থাপনের জন্য যথেষ্ট ভাল গাণিত হয়। তারপরে, তাদের মধ্যে পার্থক্য করার জন্য একটি সমালোচনা পরীক্ষা করা যেতে পারে। এ জাতীয় ক্ষেত্রে কোনও তত্ত্বই নাল হিসাবে গ্রহণ করা প্রয়োজন না এবং সম্ভাবনা অনুপাতকে এক বা অন্য তত্ত্বের পক্ষে প্রমাণের ওজন হিসাবে গ্রহণ করা যেতে পারে। আপনার আলফা হিসাবে গ্রহণের সাথে এই ব্যবহারটি উপমা হবে । তাত্ত্বিক কোন কারণ নেই যে এই দৃশ্যটি বিজ্ঞানের মধ্যে সবচেয়ে সাধারণ হতে পারে না, এটি কেবল ঘটে যায় যে বেশিরভাগ ক্ষেত্রে এইরকম দুটি তত্ত্ব থাকা খুব বিরল। .50


3

পূর্ববর্তী উত্তম উত্তরে যুক্ত করার জন্য: হ্যাঁ, 5% নির্বিচারে, তবে আপনি যে নির্দিষ্ট প্রান্তিক বাছাই করেন তা নির্বিশেষে এটি যুক্তিযুক্তভাবে ছোট হতে হবে, অন্যথায় হাইপোথিসিস পরীক্ষাটি কোনও অর্থবহ নয়।

আপনি একটি প্রভাব সন্ধান করছেন এবং নিশ্চিত করতে চান যে আপনার ফলাফল খালি সুযোগের কারণে হয়নি। সেই পরিমাণে, আপনি একটি তাত্পর্য স্তর নির্ধারণ করেছেন যা মূলত বলেছে "যদি বাস্তবে কোনও প্রভাব না ঘটে (নাল অনুমানটি সত্য হয়) তবে খাঁটি সুযোগের ফলে এখনও এই জাতীয় ফলাফল (বা আরও চরম) পাওয়ার সম্ভাবনা থাকবে" । এটি অত্যধিক উচ্চে সেট করার ফলে প্রচুর মিথ্যা ইতিবাচক ফলাফল আসবে এবং আপনার গবেষণামূলক প্রশ্নের সার্থক উত্তর পাওয়ার দক্ষতা হ্রাস করবে।

সর্বদা হিসাবে, একটি বাণিজ্য-জড়িত রয়েছে, তাই গবেষণা সম্প্রদায়টি এই 5% নির্দেশিকা নিয়ে আসে। তবে এটি বিভিন্ন ক্ষেত্রে আলাদা। কণা পদার্থবিজ্ঞানে এটি 0.00001% বা অন্য কিছুর মতো।


0

শ্রেণিবদ্ধকরণ এবং হাইপোথিসিস পরীক্ষাটি আলাদা এবং পৃথকভাবে ব্যবহৃত হয়েছে । বেশিরভাগ ক্ষেত্রে, লোকেরা ব্যবহার করে

  • "ভাগ করা গুণাবলী বা বৈশিষ্ট্য অনুসারে কিছুকে শ্রেণিবদ্ধকরণ" এর কাজটি সম্পাদনের জন্য "শ্রেণিবদ্ধকরণ" "।
  • এবং কিছু "উল্লেখযোগ্য আবিষ্কার" যাচাই করতে "হাইপোথিসিস টেস্টিং" ব্যবহার করুন।

মনে রাখবেন, অনুমানের পরীক্ষায়, "নাল হাইপোথিসিস" হ'ল "সাধারণ জ্ঞান", তবে আমরা যদি নাল অনুমানকে বাতিল করতে পারি তবে আমাদের বিরতি রয়েছে break

এ কারণেই অনুমানের পরীক্ষায় আমাদের আরও কঠোর মানদণ্ড রয়েছে। নতুন ড্রাগগুলি বিকাশের উদাহরণ চিন্তা করুন, আমরা তা উল্লেখযোগ্য এবং কার্যকর বলে বলতে খুব যত্নশীল হতে চাই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.