অনুমানের পরীক্ষায় নাল অনুমানকে কীভাবে নির্দিষ্ট করা যায়


15

নাল অনুমানের জন্য প্রশ্নটি কীভাবে বেছে নেওয়া যায় তার জন্য থাম্বের একটি ভাল নিয়ম কী। উদাহরণস্বরূপ, আমি যদি হাইপোথিসিস বি সত্য কিনা তা খতিয়ে দেখতে চাই, আমি কি বি কে নাল হিসাবে ব্যবহার করব, বি কে বিকল্প অনুমান হিসাবে ব্যবহার করব, বা নট বি হিসাবে নয়? আমি আশা করি প্রশ্নটি পরিষ্কার হয়ে গেছে। আমি জানি যে আমি যে ত্রুটিটি হ্রাস করতে চাই তার সাথে কিছু করার আছে (টাইপ আই?), তবে আমি এটি কীভাবে হয় তা ভুলে যেতে থাকি, কারণ এর জন্য আমার স্পষ্ট কোনও অন্তর্নিহিততা তৈরি হয়নি। ধন্যবাদ।


বলছি ... দুর্দান্ত প্রতিক্রিয়া। সমস্ত সহায়ক। লোকেরা আগ্রহী বলেই আমি ওয়েবে যখন এই স্তরের সহযোগিতাটি পাই তখনও তা আমাকে অবাক করে দেয়। ওহ ধন্যবাদ !
নেস্টর

উত্তর:


17

আমার একজন ভাল পরামর্শদাতার কাছ থেকে থাম্বের একটি নিয়ম হ'ল নাল-হাইপোথেসিসকে আপনি যে পরিণতিটি সত্য হতে চান না তার অর্থ দাঁড়ান ie

বুনিয়াদি উদাহরণ: ধরুন আপনি একটি নতুন চিকিত্সা চিকিত্সা তৈরি করেছেন এবং আপনি এটি দেখাতে চান যে এটি প্লেসবো এর চেয়ে ভাল। তাই আপনি যদি নাল-প্রস্তাব সেট নতুন treament সমান বা প্ল্যাসেবো চেয়েও কঠিন অপরাধ এবং বিকল্প প্রস্তাব এইচ 1 : = নতুন চিকিত্সা প্ল্যাসেবো বেশী ভালো।H0:=H1: =

এটি কারণ একটি পরিসংখ্যানগত পরীক্ষা চলাকালীন আপনি হয় নাল-হাইপোথেসিসকে প্রত্যাখ্যান করেন (এবং বিকল্প হাইপোথিসিসের পক্ষে) বা আপনি এটি অস্বীকার করতে পারবেন না। যেহেতু আপনার "লক্ষ্য" হ'ল নাল-হাইপোথেসিসকে প্রত্যাখ্যান করার জন্য আপনি এটিকে নির্ধারণ করেছেন যে আপনি সত্য হতে চান না।

পার্শ্ব দ্রষ্টব্য: আমি সচেতন যে নাল-হাইপোথেসিস প্রত্যাখ্যান না করা পর্যন্ত এটিকে মোচড়ানোর জন্য একটি স্ট্যাটিসটিকাল টেস্ট স্থাপন করা উচিত নয় এবং কেবল এই নিয়মটি মনে রাখা সহজ করার জন্য নৈমিত্তিক ভাষা ব্যবহৃত হয়েছিল।

এটিও সহায়ক হতে পারে: পরিসংখ্যান পরীক্ষায় পি মান এবং টি মানগুলির অর্থ কী? এবং / অথবা কম্পিউটার বিজ্ঞানীদের জন্য পরিসংখ্যান অনুমানের পরীক্ষার একটি ভাল ভূমিকা কী?


6

হাইপোথিসিস বি যদি আকর্ষণীয় অনুমান হয় তবে আপনি নাল হাইপোটিসিস এবং নিয়ন্ত্রণ হিসাবে নট-বি গ্রহণ করতে পারেন, নাল এর অধীনে, স্তরের ভুলভাবে নন-বি প্রত্যাখ্যানের জন্য টাইপ আই ত্রুটির সম্ভাবনা α । নট-বি প্রত্যাখ্যান করার পরে বি এর পক্ষে প্রমাণ হিসাবে ব্যাখ্যা করা হয় কারণ আমরা টাইপ আই ত্রুটিটি নিয়ন্ত্রণ করি, সুতরাং এটি বি-টি সত্য নয় এমন সম্ভাবনা কম। বিভ্রান্ত ...?

চিকিত্সার উদাহরণ হিসাবে দেখুন বনাম কোনও জনগোষ্ঠীর দুটি গ্রুপে চিকিত্সা নেই। আকর্ষণীয় হাইপোথিসিসটি হ'ল চিকিত্সার একটি প্রভাব রয়েছে, অর্থাত্ চিকিত্সার কারণে চিকিত্সা করা গোষ্ঠী এবং চিকিত্সা না করানো গোষ্ঠীর মধ্যে পার্থক্য রয়েছে difference নাল অনুমানটি এই যে কোনও পার্থক্য নেই এবং আমরা এই অনুমানটিকে ভুলভাবে প্রত্যাখ্যান করার সম্ভাবনাটি নিয়ন্ত্রণ করি control এইভাবে আমরা ভুলভাবে সিদ্ধান্তে নেওয়ার সম্ভাবনাটি নিয়ন্ত্রণ করি যে চিকিত্সার কোনও প্রভাব নেই যখন চিকিত্সার প্রভাব রয়েছে। দ্বিতীয় ধরণের ত্রুটি হ'ল চিকিত্সার প্রভাব থাকলে ভুলভাবে নাল গ্রহণ করার সম্ভাবনা।

উপরের সূত্রটি পরিসংখ্যানগত পরীক্ষার জন্য নেইমন-পিয়ারসন কাঠামোর উপর ভিত্তি করে তৈরি করা হয়েছে, যেখানে পরিসংখ্যানগত পরীক্ষাকে কেস, নাল এবং বিকল্পের মধ্যে সিদ্ধান্তের সমস্যা হিসাবে দেখা হয়। স্তর হ'ল সময়টির ভগ্নাংশ যা আমরা টাইপ 1 ত্রুটি করি যদি আমরা (স্বতন্ত্রভাবে) পরীক্ষার পুনরাবৃত্তি করি। এই কাঠামোটিতে নাল এবং বিকল্পের মধ্যে কোনও আনুষ্ঠানিক পার্থক্য নেই। যদি আমরা নাল এবং বিকল্পটি বিনিময় করি তবে আমরা টাইপ 1 এবং টাইপ II এর ত্রুটিগুলির সম্ভাবনাটি বিনিময় করি। তবে আমরা উপরের ধরণের দ্বিতীয় ত্রুটির সম্ভাব্যতা নিয়ন্ত্রণ করতে পারি নি (এটি চিকিত্সার প্রভাবটি কতটা বড় তার উপর নির্ভর করে) এবং এই অসম্পূর্ণতার কারণে আমরা বলতে পছন্দ করতে পারি যে আমরাα প্রত্যাখ্যান ব্যর্থনাল অনুমান (এর পরিবর্তে আমরা নাল অনুমানটি গ্রহণ করি) accept সুতরাং আমরা এই উপসংহারটি সম্পর্কে সতর্কতা অবলম্বন করা উচিত যে নাল অনুমানটি সত্য কারণ আমরা এটিকে প্রত্যাখ্যান করতে পারি না।

ppppp-মূল্যের কোনও (কাল্পনিক) বারবার সংখ্যক সিদ্ধান্তের দ্বারা ন্যায়সঙ্গত হওয়ার দরকার নেই।

উভয়ই কাঠামোগত সমস্যা ছাড়াই নয় এবং পরিভাষাটি প্রায়শই মিশে যায়। আমি পরিসংখ্যানের প্রমাণ বইটি সুপারিশ করতে পারি : বিভিন্ন ধারণার সুস্পষ্ট চিকিত্সার জন্য রিচার্ড এম রয়্যাল রচিত সম্ভাবনার দৃষ্টান্ত


5

"ঘনঘনবাদী" প্রতিক্রিয়া হ'ল "বি নয়" ফর্মের একটি নাল অনুমান আবিষ্কার এবং তারপরে স্টিফেনের প্রতিক্রিয়া অনুসারে "বি নয়" এর বিরুদ্ধে তর্ক করুন। এটি "আপনারা ভুল, তাই আমাকে অবশ্যই সঠিক হতে হবে" যুক্তি তৈরির যৌক্তিক সমতুল্য। রাজনীতিবিদদের ব্যবহারের ক্ষেত্রে এটিই এক ধরণের যুক্তি (যেমন অন্য পক্ষ খারাপ, সুতরাং আমরা ভাল)। এই ধরণের যুক্তির অধীনে 1 টিরও বেশি বিকল্পকে মোকাবেলা করা বেশ কঠিন। এটি কারণ যে "আপনি ভুল, সুতরাং আমি ঠিক আছি" যুক্তিটি কেবল তখনই বোঝা যায় যখন উভয়ের পক্ষে ভুল হওয়া সম্ভব হয় না, যা একাধিক বিকল্প অনুমানের পরেও ঘটতে পারে।

"বেইসিয়ান" প্রতিক্রিয়াটি হ'ল হাইপোথিসিসের সম্ভাব্যতা যা কেবল আপনি যা পরীক্ষা করতে আগ্রহী, শর্তসাপেক্ষে আপনার কাছে যা প্রমাণ রয়েছে তার উপর নির্ভর করে তা গণনা করা। সর্বদা এর মধ্যে পূর্বের তথ্য থাকে, যা আপনার সমস্যাটিকে ভালভাবে পোষ্ট করার জন্য করা অনুমানগুলিই হয় (সমস্ত পরিসংখ্যানগত পদ্ধতি পূর্বের তথ্যের উপর নির্ভর করে, বায়েশিয়ানগুলি কেবল তাদের আরও স্পষ্ট করে তোলে)। এটি সাধারণত কিছু ডেটা নিয়ে থাকে এবং আমাদের কাছে বায়োস উপপাদ্য থাকে

P(H0|DI)=P(H0|I)P(D|H0I)kP(Hk|I)P(D|HkI)

এই ফর্মটি "নাল" এবং যাকে "বিকল্প" বলা হয় তার থেকে পৃথক, কারণ আপনি যে প্রতিটি অনুমান বিবেচনা করতে যাচ্ছেন তার জন্য ঠিক একই পরিমাণের গণনা করতে হবে - পূর্ব এবং সম্ভাবনা। এটি এক অর্থে নেইমন পিয়ারসন হাইপোথিসিস টেস্টিংয়ে "টাইপ 1" এবং "টাইপ 2" ত্রুটির হার গণনা করার সাথে সমান, কেবল যখন "টাইপ 2" ত্রুটির হারের কারণH0 "নাল" থাকে হিসাবে একই জিনিস হয় সহ "টাইপ 1" ত্রুটির হারH0"বিকল্প" হয়। এটি কেবল "নাল" এবং "বিকল্প" শব্দের দ্বারা বোঝানো অভিব্যক্তি যা এগুলি পৃথক বলে মনে করে। যখন দুটি অনুমান হয় তখন আপনি "নেইম্যান পিয়ারসন লেমমা" এর ক্ষেত্রে সমতা দেখাতে পারেন, এটির জন্য কেবল সম্ভাবনা অনুপাত, যা উপরোক্ত বায়াস উপপাদ্যের মতভেদ গ্রহণ করে একবারে দেওয়া হয়:

P(H0|DI)P(H1|DI)=P(H0|I)P(H1|I)×P(D|H0I)P(D|H1I)=P(H0|I)P(H1|I)×Λ

H0Λ>Λ~Λ~H1L2L1L1L2

Λ1<Λ~1 which is mathematically the same thing (you will make the same decision - but based on inverse chi-square cut-off rather than chi-square for your p-value). Playing word games with "failing to reject the null" just doesn't apply to the hypothesis test, because it is a decision, so if there are only two options, then "failing to reject the null" means the same thing as "accepting the null".


3
That first paragraph is a parody of the classical approach to hypothesis testing.
whuber

Hypothesis testing is not always a matter of making a decision. It's often formulated as such, but in science the question may be to document that the null is false and by how much. I view the word playing game as a reminder of this objective. From this point of view, failing to reject is not a decision to accept but a lack of evidence in the data to reject.
NRH

@NRH - I agree, but that is not always the objective. If you want to test a new theory, you want to know how likely it is to be true, just as much you want to know how likely it is false. And although an hypothesis test does not always directly lead to a decision, it seems like a waste of time to bother with testing it if it will not eventually lead to a decision. You are in fact already formulating a decision in your comment: "act as if the null is false". There is only one alternative to this: "act as if the null is true". If there is more than one alternative, then the hypothesis ...
probabilityislogic

(cont'd).. test has not been well defined, and is "mathematically ill-posed" so to speak. There may be great uncertainty about this decision, but there is no other alternatives, the null can't be not true and not false at the same time, unless you have an ill-posed/ambiguous problem. But in this case hypothesis testing is pointless - there can be no proper conclusion.
probabilityislogic

(continuing the rant) - and if the goal is to simply quantify the evidence against the null, then you don't need a hypothesis test. This is what a p-value is for - you don't need to accept or reject, just report its value.
probabilityislogic

1

The null hypothesis should generally assume that differences in a response variable are due to error alone.

For example if you want to test the effect of some factor A on response x, then the null would be: H0 = There is no effect of A on response x.

Failing to reject this null hypothesis would be interpreted as:

1) any differences in x are due to error alone and not A or,

2) that the data are inadequate to detect a difference even though one exists (see Type 2 error below).

Rejecting this null hypothesis would be interpreted as the alternative hypothesis: Ha = There is an effect of A on response x, is true.

Type 1 and Type 2 errors are related to the use of the null hypothesis but not its designation really. Type 1 error occurs when you reject H0 even though it is true - that is, you incorrectly conclude an effect of A on x when one didn't exist. Type 2 error occurs when you fail to reject the H0 even though it is false - that is, you incorrectly conclude no effect of A on x even though one exists.


1
The third paragraph seems to imply that failing to reject the null means the null is true, but clearly that's wrong: the alternative could be true (and typically is), but does not differ sufficiently from the null to be detected with the given data.
whuber

@whuber - good point, I will edit the answer to reflect this
DQdlM
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.