পরিসংখ্যানবিদরা কেন অ-তাত্পর্যপূর্ণ ফলাফলের অর্থ নাল অনুমানকে গ্রহণ করার বিরোধিতা করে "আপনি নালকে প্রত্যাখ্যান করতে পারবেন না"?


44

দুটি নমুনা টি-টেস্টের মতো Traতিহ্যগত পরিসংখ্যানগত পরীক্ষাগুলিও এই হাইপোথিসিসকে নির্মূল করার চেষ্টা করার দিকে মনোনিবেশ করে যে দুটি স্বতন্ত্র নমুনার ফাংশনের মধ্যে কোনও পার্থক্য নেই। তারপরে, আমরা একটি আত্মবিশ্বাসের স্তরটি বেছে নিই এবং বলি যে যদি উপায়গুলির পার্থক্যটি 95% স্তরের বাইরে হয় তবে আমরা নাল অনুমানটি বাতিল করতে পারি। যদি তা না হয় তবে আমরা "নাল হাইপোথিসিসটি বাতিল করতে পারি না"। এর থেকে বোঝা যাচ্ছে যে আমরা এটি গ্রহণ করতে পারি না। এর অর্থ কি আমরা নিশ্চিত নন অনুমানটি সত্য কিনা?

এখন, আমি একটি পরীক্ষা ডিজাইন করতে চাই যেখানে আমার হাইপোথিসিসটি হ'ল দুটি নমুনার ফাংশন একই (যা গতানুগতিক পরিসংখ্যান পরীক্ষার বিপরীত যেখানে অনুমান যে দুটি নমুনা আলাদা)) সুতরাং, আমার নাল অনুমানটি হয়ে যায় যে দুটি নমুনা আলাদা। আমি কিভাবে এই ধরনের একটি পরীক্ষা ডিজাইন করা উচিত? এটি কি এত সহজে বলা যায় যে পি-মান 5% এর চেয়ে কম হলে আমরা অনুমানটি গ্রহণ করতে পারি যে কোনও তাত্পর্য নেই?



উপায়ের পার্থক্য 95% স্তরের বাইরে, আমরা নাল অনুমানটি বাতিল করতে পারি। 95% এটি "স্তর" নয় এটি 100 টি ক্ষেত্রে (তুলনা) এর মধ্যে 95 টি ক্ষেত্রে এখানে রয়েছে, নমুনা-পরিসংখ্যানগুলির মধ্যে পার্থক্য নমুনা ওঠানামার কারণে দেখা দেয়। এর অর্থ হল যে আলফা = .05 এ নাল গ্রহণ করা হবে। 95% স্তর বলা সঠিক শব্দ নয়।
সুভাষ সি। দাবার

উত্তর:


44

Ditionতিহ্যগতভাবে, নাল অনুমান একটি বিন্দু মান। (এটি সাধারণত তবে বাস্তবে এটি কোনও বিন্দু মান হতে পারে)) বিকল্প অনুমানটি হ'ল আসল মানটি নাল মান ব্যতীত অন্য কোনও মান । যেহেতু একটি অবিচ্ছিন্ন পরিবর্তনশীল (যেমন একটি গড় পার্থক্য) একটি মান গ্রহণ করতে পারে যা অনির্দিষ্টকালের জন্য নাল মানের নিকটে থাকে তবে তবুও এটি সমান নয় এবং এইভাবে নাল অনুমানকে মিথ্যা করে তোলে, তাই একটি aতিহ্যগত বিন্দু নাল অনুমানটি প্রমাণিত হতে পারে না। 0

আপনার নাল হাইপোথিসিস কল্পনা হয় , আর গড় পার্থক্য আপনি পালন করি । নাল অনুমানটি সত্য বলে ধরে নেওয়া কি যুক্তিসঙ্গত? আপনি এখনও জানেন না; আমাদের আত্মবিশ্বাসের ব্যবধানটি দেখতে কেমন তা জানতে সহায়ক হবে । ধরা যাক যে আপনার 95% আত্মবিশ্বাসের ব্যবধানটি । এখন, আমরা কি এই সিদ্ধান্তে পৌঁছাতে পারি যে আসল মান ? আমি এটি বলতে স্বাচ্ছন্দ্য বোধ করব না, কারণ সিআই খুব প্রশস্ত, এবং অনেকগুলি, বৃহত্তর অ-শূন্য মান রয়েছে যা আমরা যুক্তিযুক্তভাবে সন্দেহ করতে পারি যে আমাদের ডেটার সাথে সামঞ্জস্যপূর্ণ। সুতরাং আসুন আমরা বলি যে আমরা অনেক বেশি তথ্য সংগ্রহ করি এবং এখন আমাদের পর্যবেক্ষণের গড় পার্থক্য , তবে 95% সিআই0.01 ( - 4.99 , 5.01 ) 0 0.01 ( 0.005 , 0.015 )00.01(4.99, 5.01)00.01(0.005, 0.015)। পর্যবেক্ষণ করা গড় পার্থক্য একই থাকে (যা সত্যিই ঘটে যদি আশ্চর্যজনক হয়) তবে আত্মবিশ্বাসের ব্যবধানটি এখন নাল মান বাদ দেয়। অবশ্যই, এটি কেবল একটি চিন্তার পরীক্ষা, তবে এটির প্রাথমিক ধারণাগুলি পরিষ্কার করা উচিত। আমরা কখনই প্রমাণ করতে পারি না যে আসল মানটি কোনও নির্দিষ্ট পয়েন্টের মান; আমরা কেবলমাত্র (সম্ভবত) প্রমাণ করতে পারি যে এটি কিছু পয়েন্টের মান। পরিসংখ্যান অনুমানের পরীক্ষায়, পি-মান> 0.05 (এবং 95% সিআই-এর শূন্য অন্তর্ভুক্ত) এর অর্থ এই যে নাল অনুমানটি সত্য কিনা আমরা নিশ্চিত নই

আপনার কংক্রিটের ক্ষেত্রে, আপনি এমন কোনও পরীক্ষা তৈরি করতে পারবেন না যেখানে বিকল্প অনুমানটি হ'ল গড় পার্থক্য এবং নাল অনুমানটি শূন্য ব্যতীত অন্য কিছু। এটি অনুমানের পরীক্ষার যুক্তি লঙ্ঘন করে। এটি পুরোপুরি যুক্তিসঙ্গত যে এটি আপনার সংক্ষিপ্ত, বৈজ্ঞানিক অনুমান, তবে অনুমানের পরীক্ষার পরিস্থিতিতে এটি আপনার বিকল্প অনুমান হতে পারে না cannot 0

তো তুমি কি করতে পার? এই পরিস্থিতিতে আপনি সমতুল্য পরীক্ষা ব্যবহার করেন। (আপনি ট্যাগটিতে ক্লিক করে এই বিষয়ে আমাদের কয়েকটি থ্রেডের মাধ্যমে পড়তে চাইতে পারেন )) সাধারণ কৌশলটি দুটি তরফা পরীক্ষার পদ্ধতির ব্যবহার করা। খুব সংক্ষেপে, আপনি একটি বিরতি নির্বাচন করেছেন যার মধ্যে আপনি বিবেচনা করবেন যে সত্যিকারের পার্থক্যটিও হতে পারে0আপনি যে সমস্ত যত্ন নিতে পারেন তার জন্য, তবে পর্যবেক্ষণকৃত মানটি অন্তরের উপরের সীমানার চেয়ে কম কিনা তা নির্ধারণ করার জন্য আপনি একতরফা পরীক্ষা চালিয়ে যান এবং এটি নীচের গণ্ডির চেয়ে বড় কিনা তা দেখার জন্য আরও একতরফা পরীক্ষা করুন। যদি এই উভয় পরীক্ষাই তাৎপর্যপূর্ণ হয়, তবে আপনি এই অনুমানটিকে প্রত্যাখ্যান করেছেন যে সত্যিকারের মানটি আপনার যত্নের অন্তরালের বাইরে। যদি একটি (বা উভয়) অ-তাৎপর্যপূর্ণ হয় তবে আপনি এই অনুমানটিকে অস্বীকার করতে ব্যর্থ হন যে আসল মান অন্তরালের বাইরে।

উদাহরণস্বরূপ, ধরুন অন্তরালের মধ্যে যে কোনও কিছু শূন্যের এত কাছাকাছি রয়েছে যে আপনি মনে করেন এটি আপনার উদ্দেশ্যগুলির জন্য মূলত শূন্যের সমান, সুতরাং আপনি এটিকে আপনার মূল অনুমান হিসাবে ব্যবহার করেন। এখন কল্পনা করুন যে আপনি উপরে বর্ণিত প্রথম ফলাফল পেয়েছেন। যদিও সেই ব্যবধানের মধ্যে পড়ে তবে আপনি একতরফা টি-টেস্টের মধ্যে নাল অনুমানটি বাতিল করতে সক্ষম হবেন না, তাই আপনি নাল অনুমানটিকে প্রত্যাখ্যান করতে ব্যর্থ হবেন। অন্যদিকে, কল্পনা করুন যে আপনি উপরে বর্ণিত দ্বিতীয় ফলাফল পেয়েছেন। এখন আপনি দেখতে পেয়েছেন যে পর্যবেক্ষণ করা মানটি নির্ধারিত ব্যবধানের মধ্যে পড়ে এবং এটি উপরের বাউন্ডের চেয়ে কম এবং নীচের গণ্ডির চেয়েও বেশি উভয়ই প্রদর্শিত হয়, সুতরাং আপনি নালটিকে প্রত্যাখ্যান করতে পারেন। (এটি লক্ষণীয় যে আপনি উভয়ই প্রত্যাখ্যান করতে পারেন0.01 0 ( - 0.02 , 0.02 )(0.02, 0.02)0.01অনুমান যে সত্য মান , এবং অনুমান যে সত্য মানটি অন্তরালের বাইরে থাকে , যা প্রথমে বিভ্রান্ত বলে মনে হতে পারে তবে অনুমানের পরীক্ষার যুক্তির সাথে সম্পূর্ণ সুসংগত।) 0(0.02, 0.02)


1
"Traতিহ্যগতভাবে, নাল অনুমান একটি বিন্দু মূল্য" - যদিও কিছু ক্ষেত্রে আমরা নাল অনুমানটি লিখি যেমন এটি বিন্দু, তবুও আসলে এটি যৌগিক । আমি আগ্রহী যে আপনার প্রথম অনুচ্ছেদে যুক্তিটি কীভাবে একতরফা পরীক্ষার জন্য জড়িত। (যেহেতু আমরা জানি না - একতরফা পরীক্ষার জন্য এমনকি " গ্রহণ করুন" লিখুন , আমি নিশ্চিত নই যে প্রথম অনুচ্ছেদে আমরা " গ্রহণ " না লিখার সত্য কারণটি ধরা পড়ে )এইচ 0H0H0
সিলভারফিশ

1
@ সিলভারফিশ, অনুচ্ছেদটি এখানে শেষ হবে: "একটি aতিহ্যবাহী বিন্দু নাল অনুমানটি প্রমাণিত হতে পারে না"। তবে আমরা একই কারণে একতরফা পরীক্ষার জন্য " "ও লিখি না । যখন , সত্য হতে পারে তবে নির্বিচারে ঘনিষ্ঠভাবে এবং তাত্পর্যপূর্ণ নয়। আপনি যদি সত্যিই এটি দেখাতে চেয়েছিলেন তবে আপনি একতরফা পরীক্ষার দিকটি সরিয়ে ফেলতে পারেন। আমি এখানে কোন সমস্যা দেখছি না। H0H0:δ0δ>0<0
গুং - মনিকা পুনরায়

1
আপনি যা লিখেছেন তা ভুল বলে আমি বলছি না এবং আমার সন্দেহ হয়েছিল যে আপনি যে যোগাযোগের চেষ্টা করছেন তা এই ধারণা। স্পষ্টতই যে কারণে আপনি আপনার উত্তরের প্রথম দুটি অনুচ্ছেদে বিন্দু অনুমানের সাথে দ্বি-পার্শ্বিক পরীক্ষাটি মোকাবেলা করেছেন, সেটিই এই প্রশ্নটির ক্ষেত্রে। তবে যদি আপনার উত্তরটি যদি কেউ সাধারণভাবে " গ্রহণ করে না" তা ভেবে কেউ যদি পুনরায় পড়েন তবে তাদের কাছে এটি স্পষ্ট হতে পারে না যে আপনার যুক্তিটি মূলত নাল অনুমানের বাইরেও প্রসারিত। H0
সিলভারফিশ

4
"আমরা কখনই প্রমাণ করতে পারি না যে সত্যিকার মানটি কোনও নির্দিষ্ট বিন্দু মূল্য; আমরা কেবলমাত্র (সম্ভবত) প্রমাণ করতে পারি যে এটি কিছু পয়েন্ট মান" পয়েন্টের একটি নির্দিষ্ট ক্ষেত্রে - সিআই যদি পরিণত হয় তবে কী হবে (-0.015 , -0.005)? আমরা যে পরিমাণে "প্রমাণিত" (আমি জানি আপনি আক্ষরিক, গাণিতিক অর্থে "প্রমাণ" ব্যবহার করেন না - সম্ভবত "প্রদর্শিত" বা "প্রস্তাবনা" উদ্দিষ্ট অর্থের নিকটে রয়েছে) মনে হয় আমাদের রয়েছে এছাড়াও "প্রমাণিত" , তবুও আমরা "δ 0 এইচ 0 :δ0δ0H0:δ0
সিলভারফিশ

1
@ সিলভারফিশ আমার মনে হয় আপনার শেষ মন্তব্যটি একটি ভাল বক্তব্য রাখে। আমি অনুভব করি যে, দার্শনিকভাবে, সাথে একতরফা পরীক্ষা point সাথে দ্বি-পার্শ্ব থেকে কিছুটা আলাদা , যদিও গাণিতিকভাবে তারা প্রায় একই। পয়েন্ট নাল গ্রহণ করা অর্থপূর্ণ নয়; কিন্তু বিপরীতে আসলে তাদের মধ্যে একটির (বা একটি অনিবার্য ফলাফল) গ্রহণ করতে পারে। প্লাস একতরফা পরীক্ষা বায়েশীয় দৃষ্টিকোণ থেকে আরও বোধগম্য হয়। প্লাস বৈজ্ঞানিক পূর্বাভাসের একটি দিক থাকা উচিত। আমার ধারনা আমি ভাবতে শুরু করি যে একতরফা পরীক্ষার যথেষ্ট প্রশংসা হয় না। এইচ 0 : δ = 0 δ > 0 δ < 0H0:δ<0H0:δ=0δ>0δ<0
অ্যামিবা বলছেন মনিকা

28

নাল হাইপোথিসিসের ক্ষেত্রে বিবেচনা করুন যে একটি মুদ্রা 2 মাথাযুক্ত, অর্থাত্ মাথাগুলির সম্ভাবনা 1 Now এখন তথ্যটি একটি মুদ্রা একবারে উল্টানো এবং মাথা দেখার ফলাফল seeing এটির ফলাফল প্রতিটির যুক্তিযুক্ত আলফার চেয়ে বড় যা 1.0 এর পি-মান হয়। এর অর্থ কি মুদ্রাটি 2 মাথাযুক্ত? এটি হতে পারে, তবে এটি একটি ন্যায্য মুদ্রাও হতে পারে এবং আমরা সুযোগের কারণে মাথা দেখতে পেলাম (সময়টি 50% একটি ন্যায্য মুদ্রার সাথে ঘটবে)। সুতরাং এই ক্ষেত্রে উচ্চ পি-মান বলে যে পর্যবেক্ষণ করা ডেটা নালীর সাথে পুরোপুরি সুসংগত তবে এটি অন্যান্য সম্ভাবনার সাথেও সামঞ্জস্যপূর্ণ।

আদালতে "নট গাল্টি" রায় যেমন বোঝাতে পারে আসামিরা নির্দোষ, তেমনি এটিও হতে পারে কারণ বিবাদী দোষী তবে পর্যাপ্ত প্রমাণ নেই। নাল হাইপোথিসিসের সাথে আমরাও তা প্রত্যাখ্যান করতে পারি না কারণ নালটি সত্য হতে পারে, বা এটি মিথ্যা হলেও আমাদের কাছে প্রত্যাখ্যান করার পর্যাপ্ত প্রমাণ নেই।


3
আমি "দোষী নয়" উদাহরণটি পছন্দ করি। আরও এক ধাপ এগিয়ে, ডিএনএ প্রমাণের ভিত্তিতে পুনরায় খোলার মামলাগুলি যা আমরা অতীতে কীভাবে ব্যবহার করতে হয় তা জানতাম না এবং কিছুটা দৃ overt় প্রত্যয়কেও প্রত্যাখ্যান করা যে কীভাবে আরও বেশি তথ্য যুক্ত করা যে পর্যাপ্ত প্রমাণের জন্য প্রয়োজনীয় তা হতে পারে তার একটি নিখুঁত উদাহরণ is
টমাস স্পিডেল

7

প্রমাণের অনুপস্থিতি অনুপস্থিতির প্রমাণ নয় (বিএমজে-তে একটি আল্টম্যানের শিরোনাম, ব্ল্যান্ড পেপার)। পি-মানগুলি কেবল তখনই অনুপস্থিতির প্রমাণ দেয় যখন আমরা সেগুলি উল্লেখযোগ্য বিবেচনা করি consider অন্যথায় তারা আমাদের কিছুই বলেনা। অতএব, প্রমাণ অনুপস্থিতি। অন্য কথায়: আমরা জানি না এবং আরও ডেটা সাহায্য করতে পারে।


5

নাল হাইপোথিসিস, , সাধারণত আপনার কারণ বলে মনে হয়। প্রায়শই এটি "বর্তমান জ্ঞানের অবস্থা" যা আপনি দেখাতে চান তা পরিসংখ্যানগতভাবেই অসম্ভব।H0

স্বাভাবিক সেট-আপ হাইপোথিসিস পরীক্ষার জন্য কমান হয় টাইপ আমি ভুল , তাই যে সুযোগ আমরা বিকল্প পক্ষে নাল হাইপোথিসিস প্রত্যাখ্যান কমান যদিও সত্য। এটি প্রথমে হ্রাস করার জন্য আমরা ত্রুটিটি বেছে নিয়েছি কারণ যখন সাধারণ জ্ঞানটি সত্য হয় তখন আমরা সাধারণ জ্ঞানকে ওভারট্রোল করতে চাই না।এইচ 0H1H0

আপনার পরীক্ষাটি সবসময় মনে উচিত যে আপনার প্রত্যাশা অনুযায়ী হওয়া উচিত।H0

আমাদের যদি দুটি নমুনা থাকে তবে আমরা একইরূপে বিতরণের আশা করি তবে আমাদের নাল অনুমানটি নমুনাগুলি একই। যদি আমাদের কাছে দুটি নমুনা থাকে যা আমরা আশা করি (বন্যভাবে) আলাদা হবে তবে আমাদের নাল অনুমানটি এগুলি পৃথক।


এবং যদি আমাদের কোন প্রত্যাশা না থাকে তবে এটি এমন হতে পারে যা আমরা কেবল জানি না। এছাড়াও, দুটি নমুনা ভিন্ন বলে অনুমানকে আমরা প্রত্যাখ্যান করতে চাইলে কীভাবে সিদ্ধান্তের রায় কার্যকর হবে?
ryu576

ক্ষেত্রে আপনার কোনও প্রত্যাশা নেই আপনি উভয় ধরণের ত্রুটিই ছোট রাখতে চান তবে এটি সর্বদা সম্ভব হয় না। এটি করার জন্য আপনার অতিরিক্ত ভেরিয়েবল (যেমন নমুনার আকার বাড়ানো) দরকার।
সামিই

2
যেহেতু আমরা নালটিকে প্রত্যাখ্যান করতে পারি তবে এটি সত্য প্রমাণ করতে পারি না নালটি সাধারণত আমরা যা প্রমাণ করতে বা সত্য বলে ধরে নিতে চাই তার বিপরীত। যদি আমরা বিশ্বাস করি যে পার্থক্য রয়েছে তবে নালটির কোনও পার্থক্য হওয়া উচিত না যাতে আপনি এটি অস্বীকার করতে পারেন।
গ্রেগ স্নো

@ গ্রেগ এটি একটি ভাল পদ্ধতির যদি আপনি জানেন আপনি কোনটি সত্য হতে চান যা সম্ভবত স্বাভাবিক ক্ষেত্রে case
কোনওEE

1
"আপনি যা প্রত্যাশা করেন" এবং "তারা পৃথক" এগুলি পরিসংখ্যানগত নয় বলে পরিসংখ্যান অনুমান করা মোটেও হতে পারে না। এটি বিষয়টির জটিলতা অর্জন করে: নাল এবং বিকল্প অনুমানের মধ্যে ভূমিকার ক্ষেত্রে অসমত্বটি নাল অধীনে পরীক্ষার পরিসংখ্যানগুলির নমুনা বিতরণ নির্ধারণ করার ক্ষমতা থেকে প্রাপ্ত হয়, এর সাথে প্রভাবের আকারের দ্বারা বিতরণকে প্যারামিটারাইজ করার প্রয়োজনের তুলনায় বিকল্প অনুমান. বা এটিই নয় যে আমরা "টাইপ আই ত্রুটিটি ন্যূনতম করি": তা কখনই ঘটে না (সর্বনিম্ন সর্বদা 0 হয়)। পরীক্ষাগুলি টাইপ I এবং II ত্রুটির হারের মধ্যে ভারসাম্য চায়
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.