দ্বি-পুচ্ছ পরীক্ষা ... আমি ঠিক বিশ্বাস করি না। আলোচ্য বিষয়টি কি?


59

নিম্নলিখিত অংশটি এন্ট্রি থেকে পাওয়া যায়, এক-লেজ এবং দুই-লেজ পরীক্ষার মধ্যে পার্থক্য কী? , ইউসিএলএর পরিসংখ্যান সহায়তা সাইটে।

... অন্যদিকে কোনও প্রভাব হারিয়ে যাওয়ার পরিণতি বিবেচনা করুন। কল্পনা করুন যে আপনি একটি নতুন ওষুধ তৈরি করেছেন যা আপনি বিশ্বাস করেন যে বিদ্যমান ড্রাগের চেয়ে উন্নতি an আপনি উন্নতি সনাক্তকরণের সক্ষমতা সর্বাধিক করতে চান, সুতরাং আপনি একটি লেজযুক্ত পরীক্ষার জন্য বেছে নিন। এটি করার ক্ষেত্রে, আপনি যে ওষুধটি বিদ্যমান ড্রাগের চেয়ে কম কার্যকর তা সম্ভাবনা পরীক্ষা করতে ব্যর্থ হন fail

হাইপোথিসিস টেস্টিংয়ের পরম মৌলিক বিষয়গুলি শিখার পরে এবং প্রায় এক বনাম দুটি লেজযুক্ত পরীক্ষার অংশটি পাওয়ার পরে ... আমি বুনিয়াদি গণিত এবং একটি লেজযুক্ত পরীক্ষা ইত্যাদির সনাক্তকরণের বর্ধিত ক্ষমতা ইত্যাদি বুঝতে পারি ... তবে আমি কেবল আমার মাথার চারপাশে আবৃত করতে পারি না একটা জিনিসকে ঘিরে ... কী কথা? আমি যখন আপনার নমুনা ফলাফল কেবলমাত্র এক বা অন্যটিতে হতে পারে তখন কেন আপনার আলফা দুটি চরমের মধ্যে ভাগ করতে হবে তা বুঝতে আমি ব্যর্থ হয়েছি।

উপরের উদ্ধৃত পাঠ্য থেকে উদাহরণের দৃশ্যটি দেখুন। বিপরীত দিকের ফলাফলের জন্য আপনি কীভাবে সম্ভবত "পরীক্ষায় ব্যর্থ" হতে পারেন? আপনি আপনার নমুনা গড় আছে। আপনার জনসংখ্যা গড় আছে। সাধারণ গাণিতিক আপনাকে আরও বেশি বলে দেয়। বিপরীত দিকে পরীক্ষা করার বা পরীক্ষায় ব্যর্থ হওয়ার কী আছে? আপনি যদি স্পষ্টভাবে দেখেন যে স্যাম্পলটির অর্থ অন্য দিক থেকে দূরে রয়েছে তবে আপনি কেবল বিপরীত অনুমান দিয়ে শুরু থেকে থামিয়ে দিচ্ছেন?

একই পৃষ্ঠা থেকে আরেকটি উদ্ধৃতি:

নাল অনুমানকে প্রত্যাখ্যান করতে ব্যর্থ একটি দ্বি-পুচ্ছ পরীক্ষা চালানোর পরে একটি লেজযুক্ত পরীক্ষা নির্বাচন করা উপযুক্ত নয়, দ্বি-পুচ্ছ পরীক্ষাটি যতই "নিকটবর্তী" ছিল তা বিবেচ্য নয়।

আমি ধরে নিলাম এটিও আপনার এক-লেজযুক্ত পরীক্ষার পোলারিটি পরিবর্তন করতে প্রযোজ্য। আপনি যদি প্রথম স্থানে সঠিকভাবে এক-লেজযুক্ত পরীক্ষাটি বেছে নিয়েছিলেন তবে এই "ডক্টরড" ফলাফলটি কীভাবে কম বৈধ?

স্পষ্টতই আমি এখানে ছবির একটি বড় অংশ মিস করছি। এগুলি কেবল খুব স্বেচ্ছাচারী বলে মনে হচ্ছে। এটি আমার অনুমান অনুসারে কোনটি "পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" - 95%, 99%, 99.9% ... দিয়ে শুরু করা স্বেচ্ছাচারী।


18
এটি আমার কাছে পুরোপুরি ভাল প্রশ্নের মতো মনে হচ্ছে, +1।
গুং - মনিকা পুনরায়

5
যদিও এটি একেবারে স্পষ্ট যে ডেটা সংগ্রহের আগে আপনার পরীক্ষা এবং আপনার পরীক্ষাগুলির নকশা করা উচিত, আমি ওষুধগুলিতে তাদের উদাহরণটি বরং আকর্ষণীয় বলে মনে করি যে নতুন ওষুধগুলি প্রায়শই কোনও আওয়াজ ছাড়াই 1-পার্শ্বযুক্ত পরীক্ষা দিয়ে পরীক্ষা করা হয়
পি-জিএন

3
@ ব্যবহারকারী 1735003 ফার্মাসিউটিকাল ট্রায়াল নিয়ন্ত্রণকারী অনেক মেজাজ / আচরণ বিবেচনা করে পর্যবেক্ষক পক্ষপাতিত্বের জন্য ক্রমবর্ধমান তদন্তের অধীনে আসছে an রিতালিনে এখানে একটি আকর্ষণীয় কোচরান । "প্লাসবো'র দাবীযুক্ত শ্রেষ্ঠত্ব" যাকে কোনও পরীক্ষকই "ক্ষতি" বলে অভিহিত করেন, তাই আমি এটিকে কমপক্ষে অকল্পনীয়ও মনে করি না। তবে এই পরীক্ষাগুলিতে, অধ্যয়ন যদি ক্ষতি বন্ধ করে দেয়, তবে সংকেতটি বিরূপ ঘটনা থেকে।
অ্যাডামো

10
"আপনার নমুনাটির অর্থ আপনার। আপনার জনসংখ্যার অর্থ হ'ল ... যদি আপনি স্পষ্টভাবে দেখতে পান যে নমুনাটি অন্য দিক থেকে দূরে চলেছে তবে আপনি কেবল বিপরীত অনুমান দিয়ে শুরু থেকে কী শুরু করছেন?" । না, অনুমান পরীক্ষার পুরো পয়েন্ট পথ পাবো না না জনসংখ্যা মানে আছে, এবং আপনি নমুনা ব্যবহার করছেন (নাল হাইপোথিসিস) জনসংখ্যা গড় সম্পর্কে অনুমান পরীক্ষা করার মানে। সুতরাং কোনও "স্পষ্টভাবে দেখুন না যে নমুনাটির অর্থ পথ বন্ধ" , কারণ এটি আপনি যা পরীক্ষা করছেন ঠিক তেমনই দেওয়া হয়েছে, প্রদত্ত নয়।
স্ট্যাটাস

1
ঝামেলাটি হ'ল প্রায়শই আপনি পোলারিটি জানেন না, সুতরাং আপনাকে দুটি লেজযুক্ত পরীক্ষা চালাতে হবে। ডিসি পাওয়ার সাপ্লাইতে প্লাগিং ভোল্টমিটারটি কল্পনা করুন যখন আপনি জানেন না কোন প্লাগটি পজিটিভ
আকসাকাল

উত্তর:


46

তথ্যটিকে আইসবার্গের টিপ হিসাবে ভাবুন - আপনি জলের উপরে যা দেখতে পাচ্ছেন তা হ'ল আইসবার্গের টিপ তবে বাস্তবে আপনি পুরো আইসবার্গ সম্পর্কে কিছু শিখতে আগ্রহী।

পরিসংখ্যানবিদগণ, উপাত্ত বিজ্ঞানীরা এবং ডেটা নিয়ে কাজ করা অন্যরা জলীয় লাইনের প্রভাবের উপরে যা দেখছেন সেটিকে সতর্কতা অবলম্বন করে এবং পানির লাইনের নীচে কী লুকায়িত আছে তার মূল্যায়নকে পক্ষপাতিত্ব করে। এই কারণে, একটি অনুমানের পরীক্ষার পরিস্থিতিতে, তারা বরফের টিপটি দেখার আগে তাদের নাল এবং বিকল্প অনুমানগুলি তৈরি করার ঝোঁক তৈরি করে, তাদের প্রত্যাশা (বা এর অভাব) এর উপর ভিত্তি করে যদি তারা আইসবার্গকে সম্পূর্ণরূপে দেখতে পারে তবে কী ঘটতে পারে তার উপর ভিত্তি করে ।

আপনার হাইপোটিসেসগুলি গঠনের জন্য ডেটা অনুসন্ধান করা একটি দুর্বল অনুশীলন এবং এড়ানো উচিত - এটি ঘোড়ার আগে কার্টটি রাখার মতো। স্মরণ করুন যে ডেটাটি নির্বাচিত একক নমুনা (আশা করি একটি এলোমেলো নির্বাচন ব্যবস্থা ব্যবহার করে) লক্ষ্য জনসংখ্যা / আগ্রহের মহাবিশ্ব থেকে আসে। নমুনার নিজস্ব আইডিয়াসিন্যাস রয়েছে, যা অন্তর্নিহিত জনসংখ্যার প্রতিচ্ছবি হতে পারে বা নাও পারে। আপনি কেন আপনার অনুমানগুলি সমগ্র জনসংখ্যার পরিবর্তে জনসংখ্যার সংকীর্ণ টুকরো প্রতিফলিত করতে চান?

এ সম্পর্কে ভাবার আরেকটি উপায় হ'ল, আপনি যখনই আপনার লক্ষ্য জনসংখ্যার (একটি এলোমেলো নির্বাচন ব্যবস্থা ব্যবহার করে) থেকে কোনও নমুনা নির্বাচন করেন, তখন নমুনাটি বিভিন্ন উপাত্ত অর্জন করবে। যদি আপনি নাল এবং বিকল্প অনুমানের আপনার নির্দিষ্টকরণের জন্য গাইড করতে ডেটা ব্যবহার করেন (যা আপনার উচিত নয় !!!), আপনার অনুমানগুলি সমস্ত মানচিত্রে থাকবে, যা প্রতিটি নমুনার আইডিসিঙ্ক্র্যাটিক বৈশিষ্ট্যগুলি দ্বারা মূলত পরিচালিত। অবশ্যই, অনুশীলনে আমরা কেবল একটি নমুনা আঁকি, তবে এটি জানতে খুব বিরক্তিকর চিন্তা হবে যে অন্য কেউ যদি একই আকারের ভিন্ন নমুনা নিয়ে একই গবেষণা চালায় তবে তাদের অনুমানগুলি পরিবর্তনের জন্য তাদের বাস্তবগুলির প্রতিফলন করতে হবে তাদের নমুনা।

আমার একজন গ্র্যাজুয়েট স্কুল অধ্যাপক খুব বুদ্ধিমান বক্তব্য রাখতেন: "আমরা নমুনার বিষয়ে চিন্তা করি না, তা বাদে এটি আমাদের জনসংখ্যার বিষয়ে কিছু বলে দেয়" । আমরা সেই জনসংখ্যা থেকে যে নমুনাটি বেছে নেওয়ার জন্য ঘটেছে তার একটি নমুনা নয়, লক্ষ্য জনসংখ্যা সম্পর্কে কিছু জানতে আমাদের অনুমানগুলি তৈরি করতে চাই।


1
@ subhashc.davar: আপনি আমার উত্তরের প্রাসঙ্গিকতা দেখছেন না বলে এর অর্থ এই নয় যে অন্য কেউ তা করবে না। দয়া করে মনে রাখবেন যে উত্তরগুলি কেবলমাত্র সেই ব্যক্তিটির জন্য নয়, পুরো সম্প্রদায়ের জন্য যা প্রশ্নটি জিজ্ঞাসা করেছিল। আপনি যদি এই সম্পর্কে দৃ strongly়তা অনুভব করেন তবে আমার উত্তরটি মুছতে পেরে আমি খুশি হব।
ইসাবেলা ঘেমেন্ট

7
@ subhashc.davar একটি উদাহরণ সাহায্য করতে পারে: একটি নাস্তা কর্মক্ষমতা প্রভাবিত করে যদি আপনি পরীক্ষা পরীক্ষা বলুন। আপনি পরীক্ষা চালান এবং স্ন্যাকারে একটি সামান্য স্কোর লাভ খুঁজে পান। গ্রেট! স্নেকার> নন-স্ন্যাকার কিনা তা দেখতে একটি লেজযুক্ত পরীক্ষা চালান। সমস্যা: স্নেকাররা আরও খারাপ কাজ করে এমন কোনও নমুনা আঁকলে আপনি কী করতেন? আপনি কি Snackers <নন-স্ন্যাকারগুলির জন্য একটি লেজযুক্ত পরীক্ষা করতেন? যদি তা হয় তবে আপনি একটি ত্রুটি করছেন এবং নমুনা আইডিয়াসক্রাইজগুলি আপনার পরীক্ষার জন্য নির্দেশ দিচ্ছেন।
আরএম

21
আমার অধ্যাপকের একটি উপাখ্যান: "আমরা একটি প্রসূতি ওয়ার্ডে বন্ধুর নবজাতক কন্যার সাথে দেখা করেছি। ২০ জন বাচ্চা এবং ২০ জনের মধ্যে 18 টি গোলাপী টুপি পরেছিল So সুতরাং আমি কোনও পরিসংখ্যানবিদ যা করব তা করলাম: লিঙ্গের জন্য 50-মানের একটি পি-মান গণনা করা হয়েছিল / 50. এটি খুব পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ ছিল। সুতরাং আমার সাথে এই কাগজটি কে লিখতে চান? কেউ নেই কেন? কেন? আপনি এমন ডেটা ব্যবহার করতে পারবেন না যা অনুমানের পরীক্ষা করার জন্য একটি অনুমান তৈরি করেছিল data "
অ্যাডামো

4
@ অ্যাডামো আমি আপনার মন্তব্যটির উত্তরের চেয়ে আরও ভাল ব্যাখ্যা পেয়েছি। আমি সর্বশেষ বাক্যটি পুনরায় লিখতে চাইছি ' আপনার হাইপোথিসিসটি পরীক্ষা করার জন্য আপনি একই ডেটা ব্যবহার করবেন না যার মাধ্যমে আপনি আপনার অনুমানটি তৈরি করেছিলেন' ' এর সাথে সম্পর্কিত জড়িত বিষয়টি হ'ল আপনি পূর্বে যা যা পরীক্ষা করেছেন তার ফলাফলের ভিত্তিতে আপনার অনুমানকে পরিবর্তন করা ভাল । তবে তারপরে আপনার নতুন ডেটা দিয়ে আপনার নতুন অনুমানটি পরীক্ষা করা উচিত।
কেনি এভিট

3
পছন্দ করেছেন ঘটনামূলক অনুসন্ধানগুলি গুরুত্বপূর্ণ এবং তাদের রিপোর্ট করা উচিত, তবে সেগুলি পূর্বনির্ধারিত অনুমান হিসাবে বিক্রি করা উচিত নয়।
অ্যাডামো

18

আমি মনে করি আপনার প্রশ্নটি বিবেচনা করার সময় আপনি যদি নাল-হাইপোথিসিসের তাৎপর্য পরীক্ষার (এনএইচএসটি) লক্ষ্য / বিক্রয় পয়েন্টগুলি মনে রাখার চেষ্টা করেন তবে এটি সহায়তা করে; এটি পরিসংখ্যানগত অনুক্রমের জন্য মাত্র একটি দৃষ্টান্ত (যদিও খুব জনপ্রিয় একটি) এবং অন্যদের নিজস্ব শক্তিও রয়েছে (যেমন, বায়েসিয়ান অনুমানের সাথে সম্পর্কিত এনএইচএসটি আলোচনার জন্য এখানে দেখুন )। এনএইচএসটি - র বড় পার্কটি কী ?: দীর্ঘকালীন ত্রুটি নিয়ন্ত্রণ । যদি আপনি এনএইচএসটি (এবং কখনও কখনও এটি খুব বড় যদি হয়) এর নিয়মগুলি অনুসরণ করেন তবে আপনার দীর্ঘমেয়াদে আপনার যে সূচনাগুলি করা হচ্ছে তার সাথে আপনার কী ভুল হওয়ার সম্ভাবনা রয়েছে তা সম্পর্কে আপনার ভাল ধারণা হওয়া উচিত।

এনএইচএসটির নিয়মিত নিয়মের একটি হ'ল, আপনার পরীক্ষার পদ্ধতিতে আরও কোনও পরিবর্তন ছাড়াই, আপনি কেবল আপনার আগ্রহের পরীক্ষাটি দেখে নিতে পারেন। অনুশীলনে গবেষকরা প্রায়শই এই নিয়মটিকে উপেক্ষা করে (বা সচেতন নন) (সিমন্স এট আল।, ২০১২ দেখুন), ডেটা তরঙ্গ যুক্ত করার পরে একাধিক পরীক্ষা করা, তাদেরp- তাদের মডেলগুলিতে ভেরিয়েবল যুক্ত / মুছে ফেলার পরে মূল্য ইত্যাদি this এর সাথে সমস্যাটি হ'ল এনএইচএসটি ফলাফলের ক্ষেত্রে গবেষকরা খুব কমই নিরপেক্ষ থাকেন; তারা গভীরভাবে সচেতন যে উল্লেখযোগ্য ফলাফল অপ্রত্যাশিত ফলাফলের চেয়ে প্রকাশিত হওয়ার সম্ভাবনা বেশি (যে কারণেই বিভ্রান্তিকর এবং বৈধ উভয় কারণেই; রোসান্থাল, 1979)। গবেষকরা তাই প্রায়শই ডেটা যোগ করতে / মডেলগুলি সংশোধন করতে / আউটলিয়ারগুলি নির্বাচন করতে এবং বারবার পরীক্ষা করা অবধি উত্সাহিত হন যতক্ষণ না তারা একটি উল্লেখযোগ্য প্রভাব "উদ্ঘাটন" করেন (জন এট আল, ২০১১, একটি ভাল ভূমিকা দেখুন)।

উপরের অনুশীলনগুলির দ্বারা একটি পাল্টা সমস্যা তৈরি করা হয়েছে, যা ডায়নেস (২০০৮) এ সুন্দরভাবে বর্ণিত হয়েছে: যদি গবেষকরা তাত্পর্য অর্জনের আগ পর্যন্ত তাদের নমুনা / নকশা / মডেলগুলি সামঞ্জস্য করে রাখেন, তবে মিথ্যা-ইতিবাচক অনুসন্ধানগুলির জন্য তাদের কাঙ্ক্ষিত দীর্ঘমেয়াদি ত্রুটির হার (প্রায়শই ) এবং মিথ্যা-নেতিবাচক ফলাফলগুলি (প্রায়শই ) প্রতিটি যথাক্রমে 1.0 এবং 0.0 এ (অর্থাত্, আপনি মিথ্যা এবং কখন সত্য হয় উভয়ই আপনি প্রত্যাখ্যান )।β = .20 এইচ 0α=.05β=.20H0

আপনার সুনির্দিষ্ট প্রশ্নের প্রসঙ্গে গবেষকরা যখন প্রভাবের দিকের বিষয়ে বিশেষভাবে ভবিষ্যদ্বাণী করতে চান না তখন তারা দ্বি-পুচ্ছ পরীক্ষাগুলি ডিফল্ট হিসাবে ব্যবহার করেন। যদি তারা তাদের অনুমানের থেকে ভুল হয় এবং এফেক্টের দিক দিয়ে একটি লেজযুক্ত পরীক্ষা চালায় তবে তাদের দীর্ঘকালীন ফুলে উঠবে। যদি তারা বর্ণনামূলক পরিসংখ্যানগুলি দেখে এবং তাদের চোখের প্রবণতার উপর ভিত্তি করে একটি লেজযুক্ত পরীক্ষা চালায় তবে তাদের দীর্ঘ-রান স্ফীত হবে। আপনি মনে করতে পারেন যে এটি বাস্তবে কোনও বিশাল সমস্যা নয়, মূল্যবোধগুলি তাদের দীর্ঘমেয়াদী অর্থ হারাবে, তবে তারা যদি তাদের অর্থ ধরে না রাখে, তবে আপনি কেন অনুমানের দিকে দৃষ্টিভঙ্গি ব্যবহার করছেন তা প্রশ্ন উত্থাপন করে দীর্ঘমেয়াদী ত্রুটি নিয়ন্ত্রণকে অগ্রাধিকার দেয়।α পিααp

সর্বশেষে (এবং ব্যক্তিগত পছন্দ হিসাবে বিবেচনা), আমার যদি সমস্যাটি কম হয় তবে আপনি যদি প্রথমে একটি দ্বি-পুচ্ছ পরীক্ষা করিয়েছিলেন, তা অযৌক্তিক বলে মনে করেন, তবে প্রথম পরীক্ষার নির্দেশিত দিকের ওয়ান-লেজযুক্ত পরীক্ষাটি করেছেন এবং এটি ( যদি কেবলমাত্র) আপনি অন্য কোনও নমুনায় সেই প্রভাবটির কঠোর নিশ্চিত প্রতিলিপি সম্পাদন করেছেন এবং একই প্রতিবেদনে সেই প্রতিলিপি প্রকাশ করেছেন তা তা তাৎপর্যপূর্ণ বলে মনে হয়েছে । ত্রুটি-হারে সঞ্চারিত নমনীয় বিশ্লেষণ অনুশীলন সহ - অনুসন্ধানের ডেটা বিশ্লেষণ যতক্ষণ না আপনি সেই একই বিশ্লেষণাত্মক নমনীয়তা ছাড়াই কোনও নতুন নমুনায় আপনার প্রভাব প্রতিলিপি করতে সক্ষম হন।

তথ্যসূত্র

ডায়েনেস, জেড। (২০০৮) বৈজ্ঞানিক ও পরিসংখ্যান অনুমান একটি উপস্থাপনা: একটি বিজ্ঞান হিসেবে মনোবিজ্ঞান বোঝা । পালগ্রাভ ম্যাকমিলান।

জন, এলকে, লোয়েস্টেন, জি।, এবং প্রলেক, ডি (২০১২)। সত্য বলার জন্য উত্সাহ দিয়ে প্রশ্নবিদ্ধ গবেষণা পদ্ধতির প্রসার পরিমাপ করা। মনস্তাত্ত্বিক বিজ্ঞান , 23 (5), 524-532।

রোসানথাল, আর। (1979) নাল ফলাফলের জন্য ফাইল ড্রয়ারের সমস্যা এবং সহনশীলতা। মনস্তাত্ত্বিক বুলেটিন , 86 (3), 638।

সিমন্স, জেপি, নেলসন, এলডি, এবং সিমোনসোহন, ইউ। (2011)। মিথ্যা-ইতিবাচক মনোবিজ্ঞান: ডেটা সংগ্রহ এবং বিশ্লেষণে অপ্রকাশিত নমনীয়তা যে কোনও কিছুকে উল্লেখযোগ্য হিসাবে উপস্থাপন করতে দেয়। মনস্তাত্ত্বিক বিজ্ঞান , 22 (11), 1359-1366।


খুব সুন্দর উত্তর। আমার গবেষণামূলক গবেষণাপত্রে (সাধারণ মানুষ হিসাবে) উদ্বেগের সময় আমার যে উদ্বেগ ছিল তা একত্রিত করতে আমাকে সাহায্য করেছিল, আপাতদৃষ্টিতে এই ধারণার নিশ্চয়তা দিয়েছিলেন যে যদি আপনার "নেতিবাচক" বিষয়ে আত্মবিশ্বাসের বিদ্যমান কারণ থাকে তবে এক-লেজযুক্ত পি-মানগুলি কেবল "বিশ্বাসযোগ্য" হতে পারে পারস্পরিক সম্পর্ক "দিক মিথ্যা হচ্ছে।
ভেন্রিক্স

10

দুর্ভাগ্যক্রমে, ওষুধ বিকাশের অনুপ্রেরণামূলক উদাহরণটি ভাল নয় কারণ আমরা ড্রাগগুলি বিকাশের জন্য এটি করি না। প্রবণতা যদি ক্ষতির মুখোমুখি হয় তবে আমরা অধ্যয়ন বন্ধ করার জন্য বিভিন্ন, আরও কঠোর নিয়ম ব্যবহার করি। এটি রোগীদের সুরক্ষার জন্য এবং কারণ ওষুধটি কোনও অর্থবহ বেনিফিটের দিক দিয়ে যাদুকরভাবে ঝাপিয়ে যাওয়ার সম্ভাবনা কম।

সুতরাং দুটি লেজযুক্ত পরীক্ষা কেন ? (যখন বেশিরভাগ ক্ষেত্রে আমরা কার্যকর সম্ভাবনার দিকটি মডেল করার চেষ্টা করছি তার কিছু প্রাথমিক ধারণা থাকে)

নাল হাইপোথিসিসটি বিশ্বাসযোগ্য, বুদ্ধিমান এবং ন্যায়সঙ্গত বলে বিশ্বাসের সাথে কিছুটা সাদৃশ্য বহন করে । বেশিরভাগ ক্ষেত্রে, 0 টি প্রভাব থাকলে লোকেরা "উদ্বেগজনক ফলাফল" এর সাথে সম্মত হয়, যখন একটি নেতিবাচক বা ধনাত্মক প্রভাব সমান আগ্রহের হয়। একটি যৌগিক নাল হাইপোথিসিসটি উচ্চারণ করা খুব শক্ত, উদাহরণস্বরূপ যেখানে আমরা জানি যে পরিসংখ্যান সমান বা তার সমান হতে পারেনির্দিষ্ট পরিমাণের চেয়ে কম তাদের বৈজ্ঞানিক অনুসন্ধানগুলি অনুধাবন করার জন্য একটি নাল অনুমানের সম্পর্কে অবশ্যই খুব স্পষ্ট হওয়া উচিত। এটি উল্লেখ করার মতো যে, যেভাবে কোনও একটি যৌগিক অনুমানের পরীক্ষা পরিচালনা করে তা হ'ল নাল অনুমানের অধীনে পরিসংখ্যানটি পর্যবেক্ষণ করা তথ্যের সীমার মধ্যে সর্বাধিক সুসংগত মান ধরে নিয়েছে। সুতরাং যদি প্রভাবটি আশানুরূপ হিসাবে ইতিবাচক দিকে থাকে তবে নাল মানটি যাইহোক 0 হিসাবে নেওয়া হবে এবং আমরা অকারণে মোটা করেছি।

একটি দুটি লেজযুক্ত পরীক্ষা একাধিক তুলনার জন্য নিয়ন্ত্রণ সহ দুটি একতরফা পরীক্ষা পরিচালনার পরিমাণ! দুটি লেজযুক্ত পরীক্ষাটি আসলে আংশিকভাবে মূল্যবান কারণ এটি দীর্ঘকালীন সময়ে আরও রক্ষণশীল হয়ে পড়ে। যখন আমাদের প্রভাবের দিক সম্পর্কে ভাল বিশ্বাস থাকে, তখন দুটি লেজযুক্ত পরীক্ষাগুলি প্রায়শই ক্ষমতার উপর খুব কম সামগ্রিক প্রভাব সহ অর্ধেক মিথ্যা ইতিবাচক ফল দেয়।

এলোমেলোভাবে নিয়ন্ত্রিত পরীক্ষায় কোনও চিকিত্সার মূল্যায়ন করার ক্ষেত্রে, আপনি যদি আমাকে একতরফা পরীক্ষা বিক্রি করার চেষ্টা করেন, আমি আপনাকে জিজ্ঞাসা করে থামিয়ে দেব, "ভাল অপেক্ষা কর, আমরা কেন চিকিত্সাটি ক্ষতিকারক বলে বিশ্বাস করব? আসলে কি প্রমাণ আছে? এটি সমর্থন করার জন্য? এখানে কি সজ্জিত করা [কোনও উপকারী প্রভাব প্রদর্শনের ক্ষমতা] রয়েছে? " একতরফা পরীক্ষার পিছনে যৌক্তিক অসঙ্গতি পুরো গবেষণাটিকে প্রশ্নবিদ্ধ করে। যদি সত্যই কিছুই জানা না থাকে তবে 0 ব্যতীত অন্য কোনও মানকে আকর্ষণীয় হিসাবে বিবেচনা করা হয় এবং দুটি লেজযুক্ত পরীক্ষা কেবল একটি ভাল ধারণা নয়, এটি প্রয়োজনীয়।


8

এর কাছে যাওয়ার একটি উপায় হ'ল অস্থায়ীভাবে হাইপোথিসিস টেস্টিং সম্পর্কে ভুলে যাওয়া এবং পরিবর্তে আত্মবিশ্বাসের বিরতিগুলি সম্পর্কে চিন্তা করা। একতরফা পরীক্ষা একতরফা আত্মবিশ্বাসের বিরতির সাথে মিলিত হয় এবং দ্বি-পার্শ্বযুক্ত পরীক্ষা দ্বি-পার্শ্বযুক্ত আত্মবিশ্বাসের অন্তরগুলির সাথে মিলে যায়।

মনে করুন আপনি একটি জনসংখ্যার গড় অনুমান করতে চান। স্বাভাবিকভাবেই, আপনি একটি নমুনা নেন এবং একটি নমুনার গড় গণনা করুন। মুখের মূল্যে বিন্দু-অনুমান করার কোনও কারণ নেই, সুতরাং আপনি আপনার উত্তরটি একটি বিরতির ক্ষেত্রে প্রকাশ করেন যে আপনি যথাযথভাবে আত্মবিশ্বাসী হ'ল প্রকৃত অর্থ রয়েছে। আপনি কোন ধরণের বিরতি চয়ন করেন? দ্বিমুখী ব্যবধানটি আরও বেশি প্রাকৃতিক পছন্দ। একতরফা ব্যবধান কেবল তখনই তাৎপর্য লাভ করে যখন আপনি কেবল নিজের অনুমানের উপরের বাউন্ড বা নীচের সীমানা সন্ধানের জন্য যত্নবান হন না (কারণ আপনি বিশ্বাস করেন যে আপনি ইতিমধ্যে একটি দিকনির্দেশিত একটি কার্যকর আবদ্ধ জানেন)। পরিস্থিতি সম্পর্কে আপনি কতবার সত্যই নিশ্চিত?

সম্ভবত আত্মবিশ্বাসের ব্যবধানগুলিতে প্রশ্নটি স্যুইচ করা সত্যিই এটি কমাতে পারে না, তবে এক-লেজযুক্ত পরীক্ষাগুলি বরং দ্বি-পক্ষের আত্মবিশ্বাসের অন্তরগুলিকে পছন্দ করা পদ্ধতিগত দিক থেকে বেমানান।


4

হাইপোথিসিস টেস্টিংয়ের পরম মৌলিক বিষয়গুলি শিখার পরে এবং প্রায় এক বনাম দুটি লেজযুক্ত পরীক্ষাগুলির অংশটি পাওয়ার পরে ... আমি বুনিয়াদি গণিত এবং একটি লেজযুক্ত পরীক্ষা ইত্যাদির সনাক্তকরণের ক্ষমতা বৃদ্ধি বুঝতে পেরেছি ... তবে আমি কেবল আমার মাথার চারপাশে জড়িয়ে রাখতে পারি না একটা জিনিসকে ঘিরে ... কী কথা? আমি যখন আপনার নমুনা ফলাফল কেবলমাত্র এক বা অন্যটিতে হতে পারে তখন কেন আপনার আলফা দুটি চরমের মধ্যে ভাগ করতে হবে তা বুঝতে আমি ব্যর্থ হয়েছি।

সমস্যাটি হ'ল আপনি জনসংখ্যার মানে জানেন না। আমি সত্যিকারের জনসংখ্যার গড়টি জানি এমন কোনও বাস্তব বিশ্বের দৃশ্যের মুখোমুখি হইনি।

উপরের উদ্ধৃত পাঠ্য থেকে উদাহরণের দৃশ্যটি দেখুন। বিপরীত দিকের ফলাফলের জন্য আপনি কীভাবে সম্ভবত "পরীক্ষায় ব্যর্থ" হতে পারেন? আপনি আপনার নমুনা গড় আছে। আপনার জনসংখ্যা গড় আছে। সাধারণ গাণিতিক আপনাকে আরও বেশি বলে দেয়। বিপরীত দিকে পরীক্ষা করার বা পরীক্ষায় ব্যর্থ হওয়ার কী আছে? আপনি যদি স্পষ্টভাবে দেখেন যে স্যাম্পলটির অর্থ অন্য দিক থেকে দূরে রয়েছে তবে আপনি কেবল বিপরীত অনুমান দিয়ে শুরু থেকে থামিয়ে দিচ্ছেন?

আমি আপনার অনুচ্ছেদটি বেশ কয়েকবার পড়েছি, তবে আমি এখনও আপনার যুক্তি সম্পর্কে নিশ্চিত নই। আপনি কি এটি পুনরায় প্রকাশ করতে চান? আপনার ডেটা আপনার নির্বাচিত সমালোচিত অঞ্চলে অবতরণ না করে আপনি "পরীক্ষা" করতে ব্যর্থ হন।

আমি ধরে নিলাম এটিও আপনার এক-লেজযুক্ত পরীক্ষার পোলারিটি পরিবর্তন করতে প্রযোজ্য। আপনি যদি প্রথম স্থানে সঠিকভাবে এক-লেজযুক্ত পরীক্ষাটি বেছে নিয়েছিলেন তবে এই "ডক্টরড" ফলাফলটি কীভাবে কম বৈধ?

উদ্ধৃতিটি সঠিক কারণ একটি পি-মান হ্যাক করা অনুচিত। "বন্যের" পি-হ্যাকিং সম্পর্কে আমরা কতটা জানি? আরও বিশদ আছে।

স্পষ্টতই আমি এখানে ছবির একটি বড় অংশ মিস করছি। এগুলি কেবল খুব স্বেচ্ছাচারী বলে মনে হচ্ছে। এটি আমার অনুমান অনুসারে কোনটি "পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" - 95%, 99%, 99.9% ... দিয়ে শুরু করা স্বেচ্ছাচারী। সাহায্য?

এটা নির্বিচারে। এজন্য ডেটা বিজ্ঞানীরা সাধারণত পি-ভ্যালুটির মাত্রা (কেবল তাৎপর্যপূর্ণ বা তুচ্ছ নয়) এবং প্রভাবগুলির আকারেরও রিপোর্ট করে।


স্পষ্টতই, আমি পরিসংখ্যানগত অনুক্রমের খুব ভিত্তি চ্যালেঞ্জ করার চেষ্টা করছি না। আমি যেমন বলেছি, আমি কেবলমাত্র খুব বেসিকগুলি শিখেছি এবং সঠিক পরীক্ষাটি ব্যর্থ করে কোনও সম্ভাব্য অনুসন্ধান কীভাবে বাদ দেওয়া যেতে পারে তা বুঝতে সমস্যা হচ্ছি।
fromAshes

বলুন আপনার বন্ধু, জো একটি নতুন পণ্য আবিষ্কার করেছেন যা তিনি দাবি করেন যে উদ্ভিদের বৃদ্ধি ব্যাপকভাবে বৃদ্ধি করে ces আগ্রহী, আপনি একটি নিয়ন্ত্রণ গ্রুপ এবং চিকিত্সা গ্রুপের সাথে একটি শক্তিশালী অধ্যয়ন তৈরি করেছেন dev আপনার নাল হাইপ আপনার বিকল্প হাইপ, বৃদ্ধি কোন পরিবর্তন হবে না। জো এর যাদু স্প্রে উল্লেখযোগ্যভাবে বৃদ্ধি বৃদ্ধি - তাই একটি লেজযুক্ত পরীক্ষা। 2 সপ্তাহ পরে, আপনি আপনার চূড়ান্ত পর্যবেক্ষণ এবং ফলাফল বিশ্লেষণ। চিকিত্সা গোষ্ঠীর গড় বৃদ্ধি নিয়ন্ত্রণের নীচে 5 টি স্ট্যান্ডার্ড ত্রুটি হতে পারে। আপনার পরীক্ষা বাছাই করার কারণে এটি কীভাবে খুব কম তাৎপর্যপূর্ণ বা কার্যকর খুঁজে পাবে?
অ্যাশেজ

2
যদি আমি আপনাকে কোনও মুদ্রা টসের জন্য মাথা বা লেজগুলি কল করতে বলি, আপনার ফলাফলটি সম্পর্কে ভবিষ্যদ্বাণী করার সম্ভাবনা 50/50 (ভারসাম্যহীন মুদ্রা এবং একটি সৎ ফ্লিপার ধরে নেওয়া)। যাইহোক, আমি যদি প্রথমে মুদ্রাটি ফ্লিপ করি এবং আপনাকে এটি দেখতে দিন এবং তারপরে আপনার পূর্বাভাস দিন, এটি আর 50/50 হবে না। আপনি যদি .01 এর একটি আলফা স্তরের সাথে এক-লেজযুক্ত পরীক্ষা চালাচ্ছেন তবে ফলাফলটি দেখার পরে পরীক্ষার দিকটি সরিয়ে দিন কারণ অন্যদিকে পি <.01, আপনার প্রকার 1 ত্রুটির ঝুঁকি বেশি দিন নেই 0 তবে অনেক বেশি নোট করুন যে পর্যবেক্ষণকৃত পি-মান এবং টাইপ আই ত্রুটির হার একই জিনিস নয়।
ডিবিউইলসন

@FromTheashes খুব ভিত্তি চ্যালেঞ্জ করার চেষ্টা করে ভুল নেই। পরিসংখ্যান অনুমানের পরীক্ষা নিরর্থক নয়, তবে এতে প্রচুর যৌক্তিক ত্রুটি রয়েছে এবং তাদের চ্যালেঞ্জ জানানো একেবারেই যুক্তিযুক্ত!
ফ্লাউন্ডারিয়ার

3

ঠিক আছে, সমস্ত পার্থক্য আপনি যে প্রশ্নের উত্তর দিতে চান তার উপর নির্ভর করে। যদি প্রশ্নটি হয়: "একটি গ্রুপের মান কি অন্যের চেয়ে বড়?" আপনি একটি একটি লেজযুক্ত পরীক্ষা ব্যবহার করতে পারেন। প্রশ্নের উত্তর দিতে: "এই মানগুলির গ্রুপগুলি কি আলাদা?" আপনি দুটি লেজযুক্ত পরীক্ষা ব্যবহার করুন। বিবেচনায় রাখুন যে ডেটার একটি সেট অন্যের তুলনায় পরিসংখ্যানগতভাবে বেশি হতে পারে তবে পরিসংখ্যানগতভাবে আলাদা নয় ... এবং এটি পরিসংখ্যান।


1
'যদি প্রশ্নটি হয়: "মানগুলির একটি দল কি অন্যের চেয়ে বড়?" আপনি একটি একটি লেজযুক্ত পরীক্ষা ব্যবহার করতে পারেন। ' আরও স্পষ্টভাবে, যদি প্রশ্নটি হয় "এই বিশেষ গ্রুপটি কি অন্যদের চেয়ে বড়", তবে আপনার দ্বি-লেজ পরীক্ষা করা উচিত।
সংগ্রহ

এটি লক্ষ্য করা উচিত যে এটি এক প্রকারের মধ্যেই বোঝানো হয়েছে যে আপনি যদি এই প্রশ্নটি জিজ্ঞাসা করছেন যে "এবং যদি মনে হয় এটি অন্য গ্রুপের মতো দেখতে আসলে বড় তবে আমার পরোয়া নেই"। আপনি যদি যা প্রত্যাশা করেন তার বিপরীতটি যদি দেখতে পান এবং তারপরে অনুমানের পরীক্ষার দিকটি সরিয়ে ফেলা যান তবে আপনি কেবল নিজের সাথে মিথ্যা বলছিলেন এবং শুরু করার জন্য একটি দ্বি-পুচ্ছ পরীক্ষা করা উচিত ছিল।
Dason

2

আপনি যদি প্রথম স্থানে সঠিকভাবে এক-লেজযুক্ত পরীক্ষাটি বেছে নিয়েছিলেন তবে এই "ডক্টরড" ফলাফলটি কীভাবে কম বৈধ?

আলফা মান হ'ল সম্ভাব্যতা যে নালটি সত্য বলে আপনি নালকে প্রত্যাখাত করবেন। মনে করুন আপনার নাল হ'ল নমুনাটির গড়টি সাধারণত গড় শূন্যের সাথে বিতরণ করা হয়। যদি পি (নমুনা মানে> 1 | এইচ 0) = .05, তবে নিয়মটি "একটি নমুনা সংগ্রহ করুন, এবং শূন্যটিকে প্রত্যাখ্যান করুন যদি নমুনাটির গড় 1 এর চেয়ে বেশি হয়" এর সম্ভাবনা থাকে, নলটি 5% এর সত্য হয় নাল প্রত্যাখ্যান। নিয়ম "একটি নমুনা সংগ্রহ করুন, এবং যদি নমুনার অর্থটি ইতিবাচক হয় তবে নমুনার গড়টি 1 এর চেয়ে বেশি হলে নালটিকে প্রত্যাখ্যান করুন এবং যদি নমুনার গড়টি নেতিবাচক হয় তবে নমুনার গড়টি 1 এর চেয়ে কম হলে নালটিকে প্রত্যাখ্যান করুন" সম্ভাব্যতা, নালকে প্রত্যাখ্যানকারী 10% এর নালটি সত্য বলে প্রদত্ত। সুতরাং প্রথম নিয়মে 5% এর একটি আলফা থাকে এবং দ্বিতীয় নিয়মে 10% এর একটি আলফা থাকে। যদি আপনি একটি দ্বি-পুচ্ছ পরীক্ষা দিয়ে শুরু করেন, এবং তারপরে এটি ডেটার ভিত্তিতে এক-লেজযুক্ত পরীক্ষায় পরিবর্তন করুন, তারপরে আপনি দ্বিতীয় বিধি অনুসরণ করছেন, সুতরাং আপনার আলফাটিকে 5% হিসাবে প্রতিবেদন করা ভুল হবে না। আলফা মান কেবল ডেটা কী তা নির্ভর করে না, তবে বিশ্লেষণে আপনি কী বিধিগুলি অনুসরণ করছেন। আপনি যদি জিজ্ঞাসা করছেন যে কেবলমাত্র ডেটার উপর নির্ভর করে এমন কিছু না করে এই বৈশিষ্ট্যযুক্ত কোনও মেট্রিক কেন ব্যবহার করবেন, তবে এটি আরও জটিল প্রশ্ন।


2

২ য় দফা সম্পর্কিত

নাল অনুমানকে প্রত্যাখ্যান করতে ব্যর্থ একটি দ্বি-পুচ্ছ পরীক্ষা চালানোর পরে একটি লেজযুক্ত পরীক্ষা নির্বাচন করা উপযুক্ত নয়, দ্বি-পুচ্ছ পরীক্ষাটি যতই "নিকটবর্তী" ছিল তা বিবেচ্য নয়।

α

αα100%

P(two-sided rejects or one-sided does, but two sided doesn't)
P(two-sided rejects(one-sided doestwo sided doesn't))
P(two-sided rejects)+P(one-sided doestwo sided doesn't)
α/21α1α/2
P(one-sided doestwo sided doesn't)=α/2
α+α2>α
α/21α1α/21α/2

এখানে একটি সংখ্যাসূচক চিত্রণ দেওয়া হল:

n <- 100
alpha <- 0.05

two.sided <- function (x, alpha=0.05) (sqrt(n)*abs(mean(x)) > qnorm(1-alpha/2)) # returns one if two-sided test rejects, 0 else
one.sided <- function (x, alpha=0.05) (sqrt(n)*mean(x) > qnorm(1-alpha))        # returns one if one-sided test rejects, 0 else

reps <- 1e8

two.step <- rep(NA,reps)
for (i in 1:reps){
  x <- rnorm(n) # generate data from a N(0,1) distribution, so that the test statistic sqrt(n)*mean(x) is also N(0,1) under H_0: mu=0
  two.step[i] <- ifelse(two.sided(x)==0, one.sided(x), 1) # first conducts two-sided test, then one-sided if two-sided fails to reject
}
> mean(two.step)
[1] 0.07505351

1

p<α=0.05

α0.05α

α=0.05α=0.025

α=0.05


তারপরে অবশ্যই গবেষকরা স্বাধীনতার ডিগ্রি বলে এই জিনিসটি রয়েছে । আপনার যদি পর্যাপ্ত ডেটা থাকে এবং আপনার ইচ্ছা অনুযায়ী যতগুলি উপায়ে এটি পরীক্ষা করতে নিখরচায় থাকেন তবে আপনি যেকোন ধরণের ডেটাতে তাত্পর্য খুঁজে পেতে পারেন। এই কারণেই আপনি ডেটা দেখার আগে আপনি যে পরীক্ষাটি পরিচালনা করেন সে বিষয়ে সিদ্ধান্ত নেওয়া উচিত। অন্য সব কিছুই অপরিশোধনযোগ্য পরীক্ষার ফলাফলের দিকে নিয়ে যায়। আমি ইউটিউবে গিয়ে অ্যান্ড্রু গেলম্যানস আলাপ "এই বিষয়ে আরও তথ্যের জন্য ডেটাতে অপরাধের দিকে নজর দেওয়ার পরামর্শ দিই।


1
হুঁ, নাল অনুমান যে ফলাফল এলোমেলো হয় না। এটি চিকিত্সক এবং বিজ্ঞানীদের কাছে বিভ্রান্তিকর হবে যারা তাদের কাজের ফলাফলগুলি একটি নির্দিষ্ট ফলাফল অর্জন হিসাবে দেখেন।
অ্যাডামো

1
আপনার "একবার আপনি ..." পয়েন্ট দিয়ে একতরফা পরীক্ষা করা শুরু করলে গুরুত্বপূর্ণ। এত সাধারণ কারণটি হ'ল রথহ্যামস্টে আর আর ফিশারের ব্যবহারিক অভিজ্ঞতা হ'ল প্রত্যাশিত মান থেকে টির বেশি স্ট্যান্ডার্ড বিচ্যুতি হ'ল সাধারণত আরও তদন্তের মূল্য ছিল এবং এ থেকে তিনি তার থাম্বের নিয়ম হিসাবে একটি 2-লেজযুক্ত পরীক্ষা বেছে নিয়েছিলেন , অন্য রাস্তা না। সুতরাং এক-লেজ সমতুল্য0.05 2 5 % 2.5 %α=0.050.0525%2.5%
হেনরি

1

প্রথম নজরে, এই বিবৃতিগুলির মধ্যে উভয়ই দৃ as়তা দেয় না যে দ্বিমুখী পরীক্ষা একতরফা অধ্যয়নের চেয়ে 'উচ্চতর'। স্ট্যাটিস্টিকাল ইনফারেন্স পরীক্ষিত হওয়ার সাথে জড়িত গবেষণা অনুমানের সাথে কেবল যুক্তিযুক্ত সংযোগ থাকা দরকার।

এই ক্ষেত্রে:

... অন্যদিকে কোনও প্রভাব হারিয়ে যাওয়ার পরিণতি বিবেচনা করুন। কল্পনা করুন যে আপনি একটি নতুন ওষুধ তৈরি করেছেন যা আপনি বিশ্বাস করেন যে বিদ্যমান ড্রাগের চেয়ে উন্নতি an আপনি উন্নতি সনাক্তকরণের সর্বাধিক ক্ষমতা অর্জন করতে চান, তাই আপনি একটি-লেজযুক্ত পরীক্ষার জন্য বেছে নিন। এটি করার ক্ষেত্রে, আপনি যে ওষুধটি বিদ্যমান ড্রাগের চেয়ে কম কার্যকর তা সম্ভাবনা পরীক্ষা করতে ব্যর্থ হন fail

প্রথমে এটি একটি ড্রাগ স্টাডি। সুতরাং বিপরীত দিকটি ভুল হওয়ার পরিসংখ্যানের কাঠামোর বাইরে সামাজিক তাত্পর্য রয়েছে। তাই অনেকেই বলেছেন স্বাস্থ্য সাধারনকরণ করা সবচেয়ে ভাল নয়।

উপরের উদ্ধৃতিতে, মনে হয় যে কোনও ওষুধ পরীক্ষার বিষয়ে যখন অন্য ইতিমধ্যে উপস্থিত রয়েছে। সুতরাং আমার কাছে এটি বোঝায় যে আপনার ড্রাগটি ইতিমধ্যে কার্যকর বলে ধরে নেওয়া হয়েছে। বিবৃতিটি এরপরে কার্যকর দুটি ওষুধের তুলনার সাথে সম্পর্কিত। এই বিতরণগুলির তুলনা করার সময় আপনি যদি তুলনামূলক ফলাফলগুলির উন্নতির স্বার্থে জনগণের একপক্ষকে অবহেলা করছেন? এটি কেবল একটি পক্ষপাতদুষ্ট উপসংহার নয় তবে তুলনাটি আর কার্যকর করার পক্ষে যুক্তিযুক্ত নয়: আপনি কমলাতে আপেলকে তুলনা করছেন।

একইভাবে, খুব ভাল বিন্দু অনুমান হতে পারে যে পরিসংখ্যানগত অনুক্রমের জন্য উপসংহারে কোনও পার্থক্য তৈরি করেনি, তবে সামাজিক গুরুত্বের খুব বেশি। কারণ আমাদের নমুনাটি মানুষের জীবনের প্রতিনিধিত্ব করে: এমন কিছু যা "পুনরায় ঘটতে পারে না" এবং অমূল্য।

বিকল্পভাবে, বিবৃতিটির দ্বারা গবেষকটির একটি উত্সাহ রয়েছে: "আপনি উন্নতি সনাক্তকরণের সক্ষমতা সর্বাধিক করতে চান ..." এই ধারণাটি একটি খারাপ প্রোটোকল হিসাবে বিচ্ছিন্ন হওয়ার ক্ষেত্রে তুচ্ছ নয়।

নাল অনুমানকে প্রত্যাখ্যান করতে ব্যর্থ একটি দ্বি-পুচ্ছ পরীক্ষা চালানোর পরে একটি লেজযুক্ত পরীক্ষা নির্বাচন করা উপযুক্ত নয়, দ্বি-পুচ্ছ পরীক্ষাটি যতই "নিকটবর্তী" ছিল তা বিবেচ্য নয়।

আবার এখানেও বোঝানো হয়েছে যে গবেষক তার পরীক্ষাটি 'স্যুইচিং' করছেন: দ্বিমুখী থেকে একপেশে। এটি কখনই উপযুক্ত নয়। পরীক্ষার আগে একটি গবেষণা উদ্দেশ্য থাকা আবশ্যক। দ্বি-পার্শ্বিক পদ্ধতির সুবিধার জন্য সর্বদা ডিফল্ট হয়ে - গবেষকরা সুবিধাজনকভাবে ঘটনাটি আরও কঠোরভাবে বুঝতে ব্যর্থ হন।

এখানে এই বিষয়টি নিয়ে একটি কাগজ দেওয়া আছে, বাস্তবে, দ্বিমুখী পরীক্ষাগুলি অতিরিক্ত ব্যবহার করা হয়েছে এমনটি করে।

এটি একটি অভাবের উপর একটি দ্বি-পার্শ্বিক পরীক্ষার অত্যধিক ব্যবহারকে দোষ দেয়:

স্পষ্ট পার্থক্য এবং গবেষণা অনুমান এবং এর পরিসংখ্যান অনুমানের মধ্যে একটি যৌক্তিক যোগসূত্র

এটি অবস্থান ও অবস্থান নিয়ে গবেষকরা:

দুটি অভিব্যক্তিপূর্ণ পদ্ধতির মধ্যে পার্থক্য সম্পর্কে অবগত হতে পারে না বা গবেষণামূলক অনুমানটি পরিসংখ্যান অনুমানের মধ্যে অনুবাদ করা উচিত এমন যৌক্তিক প্রবাহ সম্পর্কে সচেতন হতে পারে না। গবেষণা এবং পরিসংখ্যান অনুমানের একটি সুবিধামত মিশ্রণ এমন পরিস্থিতিতে এমনকি দ্বি-পুচ্ছ পরীক্ষার ব্যবহার অনুপযুক্ত পরিস্থিতিতে দ্বি-পুচ্ছ পরীক্ষার অত্যধিক ব্যবহারের কারণ হতে পারে।

যা প্রয়োজন তা হল পরিসংখ্যান পরীক্ষার ফলাফলগুলির ব্যাখ্যায় সঠিক পরিসংখ্যান উপলব্ধি করা। রক্ষণশীল হওয়ার নামে অনর্থক হওয়া বাঞ্ছনীয় নয়। সেই অর্থে, লেখকরা মনে করেন যে কেবল পরীক্ষার ফলাফলের রিপোর্ট করা যেমন "এটি 0.05 তাত্পর্যপূর্ণ (যেমন, পি <0.05) পর্যায়ে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ বলে প্রমাণিত হয়েছিল।" যথেষ্ট ভাল নয়।

যদিও দ্বি-পুচ্ছ পরীক্ষাটি তত্ত্বের ক্ষেত্রে আরও রক্ষণশীল, এটি দিকনির্দেশক গবেষণা অনুমান এবং এর পরিসংখ্যান অনুমানের মধ্যে সংযোগকে ডুপ্লুপ করে, সম্ভবত দ্বিগুণ স্ফীত পি মানের দিকে নিয়ে যায়।

লেখকরা এও দেখিয়েছেন যে বিপরীত দিকের উল্লেখযোগ্য ফল সন্ধানের যুক্তিটির অর্থ ন্যায়সঙ্গত প্রসঙ্গে নয় কেবল আবিষ্কারের প্রসঙ্গে । গবেষণার অনুমান এবং এর অন্তর্নিহিত তত্ত্বের পরীক্ষার ক্ষেত্রে গবেষকদের একযোগে আবিষ্কারের আবিষ্কার এবং ন্যায্যতার প্রসঙ্গটি দেখানো উচিত নয়।

https://www.sciencedirect.com/science/article/pii/S0148296312000550


1

একটি বিকল্প অনুমানের বিরুদ্ধে নাল অনুমানের জন্য প্রায়শই একটি তাত্পর্য পরীক্ষা করা হয় । এটি যখন এক-লেজ বনাম দ্বি-পুচ্ছ একটি পার্থক্য তৈরি করে।


  • পি-মানগুলির জন্য এটি (দুই বা একতরফা) কিছু যায় আসে না! পয়েন্ট যে আপনি একটি criterium যে শুধুমাত্র ভগ্নাংশ ঘটে নির্বাচন হয় সময় যখন নাল হাইপোথিসিস সত্য। এটি হয় উভয় লেজের দুটি ছোট টুকরা, বা একটি লেজের একটি বড় টুকরো, বা অন্য কিছু।α

    এক বা দুটি তরফা পরীক্ষার জন্য টাইপ আই ত্রুটির হার আলাদা নয়।

  • অন্যদিকে, শক্তির জন্য এটি গুরুত্বপূর্ণ

    যদি আপনার বিকল্প হাইপোথিসিসটি অসম্পূর্ণ হয়, তবে আপনি কেবল এই লেজ / প্রান্তে নাল অনুমানকে প্রত্যাখ্যান করার জন্য মাপদণ্ডের দিকে মনোনিবেশ করতে চান; যেমন যখন বিকল্প অনুমানটি সত্য হয় তখন আপনার নাল অনুমানটি প্রত্যাখ্যান ("স্বীকার") করার সম্ভাবনা কম থাকে।

    যদি আপনার বিকল্প হাইপোথিসিসটি প্রতিসম হয় (আপনি একটি নির্দিষ্ট দিকে বেশি বা কম শক্তি স্থাপনের চিন্তা করেন না) এবং উভয় পক্ষের প্রতিবিম্ব / প্রভাব সমানভাবে প্রত্যাশিত (বা কেবল অজানা / অজানা), তবে এটি ব্যবহার করা আরও শক্তিশালী দ্বিমুখী পরীক্ষা (আপনি যে লেজটি পরীক্ষা করছেন না তার জন্য আপনি 50% শক্তি হারাচ্ছেন না এবং যেখানে আপনি অনেক ধরণের II ত্রুটি করবেন)।

    এক এবং দুটি তরফা পরীক্ষা এবং বিকল্প অনুমানের উপর নির্ভর করে টাইপ II ত্রুটির হার পৃথক।

এটি এখন কিছুটা বায়েশিয়ান ধারণার মতো হয়ে উঠছে যখন আমরা একদিকে বা উভয় পক্ষের প্রভাব পড়ার আশা করি বা না করি এবং আমরা যখন পরীক্ষাটি ব্যবহার করতে চাই তখন (আমরা যদি একটি ফলশালী করতে পারি কিনা তা দেখার জন্য) পূর্ব ধারণাগুলি জড়িত শুরু করি নাল-হাইপোথিসিস) প্রভাবের মতো আরও সম্ভাব্য কিছু 'নিশ্চিত করতে' বা তৈরি করতে।


0

সুতরাং আরও একটি উত্তর চেষ্টা:

আমি অনুমান করি যে একটি লেজযুক্ত বা দ্বি-পুচ্ছ গ্রহণ করা সম্পূর্ণরূপে বিকল্প অনুমানের উপর নির্ভর করে।

টি-টেস্টের মাধ্যমে পরীক্ষার গড়ের নীচের উদাহরণটি বিবেচনা করুন:

H0:μ=0

Ha:μ0

এখন আপনি যদি খুব নেতিবাচক নমুনা গড় বা খুব ইতিবাচক নমুনা বোঝায় তবে আপনার অনুমানটি সত্য হওয়ার সম্ভাবনা কম।

অন্যদিকে, আপনার নমুনাটির অর্থ যদি নেতিবাচক বা ইতিবাচক হয় তবে কাছাকাছি থাকলে আপনি আপনার হাইপোথিসিসটি মেনে নিতে রাজি হবেন । এখন আপনাকে এমন বিরতি বাছাই করতে হবে যার মধ্যে আপনার নমুনার অর্থ যদি হ্রাস পায় তবে আপনি আপনার নাল অনুমানটি প্রত্যাখ্যান করবেন না। স্পষ্টতই আপনি এমন একটি বিরতি বেছে নেবেন যা কাছাকাছি নেতিবাচক এবং ধনাত্মক উভয় দিক রয়েছে । সুতরাং আপনি উভয় পক্ষের পরীক্ষাটি বেছে নিন।0 00

তবে আপনি যদি পরীক্ষা করতে না চান তবে বরং । এখন স্বজ্ঞাতভাবে আমরা এখানে যা করতে চাই তা হ'ল যদি নমুনা গড়ের মানটি খুব নেতিবাচক হয় তবে আমরা অবশ্যই আমাদের নালটিকে প্রত্যাখ্যান করতে পারি। সুতরাং আমরা কেবলমাত্র নমুনা গড়ের নেতিবাচক মানগুলির জন্য নালকে প্রত্যাখ্যান করতে চাই।μ=0μ0

কিন্তু অপেক্ষা করো! যদি এটি আমার নাল অনুমান হয় তবে আমি কীভাবে আমার নাল বন্টন সেট করব। নমুনা গড়ের নাল বিতরণ জনসংখ্যার প্যারামিটারের কিছু ধরে নেওয়া মানের জন্য পরিচিত (এখানে )। তবে বর্তমান শূন্যের অধীনে এটি অনেকগুলি মান নিতে পারে।0

আসুন বলে নেওয়া যাক আমরা অসীম নাল অনুমানগুলি করতে পারি। এর ইতিবাচক মান ধরে নেওয়ার জন্য প্রতিটি । তবে এটি এর প্রথম অনুমানের মধ্যে , আমরা যদি কেবলমাত্র খুব বেশি নেতিবাচক নমুনা বোঝার জন্য প্রত্যাখ্যান করি তবে সহ পরবর্তী প্রতিটি এটিকে প্রত্যাখ্যান করবে। কারণ তাদের জন্য, নমুনা গড়টি জনসংখ্যার পরামিতি থেকে আরও দূরে। সুতরাং মূলত আমাদের যা করতে হবে তা হ'ল কেবল একটি অনুমান করা তবে একটি লেজযুক্তμH0:μ=0H0:μ>0

সুতরাং আপনার সমাধান হয়ে যায়:

H0:μ=0

Ha:μ<0

সর্বোত্তম উদাহরণ হ'ল স্থিরতার জন্য ডিকি-ফুলার পরীক্ষা।

আশাকরি এটা সাহায্য করবে. (ডায়াগ্রামগুলি অন্তর্ভুক্ত করতে চেয়েছিল তবে মোবাইল থেকে জবাব দেওয়া হয়েছে)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.