একটি নির্দিষ্ট বিদ্যালয় রয়েছে যা অনুসারে পরিসংখ্যান পরীক্ষার সর্বাধিক বিস্তৃত পদ্ধতির দুটি পদ্ধতির মধ্যে একটি "সংকর": ফিশার এবং নেইমন-পিয়ারসনের; এই দুটি পন্থা, দাবিটি হিসাবে যায়, "বেমানান" এবং ফলস্বরূপ "সংকর" একটি "অন্তর্নিহিত মিশম্যাশ"। আমি নীচে একটি গ্রন্থপঞ্জি এবং কিছু উদ্ধৃতি সরবরাহ করব, তবে এখনই বলা বাহুল্য যে স্ট্যাটিস্টিকাল হাইপোথিসিস পরীক্ষার উইকিপিডিয়া নিবন্ধে সে সম্পর্কে অনেক কিছু লেখা আছে । এখানে সিভিতে, এই পয়েন্টটি বারবার @ মিশেল লিউ তৈরি করেছিলেন (দেখুন এখানে এবং এখানে )।
আমার প্রশ্নটি হ'ল কেন এফ এবং এনপি পদ্ধতিগুলি বেমানান বলে দাবি করা হয় এবং সংকরকে কেন অন্তরঙ্গ বলে দাবি করা হচ্ছে? নোট করুন যে আমি কমপক্ষে ছয়টি অ্যান্টি-হাইব্রিড পেপার পড়েছি (নীচে দেখুন), তবে তবুও সমস্যা বা যুক্তিটি বুঝতে ব্যর্থ। আরও মনে রাখবেন, এফ বা এনপি আরও ভাল পদ্ধতির হলে আমি বিতর্ক করার পরামর্শ দিচ্ছি না; উভয়ই আমি ঘন ঘনবাদী বনাম বায়েশিয়ান ফ্রেমওয়ার্কগুলি নিয়ে আলোচনা করার প্রস্তাব দিচ্ছি না। পরিবর্তে, প্রশ্নটি হল: এফ এবং এনপি উভয়ই বৈধ এবং অর্থবোধক পন্থা তা গ্রহণ করে, তাদের সংকর সম্পর্কে এত খারাপ কী?
পরিস্থিতিটি আমি কীভাবে বুঝতে পারি তা এখানে। ফিশারের দৃষ্টিভঙ্গি হল মূল্য গণনা করা এবং নাল অনুমানের বিরুদ্ধে প্রমাণ হিসাবে গ্রহণ করা। পি যত কম হবে , তত বেশি প্রমাণ রয়েছে। গবেষক এই প্রমাণটিকে তার পটভূমির জ্ঞানের সাথে একত্রিত করবেন, এটি যথেষ্ট দৃinc়প্রত্যয়ী কিনা তা সিদ্ধান্ত নেবেন এবং সেই অনুযায়ী অগ্রসর হন। (উল্লেখ্য যে ফিশার এর মতামত বছর ধরে পরিবর্তন, কিন্তু এই কি তিনি অবশেষে পোষণ করা যায় converged। মনে হয়) এর বিপরীতে, Neyman-পিয়ারসন পদ্ধতির চয়ন করা হয় α যদি চেক ইন করার সময় এগিয়ে এবং তারপর পি ≤ α; যদি তা হয় তবে এটিকে তাৎপর্যপূর্ণ বলুন এবং নাল অনুমানকে প্রত্যাখ্যান করুন (এখানে আমি এনপি গল্পের বড় অংশ বাদ দিচ্ছি যার বর্তমান আলোচনার কোনও প্রাসঙ্গিকতা নেই)। ফিশার এবং নেইম্যান-পিয়ারসন কাঠামোটি কখন ব্যবহার করবেন তা সম্পর্কে @ গ্যাংয়ের একটি দুর্দান্ত উত্তরও দেখুন ?
হাইব্রিড পদ্ধতির ভ্যালুটি গণনা করা , এটি রিপোর্ট করা (স্পষ্টতই মনে করা হয় যে আরও ছোট আরও ভাল), এবং যদি ফলাফলগুলি উল্লেখযোগ্য হয় তবে পি ≤ α (সাধারণত α = 0.05 ) এবং অন্যথায় উল্লেখযোগ্য নয়। এটি অন্তর্নিহিত বলে মনে করা হচ্ছে। একসাথে দুটি বৈধ কাজ করা কীভাবে অবৈধ হতে পারে, আমাকে মারধর করে।
বিশেষত অসম্পূর্ণ বিরোধী হাইব্রিডবিদরা মূল্যগুলিকে পি < 0.05 , পি < 0.01 , বা পি < 0.001 (বা এমনকি পি ≪ 0.0001 ) হিসাবে প্রকাশের বিস্তৃত অনুশীলনকে দেখেন , যেখানে সর্বদা সবচেয়ে শক্তিশালী বৈষম্য বেছে নেওয়া হয়। যুক্তি হতে পারে, (ক) প্রমাণ শক্তি সঠিকভাবে যেমন সঠিক মূল্যায়ন করা যাবে না বলে মনে হয় পি রিপোর্ট করা হয় না, এবং (খ) মানুষ হিসেবে বৈষম্য ডানদিকের সংখ্যা ব্যাখ্যা করতে ঝোঁক α এবং ধরন আমি রেট এরর যেমন দেখতে , এবং এটি ভুল। আমি এখানে একটি বড় সমস্যা দেখতে ব্যর্থ। প্রথমত, প্রতিবেদন সঠিক পিঅবশ্যই একটি ভাল অনুশীলন, তবে যদি উদাহরণস্বরূপ 0.02 বা 0.03 হয় তবে কেউই সত্যিই চিন্তা করে না , সুতরাং এটি লগ স্কেলে গোল করা খুব খারাপ নয় (এবং ∼ 0.0001 এর নিচে যাওয়া কোনওভাবেই বোঝা যায় না, দেখুন কীভাবে ছোট পি-মানগুলি প্রতিবেদন করা উচিত ? )। দ্বিতীয়ত, যদি sensক্যমত্যটি 0.05 এর নীচে সমস্ত কিছুকে কল করতে হয় , তবে ত্রুটির হার হবে α = 0.05 এবং p ≠ α , যেমন @ গ্যাং অনুমানের পরীক্ষায় পি-ভ্যালুর ব্যাখ্যায় ব্যাখ্যা করেছেন। যদিও এটি সম্ভাব্য একটি বিভ্রান্তিকর সমস্যা, এটি আমাকে পরিসংখ্যানগত পরীক্ষার (সংকরটির বাইরে) অন্যান্য ইস্যুগুলির চেয়ে বেশি বিভ্রান্তিকর হিসাবে আঘাত করে না। এছাড়াও, প্রত্যেক পাঠককে তার নিজের প্রিয় থাকতে পারে যখন একটি সংকর কাগজ, এবং এর ফলে তার নিজের ত্রুটি হার পড়া মনে। তাহলে বড় ব্যাপারটি কী?
কারণ এটা আক্ষরিক কারণে আমি এই প্রশ্ন জিজ্ঞাসা করতে চান তার এক ব্যাথা দেখতে কিভাবে উইকিপিডিয়ার নিবন্ধের অনেক পরিসংখ্যানগত অনুমান পরীক্ষামূলক সংকর lambasting ভক্তি করা হয়। হাল্পিন ও স্ট্যামের অনুসরণ করে দাবি করা হয়েছে যে এএ নির্দিষ্ট লিন্ডকুইস্টকে দোষ দেওয়া হয়েছে (তাঁর পাঠ্যপুস্তকের হলুদ বর্ণিত "ত্রুটিগুলি" এমন একটি বড় স্ক্যানও রয়েছে) এবং অবশ্যই লিন্ডকুইস্ট সম্পর্কে উইকির নিবন্ধটি একই অভিযোগ থেকে শুরু হয়। তবে তারপরে, আমি কিছু মিস করছি।
তথ্যসূত্র
গিগেরেনজার, 1993, সুপ্রেগো, অহং এবং পরিসংখ্যানগত যুক্তিতে আইডি - "হাইব্রিড" শব্দটি চালু করেছিলেন এবং এটিকে "অন্তর্নিহিত মিশম্যাশ" নামে অভিহিত করেছেন
- জিগেরেনজার এট-এর আরও সাম্প্রতিক প্রকাশগুলিও দেখুন eg যেমন: মাইন্ডলেস পরিসংখ্যান (2004) এবং দ্য নাল রীতি আপনি সর্বদা কী তাৎপর্য পরীক্ষা সম্পর্কে জানতে চেয়েছিলেন তবে জিজ্ঞাসা করতে ভয় পেয়েছিলেন (2004)।
গুডম্যান, 1999, প্রমাণ-ভিত্তিক মেডিকেল পরিসংখ্যানের দিকে। 1: পি মান ভ্রান্তি
হালপিন অ্যান্ড স্ট্যাম, ২০০,, ইন্ডুকিটিভ ইনফারেন্স বা ইন্ডাকটিভ বিহেভিয়ার: ফিশার এবং নেইমন-পিয়ারসন স্টাটিস্টিকাল টেস্টিং এ সাইকোলজিকাল রিসার্চ (১৯৪০-১৯60০) [নিবন্ধের পরে মুক্ত] - "হাইব্রিড" পদ্ধতির প্রবর্তনের জন্য লিন্ডকুইস্টের ১৯৪০ এর পাঠ্যপুস্তকে দোষারোপ করেছেন
@ মিশেল লিউ, ২০০,, ফার্মাকোলজিতে খারাপ পরিসংখ্যান অনুশীলন (এবং অন্যান্য বেসিক বায়োমেডিকাল শাখা): আপনি সম্ভবত পি জানেন না - একটি দুর্দান্ত পর্যালোচনা এবং ওভারভিউ
দর
জিগেরেনজার: মনোবিজ্ঞানের অনুমানমূলক পরিসংখ্যান হিসাবে যা প্রাতিষ্ঠানিক হয়ে উঠেছে তা ফিশেরিয়ান পরিসংখ্যান নয়। এটি একদিকে ফিশারের কিছু ধারণার একটি অস্পষ্ট মিশ্রমাশ এবং অন্যদিকে নেইমন এবং ইএস পিয়ারসনের কিছু ধারণাগুলি। আমি এই মিশ্রণটিকে পরিসংখ্যানগত অনুক্রমের "হাইব্রিড লজিক" হিসাবে উল্লেখ করি।
গুডম্যান: [নেইম্যান-পিয়ারসন] হাইপোথিসিস পরীক্ষার পদ্ধতির মাধ্যমে বিজ্ঞানীদের একটি ফিউস্টিয়ান দর কষাকষির প্রস্তাব দেওয়া হয়েছিল - এটি দীর্ঘমেয়াদে ভুল সিদ্ধান্তের সংখ্যা সীমাবদ্ধ করার একটি আপাতদৃষ্টিতে স্বয়ংক্রিয় উপায়, তবে কেবল প্রমাণের পরিমাপ করার যোগ্যতা [একটি লা ফিশার] ত্যাগ করে এবং মূল্যায়ন করার মাধ্যমে একক পরীক্ষা থেকে সত্য।
নেইমন-পিয়ারসন হাইপোথিসিস পরীক্ষার সাথে এটি এম্বেড হয়ে গেছে। [...] উদাহরণস্বরূপ, গিবনস এবং প্র্যাট ভ্রান্তভাবে বলেছিলেন: "পি-ভ্যালু প্রতিবেদন করা, সঠিক বা অন্তরালের মধ্যেই হোক না কেন বাস্তবে প্রতিটি ব্যক্তিকে তার নিজের তাত্পর্যকে সর্বোচ্চ সহনীয় সম্ভাবনা হিসাবে বেছে নেওয়ার অনুমতি দেয় টাইপ আমি ত্রুটি। "
হাল্পিন ও স্ট্যাম: লিন্ডকুইস্টের 1940 পাঠটি ফিশার এবং নেইমন-পিয়ারসন পদ্ধতির সংকরনের মূল উত্স ছিল। [...] পরিসংখ্যানগত পরীক্ষার কোনও নির্দিষ্ট ব্যাখ্যা মেনে চলার পরিবর্তে মনোবিদরা ফিশার এবং নেইমন-পিয়ারসন বিতর্কে জড়িত ধারণাগত অসুবিধাগুলি সম্পর্কে উদাসীন এবং সত্যই অবহেলিত রয়েছেন।
লিউ: আমাদের কাছে যা আছে তা একটি হাইব্রিড পদ্ধতির যা ত্রুটি হারকে নিয়ন্ত্রণ করে না এবং প্রমাণের শক্তির মূল্যায়নও করতে দেয় না।