বিস্তৃতভাবে বলতে (কেবল ফিট টেস্টিংয়ের ধার্মিকতায় নয়, তবে অন্যান্য অনেক পরিস্থিতিতে) আপনি কেবল সিদ্ধান্ত নিতে পারবেন না যে নালটি সত্য, কারণ এমন কোনও বিকল্প রয়েছে যা কোনও নির্দিষ্ট নমুনার আকারে নাল থেকে কার্যকরভাবে পৃথক হতে পারে।
এখানে দুটি বিতরণ, একটি স্ট্যান্ডার্ড নরমাল (সবুজ শক্ত লাইন) এবং অনুরূপ দেখতে একটি (90% স্ট্যান্ডার্ড নরমাল এবং 10% স্ট্যান্ডার্ডাইজড বিটা (২,২), একটি লাল ড্যাশযুক্ত রেখার সাথে চিহ্নিত):
লালটি স্বাভাবিক নয়। বললে , আমাদের পার্থক্যটি চিহ্নিত করার খুব কম সম্ভাবনা রয়েছে, তাই আমরা কোনও সাধারণ বিতরণ থেকে ডেটা আঁকানো জোর দিয়ে বলতে পারি না - যদি এটি পরিবর্তে লালটির মতো একটি সাধারণ-সাধারণ বিতরণ থেকে হয় তবে কী ঘটবে?n=100
সমান তবে বৃহত্তর পরামিতিগুলির সাথে মানক বিটাগুলির ছোট ভগ্নাংশগুলি সাধারণ থেকে পৃথক হিসাবে দেখতে আরও শক্ত হবে।
তবে প্রদত্ত যে সত্যিকারের ডেটা প্রায় কোনও সাধারণ বিতরণ থেকে পাওয়া যায় না , যদি আমাদের কাছে একটি নিখুঁত ওরাকল (বা কার্যকরভাবে অসীম নমুনার আকার) থাকে, তবে আমরা অবশ্যই সবসময় এই অনুমানটিকে প্রত্যাখ্যান করব যে ডেটা কিছু সাধারণ বিতরণ ফর্ম থেকে ছিল।
জর্জ বক্স যেমন বিখ্যাতভাবে বলেছেন , " সমস্ত মডেল ভুল, তবে কিছু কার্যকর। "
উদাহরণস্বরূপ, স্বাভাবিকতা পরীক্ষা করা বিবেচনা করুন। এমনও হতে পারে যে ডেটা আসলে একটি স্বাভাবিক কিছু ঘনিষ্ঠ থেকে আসা, কিন্তু তারা কি কখনো হতে হবে ঠিক স্বাভাবিক? তারা সম্ভবত কখনও হয় না।
পরিবর্তে, আপনি যে ফর্মটির পরীক্ষার সাথে সবচেয়ে ভাল আশা করতে পারেন তা হ'ল আপনি যে পরিস্থিতিটি বর্ণনা করেছেন। (দেখুন, উদাহরণস্বরূপ, পোস্টটি কি স্বাভাবিকতা পরীক্ষা করা মূলত অকেজো? তবে এখানে আরও বেশ কয়েকটি পোস্ট রয়েছে যা সম্পর্কিত পয়েন্টগুলি তৈরি করে)
এই কারনেই আমি ঘন ঘন লোকেরা যে প্রশ্ন তারা আসলে প্রতি আগ্রহ দেখিয়েছেন সুপারিশ অংশ (যা প্রায়ই কিছু নিকটতম হল 'বিতরণের আমার ডেটা ঘনিষ্ঠ যথেষ্ট যে আমি যে ভিত্তিতে উপযুক্ত মতামতে উপনীত হতে পারি?') সাধারণত ধার্মিকতা-ফিটনেস পরীক্ষার দ্বারা ভাল উত্তর দেওয়া হয় না। স্বাভাবিকতার ক্ষেত্রে, প্রায়শই তারা প্রয়োগ করতে চান এমন অনন্য পদ্ধতি (টি-টেস্ট, রিগ্রেশন ইত্যাদি) বড় নমুনাগুলিতে বেশ ভালভাবে কাজ করার প্রবণতা দেখা দেয় - প্রায়শই এমনকি এমনকি যখন মূল বিতরণ মোটামুটি পরিষ্কারভাবে অ-সাধারণ হয় - ঠিক তখনই যখন কোনও মঙ্গল ফিট পরীক্ষা স্বাভাবিকতা প্রত্যাখ্যান করতে খুব সম্ভবত হবে । এটির একটি প্রক্রিয়া খুব কম ব্যবহার করে যা আপনাকে সম্ভবত বলে দেয় যে আপনার ডেটা অ-স্বাভাবিক যখন কেবল প্রশ্নটি বিবেচনা করে না।F
উপরের চিত্রটি আবার বিবেচনা করুন। লাল বিতরণ অ-স্বাভাবিক, এবং সত্যই বড় আকারের নমুনা সহ আমরা এর থেকে প্রাপ্ত নমুনার উপর ভিত্তি করে স্বাভাবিকতার একটি পরীক্ষা প্রত্যাখ্যান করতে পারি ... তবে তার চেয়ে অনেক ছোট নমুনার আকার, রিগ্রেশন এবং দুটি নমুনা টি-পরীক্ষা (এবং আরও অনেক পরীক্ষায়) তদাতিরিক্ত) এত অসাধারণ আচরণ করবে যে এটিকে অস্বাভাবিকতা এমনকি কিছুটা হলেও ভাবতেও অর্থহীন।
μ=μ0
আপনি কিছু বিচ্যুতি নির্দিষ্ট ধরণের নির্দিষ্ট করতে এবং সমতুল্য পরীক্ষার মতো কিছু দেখতে সক্ষম হতে পারেন তবে এটি উপযুক্ততার ধার্মিকতার সাথে কৌশলযুক্ত কারণ বিতরণ করার জন্য অনেকগুলি উপায় রয়েছে তবে একটি অনুমানযুক্তের থেকে আলাদা এবং আলাদা there পার্থক্যের ফর্মগুলির বিশ্লেষণে বিভিন্ন প্রভাব থাকতে পারে। বিকল্পটি যদি একটি বিস্তৃত পরিবার হয় যা একটি বিশেষ কেস হিসাবে নালকে অন্তর্ভুক্ত করে, তবে সমতা পরীক্ষা আরও বেশি অর্থবোধ করে (উদাহরণস্বরূপ গামার বিরুদ্ধে পরীক্ষামূলক ঘনিষ্ঠভাবে পরীক্ষা করা) - এবং সত্যই, "দুটি একতরফা পরীক্ষা" পদ্ধতির মধ্য দিয়ে চলেছে এবং এটি সম্ভবত "পর্যাপ্ত কাছাকাছি" আনুষ্ঠানিক করার একটি উপায় হয়ে উঠুন (বা এটি যদি গামা মডেলটি সত্য হয় তবে বাস্তবে ফিট টেস্টের একটি সাধারণ ধার্মিকতা দ্বারা প্রত্যাখাত হওয়া কার্যত নিশ্চিত হবে,
ফিটের পরীক্ষার ধার্মিকতা (এবং প্রায়শই আরও বিস্তৃতভাবে হাইপোথিসিস টেস্টিং) কেবলমাত্র পরিস্থিতিগুলির সীমিত পরিসরের জন্য উপযুক্ত। লোকেরা সাধারণত যে প্রশ্নের উত্তর দিতে চায় তা এতটা নির্ভুল নয়, তবে উত্তর দেওয়া আরও কিছুটা অস্পষ্ট এবং কঠিন - তবে জন টুকি যেমন বলেছিলেন, " সঠিক প্রশ্নের সঠিক অনুমানের উত্তর, যা প্রায়শই অস্পষ্ট, তার সঠিক উত্তরটির চেয়ে আরও ভাল better ভুল প্রশ্ন, যা সর্বদা সুনির্দিষ্ট করা যায় ""
আরও অস্পষ্ট প্রশ্নের উত্তর দেওয়ার যুক্তিসঙ্গত পদ্ধতির মধ্যে আপনি যে অনুমানটি বিবেচনা করছেন তাতে কাঙ্ক্ষিত বিশ্লেষণের সংবেদনশীলতা যাচাই করার জন্য সিমুলেশন এবং পুনরায় মডেলিং তদন্ত অন্তর্ভুক্ত থাকতে পারে, অন্যান্য অবস্থার তুলনায় যা উপলব্ধ তথ্যগুলির সাথে যুক্তিসঙ্গতভাবে সামঞ্জস্যপূর্ণ।
ε