ফিট টেস্টের সদল্য: অ্যান্ডারসন – ডার্লিং টেস্ট এবং ক্রিমার ভন মাইসেসের মানদণ্ড সম্পর্কে প্রশ্ন

আমি ফিট টেস্টের সদ্ব্যবহারের জন্য ওয়েব পৃষ্ঠাগুলি পড়ছি, যখন আমি অ্যান্ডারসন-ডার্লিং পরীক্ষা এবং ক্র্যামারভন মাইসেসের মানদণ্ডে এসেছি ।

এখন পর্যন্ত আমি পয়েন্ট পেয়েছি; মনে হয় অ্যান্ডারসন Darling, পরীক্ষা ও Cramer-ভন মিসেস নির্ণায়ক একই, শুধু একটি ভিন্ন তৌল ফাংশন উপর ভিত্তি করে । এছাড়াও ওয়াটসন পরীক্ষার নাম ক্র্যামারভন মাইজেস মাপদণ্ডের একটি বৈকল্পিক রয়েছে । $w$

মূলত আমার এখানে দুটি প্রশ্ন আছে

এই দুটি পদ্ধতি সম্পর্কে গুগলের খুব বেশি ফলাফল নেই; তারা কি এখনও অত্যাধুনিক? বা ইতিমধ্যে কিছু ভাল পদ্ধতির দ্বারা প্রতিস্থাপিত হয়েছে?

শাপিরো-উইলক, কলমোগোরভ – স্মারনভ, লিলিফর্স এবং অ্যান্ডারসন-ডার্লিং পরীক্ষার পাওয়ার তুলনা সম্পর্কিত এই গবেষণাপত্র অনুসারে এটি আশ্চর্যের কিছু বিষয় , এডি বেশ ভাল পারফর্ম করছে; লিলিফর্স এবং কেএসের চেয়ে সর্বদা ভাল এবং এসডাব্লু পরীক্ষার খুব কাছাকাছি, যা বিশেষভাবে সাধারণ বিতরণের জন্য ডিজাইন করা হয়েছে।
এই ধরনের পরীক্ষার জন্য আত্মবিশ্বাসের ব্যবধানটি কী?

এডি, সিএম এবং ওয়াটসন পরীক্ষার জন্য, আমি উইকি পৃষ্ঠাগুলিতে পরীক্ষার পরিসংখ্যানের পরিবর্তনশীল সংজ্ঞায়িত দেখেছি, তবে আত্মবিশ্বাসের ব্যবধানটি খুঁজে পাইনি।

জিনিস ঠিক কে এস পরীক্ষার জন্য আরো সহজবোধ্য আছেন: উপর উইকি পাতা , আস্থা ব্যবধান দ্বারা সংজ্ঞায়িত করা হয় , যার মধ্যে ক্রমবর্ধমান বণ্টনের ফাংশনের থেকে সংজ্ঞায়িত করা হয় । $K_\alpha$ $K$

goodness-of-fit anderson-darling

— অথস
সূত্র

উত্তর:

ফিটের সদ্ব্যবহারের জন্য কোনও একক অত্যাধুনিক শিল্প থাকতে পারে না (উদাহরণস্বরূপ সাধারণ বিকল্পগুলির মধ্যে কোনও ইউএমপি পরীক্ষা উপস্থিত থাকবে না, এবং সত্যিকার অর্থে কিছুই নিকটেও আসে না - এমনকি কিছুটা ক্ষেত্রে অত্যন্ত সম্মত ওমনিবাস পরীক্ষাগুলি ভয়াবহ শক্তি রাখে)।

সাধারণভাবে কোনও পরীক্ষার পরিসংখ্যান বাছাই করার সময় আপনি সেই ধরণের বিচ্যুতি নির্বাচন করেন যা সেই কাজের পক্ষে ভাল এমন একটি পরীক্ষার পরিসংখ্যান সনাক্ত এবং ব্যবহার করা সবচেয়ে গুরুত্বপূর্ণ। কিছু পরীক্ষাগুলি বিভিন্ন ধরণের আকর্ষণীয় বিকল্পগুলিতে খুব ভাল করে, এগুলি তাদের শালীন ডিফল্ট পছন্দ করে তোলে, তবে এটি তাদের "শিল্পের রাজ্য" করে না।

অ্যান্ডারসন ডার্লিং এখনও খুব জনপ্রিয়, এবং সঙ্গত কারণেই। আজকাল ক্র্যামার-ভন মাইজেস পরীক্ষাটি খুব কম ব্যবহৃত হয় (আমার অবাক হওয়ার কারণ এটি সাধারণত কোলমোগোরভ-স্মারনভের চেয়ে ভাল তবে অ্যান্ডারসন-ডার্লিংয়ের চেয়ে সহজ) - এবং প্রায়শই "মাঝখানে" পার্থক্যের তুলনায় এর চেয়ে ভাল ক্ষমতা রয়েছে বণ্টন)

এই সমস্ত পরীক্ষাগুলি কিছু ধরণের বিকল্পের বিরুদ্ধে পক্ষপাতদুষ্টতায় ভুগছে এবং অ্যান্ডারসন-ডার্লিং অন্যান্য পরীক্ষাগুলির চেয়ে আরও খারাপ (ভয়ঙ্কর, সত্যই) এমন ঘটনাগুলি খুঁজে পাওয়া সহজ। (আমি যেমন পরামর্শ দিয়েছি, সেগুলি সবগুলিতে শাসনের জন্য এক পরীক্ষার চেয়ে 'কোর্সের জন্য আরও বেশি ঘোড়া')। দুর্ভাগ্যক্রমে, এই ইস্যুতে প্রায়শই সামান্য বিবেচনা দেওয়া হয় (আমার কাছে সবচেয়ে গুরুত্বপূর্ণ যে বিচ্যুতিগুলি উত্থাপন করা সবচেয়ে ভাল?), দুর্ভাগ্যক্রমে।

এই পোস্টগুলির কয়েকটিতে আপনি কিছু মান খুঁজে পেতে পারেন:

শাপিরো – উইলক সেরা নরমালারি পরীক্ষা? কেন এটি অ্যান্ডারসন-ডার্লিংয়ের মতো অন্যান্য পরীক্ষাগুলির চেয়ে ভাল হতে পারে?

২ নমুনা কোলমোগোরভ-স্মারনভ বনাম অ্যান্ডারসন-ডার্লিং বনাম ক্র্যামার-ভন-মাইস (প্রায় দুটি নমুনা পরীক্ষা তবে অনেকের বিবৃতি বহন করে

বিতরণের মধ্যে কলমোগোরভের দূরত্বের অনুপ্রেরণা (আরও তাত্ত্বিক আলোচনা তবে ব্যবহারিক প্রভাব সম্পর্কে বেশ কয়েকটি গুরুত্বপূর্ণ বিষয় রয়েছে)

ক্রিমার-ভন মাইজস এবং অ্যান্ডারসন ডারলাইন পরিসংখ্যানগুলিতে আপনি সিডিএফ-র জন্য একটি আত্মবিশ্বাসের ব্যবধান তৈরি করতে সক্ষম হবেন বলে আমি মনে করি না, কারণ মানদণ্ডগুলি কেবল বৃহত্তম বৃহত্তমের পরিবর্তে সমস্ত বিচরণের উপর ভিত্তি করে।

— গ্লেন_বি -রাইনস্টেট মনিকা
সূত্র

আমি এমন কিছু বোঝাতে "শিল্পের অবস্থা" নিয়েছি যা ব্যবহারকে খুঁজে পায় যা অপ্রচলিত নয়। একাধিক ধার্মিকতার-ফিট-সংজ্ঞা সংস্থার অস্তিত্ব আমাদের কাছে সিগন্যাল করা উচিত যে ভালতা-অফ-ফিট কোনও একক ধারণা নয়। বিবেচনা করুন যে "ভাল" নির্ভর করে আমরা কেন "রিগ্রেশন" চালিয়ে যাচ্ছি তার উপর। ধরা যাক, আমরা সি সি এর সেরা ভবিষ্যদ্বাণী পেতে মডেল এ-তে ডেটা বি এ ফিট করছি তবে "ভাল" হ'ল সি নন বি এর সেরা ভবিষ্যদ্বাণী তবে যাইহোক, প্রায়শই বি এবং সি কীভাবে পৃথক হয় সে প্রশ্নটি উপেক্ষা করা হয়।

— কার্ল

আপনি কি একটি অভিধান (অথবা wikipedia) তিনি দেখতে চান @Carl শিল্প রাষ্ট্র ফ্রেজ আপনার ব্যাখ্যা নয় কিভাবে অধিকাংশ লোক ফ্রেজ পড়া - সাধারণত মানে নেওয়া হয়। শব্দকোষগুলি এ জাতীয় কথা বলে: " উন্নয়নের সর্বাধিক সাম্প্রতিক পর্যায়, সর্বাধিক ধারণাগুলি একত্রিত করে " এবং " একটি নির্দিষ্ট সময়ে উন্নয়নের সর্বোচ্চ স্তর " এবং " আধুনিক প্রযুক্তি ব্যবহার করে " কাটিয়া প্রান্ত "। এই প্রসঙ্গে - ফিটের উপকারের পরীক্ষা করা - এই বাক্যটি বোঝায় যে "আমরা সম্ভবত এখনই করতে পারি সেরা"। আমি জোর দিয়েছি যে এটি এমন কোনও কিছু নয় যা আপনি কোনও একক পরীক্ষা সম্পর্কে সত্যই বলতে পারেন। ... সিটিডি

— গ্লেন_বি -রেইনস্টেট মনিকা

... উদাহরণস্বরূপ আমরা বলতে পারি যে শাপিরো-উইলকের মতো জনপ্রিয় পরীক্ষাগুলিতে (স্বাভাবিকতা পরীক্ষা করার ক্ষেত্রে খুব জনপ্রিয়) বিস্তৃতভাবে আরও ভাল শক্তির প্রতিযোগী রয়েছে (যেমন শাপিরো এবং চেন 1995 দেখুন) - তবে প্রতিটি পরিস্থিতিতে নয়। পরীক্ষার কোনও একক পছন্দ নেই (এবং সেইজন্য, কোনও শিল্পের প্রকৃত অবস্থা নেই)। অবশ্যই আমি সম্মত হই যে সর্বোত্তম (শিল্পের অবস্থা) পরিস্থিতিগুলির উপর নির্ভর করে --- এটি আমার উত্তরের মূল বিষয়; সম্ভাব্য উত্তরগুলি অগণিত - এক পরিস্থিতিতে ভাল কিছু অন্য পরিস্থিতিতে খুব খারাপ হতে পারে। "কখন সেরা" তা জিজ্ঞাসা করার চেয়ে পরীক্ষাগুলি কখন ভাল সঞ্চালন করে তা জানার অর্থ প্রদান করে যেন এটি কোনও জিনিস।

— গ্লেন_বি -রাইনস্টেট মনিকা

সত্য, আপনার সংজ্ঞাটি আরও সঠিক। তবে পদ্ধতির পরীক্ষার চেয়ে আরও অনেকগুলি পদ্ধতি রয়েছে এবং "শিল্পের রাজ্য" মূলত কল্পকাহিনী, অর্থাত্ "শিল্পের" কোনও "রাষ্ট্র" নেই যা আছে তার সবকটি চরিত্র নায়ক। এই ধরনের নেবুলাস পোস্টের কোনও প্রতিক্রিয়া হ'ল সমতুল্য। আমি 'হ্যাঁ' বলেছিলাম এবং আপনি 'না' বলেছিলেন এবং আমরা দুজনেই একই কথা বলেছি।

— কার্ল

বিটিডাব্লু, প্রশ্নটি ছিল "শিল্পের রাজ্য" বা "প্রতিস্থাপন" যা আমি "অপ্রচলিত, বা অপ্রচলিত নয়" হিসাবে গ্রহণ করেছি। সুতরাং আমার উত্তরের জন্য একটি প্রসঙ্গ ছিল যার প্রসঙ্গটি ছিল "অনুগ্রহ করে ধরে নিন যে 'শিল্পের রাষ্ট্র' এবং 'প্রতিস্থাপন' প্রতিসত্তা, এবং দয়া করে এর মধ্যে একটি চয়ন করুন।" আপনি সঠিক যে এগুলি প্রতিশব্দ নয়, আমি প্রসঙ্গে উত্তর দিচ্ছিলাম এবং আপনি প্রশ্নটি ভিক্ষা করতে পছন্দ করেছেন। সুতরাং, আমার ছিল ভদ্র উত্তর। এবং, আমি আপনার উত্তরের পক্ষে ভোট দিতে যাচ্ছি, কারণ আমি অত্যধিক ভদ্র না হলে এটি তথ্যবহুল বলে মনে করি।

— কার্ল

$n=400$ কোলমোগোরভ-স্মারনভ পরীক্ষার চেয়ে আরও শক্তিশালী ক্রমহ্রাসমান ঘনত্বের কার্যকারিতা সদ্ব্যবহারের পরীক্ষা এবং এটি টি-টেস্টিংয়ের চেয়ে বড় বা কম ক্ষমতা পেতে পারে। চি-স্কোয়ারে কম সেল গুনতে সমস্যা হয়, তাই ফিটিং লেজগুলির জন্য ব্যাপ্তি সীমাবদ্ধতা ব্যবহৃত হয়।

** প্রশ্ন 1: ... হয় ... এই দুটি পদ্ধতি ... এখনও অত্যাধুনিক? বা ইতিমধ্যে কিছু ভাল পদ্ধতির দ্বারা প্রতিস্থাপিত হয়েছে? প্রশ্ন 2 এই জাতীয় পরীক্ষার জন্য আস্থার ব্যবধানটি কী? **

উত্তর: তারা শিল্পের রাষ্ট্র। তবে, কখনও কখনও আমরা আত্মবিশ্বাসের অন্তরগুলি সম্ভাবনা না করেই চাই। একে অপরের সাথে এই পদ্ধতিগুলির তুলনা করার সময় আমরা আত্মবিশ্বাসের অন্তরগুলির চেয়ে শক্তির কথা বলি। কখনও কখনও ASS, BIC এবং অন্যান্য মানদণ্ড ব্যবহার করে ভাল ফিটিংয়ের সম্ভাবনার বিপরীতে যেমন বিশুদ্ধতা-অফ-ফিট বিশ্লেষণ করা হয় এবং কখনও কখনও ধার্মিকতা-এর-মানদণ্ড অপ্রাসঙ্গিক হয়, উদাহরণস্বরূপ, যখন মঙ্গলতার সাথে ফিটনেসের মানদণ্ড হয় না । পরবর্তী ক্ষেত্রে, আমাদের প্রতিরোধের লক্ষ্য কোনও শারীরিক পরিমাণ হতে পারে যা ফিটিংয়ের সাথে সম্পর্কিত নয়, উদাহরণস্বরূপ, টাকা-জিভি দেখুন ।

— কার্ল
সূত্র

এনবি অ্যান্ডারসন-ডার্লিং পরীক্ষা ক্র্যামার-ভন মাইজেস পরীক্ষার একটি ভারী সংস্করণ; &, এটি পছন্দ মতো যে কোনও অবিচ্ছিন্ন বিতরণের জন্য উপযুক্ত।

— স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন