আনোভা অনুমানগুলি পরীক্ষা করা হচ্ছে


16

কয়েক মাস আগে আমি এস-তে আর-তে সমকামিতা সংক্রান্ত পরীক্ষা সম্পর্কে একটি প্রশ্ন পোস্ট করেছি এবং ইয়ান ফেলো এর জবাব দিয়েছে (আমি তার উত্তরটি খুব lyিলেlyালা করে দেব):

আপনার মডেলের ফিটের সুক্ষতা পরীক্ষা করার সময় হোমোসেসডেস্টিটিটি পরীক্ষাগুলি ভাল সরঞ্জাম নয়। ছোট নমুনাগুলির সাহায্যে আপনার সমকামিতা থেকে প্রস্থানগুলি সনাক্ত করার মতো ক্ষমতা নেই, তবে বড় নমুনাগুলির সাথে আপনার "প্রচুর শক্তি" রয়েছে, তাই আপনার সাম্যতা থেকে এমনকি তুচ্ছ যাত্রাও স্ক্রিন করার সম্ভাবনা বেশি।

তাঁর দুর্দান্ত উত্তরটি আমার মুখে চড় মারল। আমি প্রতিবার আনোভা চালানোর সময় আমি স্বাভাবিকতা এবং সমকামিতা অনুমানগুলি যাচাই করতাম।

আপনার মতামত অনুসারে, আনোভা অনুমানগুলি যাচাই করার সময় সেরা অনুশীলন কী?

উত্তর:


11

প্রয়োগকৃত সেটিংসে অনুমানের কোনও লঙ্ঘন অনুমানের জন্য সমস্যাযুক্ত কিনা তা জানা সাধারণত গুরুত্বপূর্ণ more

তাত্পর্যপূর্ণ পরীক্ষার উপর ভিত্তি করে অনুমান পরীক্ষাগুলি বড় নমুনাগুলিতে খুব কমই আগ্রহী হয়, কারণ বেশিরভাগ অনুমানমূলক পরীক্ষা অনুমানের হালকা লঙ্ঘনের পক্ষে দৃ .় হয়।

অনুমানের গ্রাফিকাল মূল্যায়নের একটি দুর্দান্ত বৈশিষ্ট্য হ'ল তারা লঙ্ঘনের মাত্রায় মনোনিবেশ করে এবং কোনও লঙ্ঘনের পরিসংখ্যানগত তাত্পর্য নয়।

তবে, আপনার ডেটা সংখ্যার সংক্ষিপ্তসারগুলিতে ফোকাস করাও সম্ভব যা অনুমানের লঙ্ঘনের মাত্রাকে পরিমাপ করে এবং পরিসংখ্যানগত তাত্পর্য নয় (যেমন, স্কিউনেস মান, কুর্তোসিস মান, বৃহত্তম থেকে ক্ষুদ্রতম গ্রুপের অনুপাত ইত্যাদি)। আপনি এই মানগুলিতে স্ট্যান্ডার্ড ত্রুটি বা আত্মবিশ্বাসের অন্তরও পেতে পারেন, এটি বৃহত্তর নমুনাগুলির সাথে আরও ছোট হবে। এই দৃষ্টিভঙ্গি সাধারণ ধারণার সাথে সামঞ্জস্যপূর্ণ যে পরিসংখ্যানগত তাত্পর্য ব্যবহারিক গুরুত্বের সমান নয়।


1
দুর্দান্ত উত্তরের জন্য +1 যা সবকিছু গুটিয়ে রাখে। উল্লিখিত সংখ্যাসূচক পদ্ধতিগুলি কীভাবে প্রয়োগ করা যায় তা তাবাচনিক এবং ফিডেলের মাল্টিভারিয়েট স্ট্যাটিস্টিকস (এসপিএস এবং এসএএস এর জন্য) ব্যবহার করে বর্ণনা করা হয়েছে: amazon.com/Using-Multivariate-Astatics- বারবারা- তাবাচনিক / ডিপি / ((তবে এররটগুলি দেখুন সহ ওয়েব পৃষ্ঠা)
হেনরিক

ওয়েল, আমি মনে করি স্কিউনেস এবং কুর্তোসিসের মতো বেশিরভাগ সময়ের সংক্ষিপ্তসারগুলির খুব কম মূল্য থাকে না, তাদের নমুনার বিভিন্নতা কেবলমাত্র বৃহত্তর। যদিও কেউ তাদের পরিবর্তে এল_স্কেউনেস এবং এল-কুরটোসিস নিয়ে বিবেচনা করতে পারেন।
কেজেটিল বি হালওয়ার্সন

@ কেজেটিভালভর্সেন আমি অনুমান করি যে আপনি সাধারণত কোন ধরণের নমুনা আকার নিয়ে কাজ করেন তার উপর নির্ভর করে। আমার অভিজ্ঞতায় প্লট এবং স্কিউনেস স্ট্যাটাস ডেটা বন্টন বোঝার জন্য খুব সহায়ক।
জেরোমি অ্যাংলিম

@ জারোমি অ্যাংলিম: ঠিক আছে। তারপরে আমি অনুমান করি আপনার কাছে সাধারণত খুব বড় নমুনার আকার থাকে! আপনি কি নিজের স্কিউনেস / কুর্তোসিস সহগকে বুটস্ট্র্যাপ করার চেষ্টা করেছিলেন?
কেজেটিল বি হালওয়ারসেন

9

গ্রাফ একটি দম্পতি সাধারণত স্বাভাবিকতা বা হোমসকেস্টাস্টিটির পরীক্ষা থেকে পি মানের চেয়ে অনেক বেশি আলোকিত হবে। স্বতন্ত্র ভেরিয়েবলের বিপরীতে পর্যবেক্ষিত নির্ভরশীল ভেরিয়েবলগুলি প্লট করুন। ফিট বিরুদ্ধে প্লট পর্যবেক্ষণ। স্বাধীন ভেরিয়েবলের বিপরীতে প্লটের অবশিষ্টাংশগুলি। এই প্লটগুলিতে অদ্ভুত লাগছে এমন কোনও কিছু তদন্ত করুন। যদি কিছু অদ্ভুত না দেখায়, তবে আমি অনুমানের একটি উল্লেখযোগ্য পরীক্ষা সম্পর্কে উদ্বিগ্ন হব না।


বেশিরভাগ সময় ভাল পরামর্শ, তবে বড় ডেটাসেটের ক্ষেত্রে কী হবে, যেখানে আপনি সমস্ত ডেটা ম্যানুয়ালি দেখতে পাচ্ছেন না?
dsimcha

1
n1n2<ασ2

2
@ ডিএসিমচা আবার বড় ডেটাসেটগুলি: আপনি "বৃহত" বলতে যা বোঝায় তার উপর নির্ভর করে। অনেক পর্যবেক্ষণ? ভাল গ্রাফিক্স (বক্সপ্লট, জিট্টার ডটপ্লটস, সূর্যমুখী প্লটস) ব্যবহার করুন। অনেক স্বাধীন ভেরিয়েবল? হ্যাঁ, আপনার একটা বক্তব্য আছে ... তবে আপনার যদি এতগুলি আইভি থাকে তবে আপনি প্রতিটি আইভিয়ের বিরুদ্ধে ডিভি প্লট করতে পারবেন না, আমি একটি আনোভা ব্যবহার করেই প্রশ্ন করব - দেখে মনে হচ্ছে এটি কোনওর পক্ষে ব্যাখ্যা করা শক্ত হতে পারে কেস। কিছু স্মার্ট মেশিন লার্নিংয়ের পদ্ধতি আরও ভাল হতে পারে (ব্রায়ান ডি রিপ্লি: "উস্কানিমূলকভাবে ব্যাখ্যা করার জন্য, 'মেশিন লার্নিং হ'ল পরিসংখ্যানকে কোনও মডেল এবং অনুমানের পরীক্ষা করা মাইনাস'")
স্টিফান কোলাসা

ভাল মন্তব্য, +1। যদিও এই নির্দিষ্ট প্রশ্নটি আনোভা সম্পর্কিত, আমি প্লট বনাম পরীক্ষার প্রশ্ন সম্পর্কে আরও সাধারণ পর্যায়ে ভাবছিলাম যখন আমি আমার প্রতিক্রিয়া লিখেছিলাম।
dsimcha

4

আনোভা এর অনুমানগুলি যাচাই করার জন্য খুব ভাল ওয়েব গাইড এবং ব্যর্থ হলে কী করতে হবে। এখানে একটি। এটি অন্য একটি।

মূলত আপনার চোখই সেরা বিচারক, তাই কিছু অনুসন্ধানী বিশ্লেষণ করুন । এর অর্থ ডেটা প্লট করুন - হিস্টোগ্রাম এবং বাক্স প্লটগুলি স্বাভাবিকতা এবং সমকামীতা মূল্যায়ন করার একটি ভাল উপায়। এবং মনে রাখবেন আনোভা এগুলির সামান্য লঙ্ঘনের পক্ষে দৃ is়।


4

কিউকিউ প্লটগুলি অ-স্বাভাবিকতা সনাক্ত করার জন্য বেশ ভাল উপায়।

সমকামিতা জন্য লেভেনের পরীক্ষা বা একটি ব্রাউন-ফোরসিথ পরীক্ষা করে দেখুন। উভয়ই সমান, যদিও বিএফ কিছুটা বেশি শক্ত। বার্টলেট পরীক্ষার তুলনায় এগুলি স্বাভাবিক-স্বভাবের তুলনায় কম সংবেদনশীল তবে তবুও আমি তাদেরকে ছোট নমুনা আকারের সাথে সবচেয়ে নির্ভরযোগ্য হতে না পেলাম।

কিউ কি প্লট

ব্রাউন-ফোরসিথে পরীক্ষা

লেভেনের পরীক্ষা


আপেক্ষিক-বিতরণ প্লটগুলি (বা উদাহরণস্বরূপ, সাধারণ বিতরণের সাথে তুলনা করা) একটি ভাল প্রতিস্থাপন হতে পারে, যেহেতু তাদের ব্যাখ্যা নতুনদের জন্য আরও পরিষ্কার হতে পারে।
কেজেটিল বি হালওয়ার্সন

3

আমি অন্যদের সাথে সম্মত হই যে অনুমানগুলির জন্য তাত্পর্যপূর্ণ পরীক্ষা করা সমস্যাযুক্ত।

k সমান্তরাল সরল রেখা।

উইলকক্সন এবং ক্রেস্কাল-ওয়ালিস পরীক্ষার মতো আধা-প্যারামেট্রিক (র‌্যাঙ্ক) পদ্ধতিগুলি খুব কম অনুমান করে। উইলকক্সন-কৃস্কাল-ওয়ালিস পরীক্ষার সর্বাধিক শক্তি পাওয়ার জন্য ইসিডিএফটির লগিট সমান্তরাল হওয়া উচিত (টাইপ আই ত্রুটি তাদের জন্য কখনও সমস্যা হয় না)। রৈখিকতা প্রয়োজন হয় না । র‌্যাঙ্ক পরীক্ষাগুলি বিভিন্ন গোষ্ঠীর বিতরণগুলি কীভাবে অন্যের সাথে সম্পর্কিত তা অনুমান করে তবে কোনও একটি বন্টনের আকার সম্পর্কে ধারণা অনুমান করে না।


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.