অবশিষ্টগুলি সাধারণত বিতরণ করা হয় তা নিশ্চিত করতে আমি কোন পরীক্ষা ব্যবহার করব?


20

আমার কাছে কিছু তথ্য রয়েছে যা প্রায় সাধারণ বনামের অবশিষ্টাংশের গ্রাফ প্লট করা থেকে দেখায় তবে আমি নিশ্চিত হতে চাই। আমি কীভাবে ত্রুটির অবশিষ্টাংশগুলির স্বাভাবিকতার জন্য পরীক্ষা করতে পারি?


3
ঘনিষ্ঠভাবে সম্পর্কিত: ছোট-নমুনার জন্য উপযুক্ত-স্বাভাবিকতা-পরীক্ষা । এখানে সম্ভাব্য আগ্রহের আরও কয়েকটি প্রশ্ন রয়েছে: স্বাভাবিকতা-পরীক্ষার-মূলত-অকেজো , স্বাভাবিকতা পরীক্ষার মান নিয়ে আলোচনার জন্য, এবং যদি-অবশিষ্টাংশগুলি-সাধারণত-বিতরণ-তবে-ই-ই- হয়- না , বোঝার আলোচনার / স্পষ্টতার জন্য যা স্বাভাবিকতা একটি রৈখিক মডেলের অনুমান।
গুং - মনিকা পুনরায়

শাপিরো উইলক পরীক্ষার সংক্ষেপে খুব সাধারণ ভুল বোঝাবুঝি দেখা যায়! এইচ 0 এর পক্ষে সঠিক অর্থ হ'ল, এইচ 0 টি প্রত্যাখ্যান করা যায় না, তবে সতর্ক হন! এটি স্বয়ংক্রিয়ভাবে "ডেটা সাধারণত বিতরণ করা হয়" এর অর্থ হয় না !!! বিকল্প ফলাফল হ'ল "ডেটা সাধারণত বিতরণ করা হয় না"।
জো হ্যালেনবেক

উত্তর:


28
  1. কোনও পরীক্ষা আপনাকে বলবে না যে আপনার অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয়। আসলে, আপনি নির্ভরযোগ্যভাবে বাজি ধরতে পারেন যে তারা তা নয়

  2. হাইপোথিসিস পরীক্ষা সাধারণত আপনার অনুমানের পরীক্ষা হিসাবে ভাল ধারণা হয় না। আপনার অনুমান নন-স্বাভাবিক প্রভাব সাধারণত নমুনা আকার * একটি ফাংশন নয়, কিন্তু একটি তাত্পর্য পরীক্ষার ফলাফলের হয় । স্বাভাবিকতা থেকে একটি ছোট বিচ্যুতি একটি বড় নমুনার আকারে স্পষ্ট হবে যদিও প্রকৃত আগ্রহের প্রশ্নের উত্তর ('এটি আমার প্রভাবকে কতটা প্রভাবিত করেছিল?') 'খুব কমই' হতে পারে। অনুরূপভাবে, একটি ছোট নমুনা আকারে স্বাভাবিকতা থেকে একটি বড় বিচ্যুতি তাত্পর্য নাও পারে।

    * (সম্পাদনায় যুক্ত) - আসলে এটি একটি বিবৃতি অনেক বেশি দুর্বল। সিএলটি এবং স্লুটস্কির উপপাদ্যটি যে কোনও সময় ধরে রাখার সময় অ-স্বাভাবিকতার প্রভাব আসলে নমুনার আকারের সাথে হ্রাস পায়, যখন নমুনার আকারের সাথে স্বাভাবিকতা প্রত্যাখ্যান করার সম্ভাবনা (এবং সম্ভবত সাধারণত-তত্ত্বের পদ্ধতিগুলি এড়ানো) ক্ষমতা বৃদ্ধি পায় ... ঠিক তখনই আপনি অ-স্বাভাবিকতা সনাক্ত করতে সর্বাধিক সক্ষম হলেন যখন তা কোনওভাবেই না ... এবং এটি যখন ছোট ছোট নমুনাগুলিতে প্রকৃতপক্ষে গুরুত্বপূর্ণ তখন পরীক্ষা কোনও সহায়তা নয়।

    ভাল , কমপক্ষে তাত্পর্য স্তর যতটা যায়। বিদ্যুৎ এখনও একটি সমস্যা হতে পারে যদিও আমরা এখানে যেমন বৃহত নমুনাগুলি বিবেচনা করি তবে সেটিও কোনও ইস্যু কম হতে পারে।

  3. প্রভাব আকার পরিমাপের নিকটে যা আসে তা হ'ল কিছু ডায়াগনস্টিক (কোনও প্রদর্শন বা কোনও পরিসংখ্যান) যা কোনও উপায়ে অস্বাভাবিকতার ডিগ্রি পরিমাপ করে। একটি কিউকিউ প্লট একটি সুস্পষ্ট প্রদর্শন এবং একই জনসংখ্যার একটি কিউকিউ প্লট একটি নমুনা আকারে এবং একটি ভিন্ন নমুনার আকারে কমপক্ষে একই বক্ররেখা উভয়ের শোরগোল অনুমান - প্রায় একই 'অ-স্বাভাবিকতা' দেখায়; এটি কমপক্ষে আনুষাঙ্গিকভাবে আগ্রহের প্রশ্নের কাঙ্ক্ষিত উত্তরের সাথে সম্পর্কিত হওয়া উচিত।

যদি আপনার অবশ্যই একটি পরীক্ষা ব্যবহার করা হয় তবে শাপিরো-উইলক সম্ভবত অন্য যে কোনও কিছুর মতোই ভাল (চেন-শাপিরো পরীক্ষা সাধারণত সাধারণ আগ্রহের বিকল্পগুলির চেয়ে কিছুটা ভাল তবে এর বাস্তবায়নগুলি খুঁজে পাওয়া শক্ত) - তবে এটি একটি প্রশ্নের উত্তর দিচ্ছে আপনি এর উত্তর ইতিমধ্যে জেনেছি; যতবার আপনি প্রত্যাখ্যান করতে ব্যর্থ হন, এটি একটি উত্তর দিচ্ছে আপনি নিশ্চিত হতে পারেন যে ভুল।


4
+1 গ্লেন_বি কারণ আপনি বেশ কয়েকটি ভাল পয়েন্ট করেছেন। তবে আমি ফিট টেস্টের সদ্ব্যবহারের বিষয়ে এতটা নেতিবাচক হব না। যখন নমুনার আকার ছোট বা মাঝারি হয় পরীক্ষার স্বাভাবিক বন্টন থেকে সামান্য প্রস্থান শনাক্ত করার পর্যাপ্ত ক্ষমতা থাকবে না। খুব বড় পার্থক্যের ফলে খুব সামান্য পি-মানগুলি (উদাহরণস্বরূপ 0.0001 বা নিম্ন) হতে পারে। এগুলি কিউকি প্লটের দৃশ্য পর্যবেক্ষণের চেয়ে আরও আনুষ্ঠানিক ইঙ্গিত হতে পারে তবে এটি এখনও খুব কার্যকর still একসাথে স্কিউনেস এবং কুরটোসিসের অনুমানগুলিও দেখতে পারেন। এটি খুব বড় নমুনায় রয়েছে যে ফিট টেস্টগুলির সদর্থকতা সমস্যাযুক্ত।
মাইকেল আর চেরনিক

4
এই ক্ষেত্রে ছোট প্রস্থানগুলি সনাক্ত করা হবে। যতক্ষণ বিশ্লেষক স্বীকৃতি দিয়েছেন যে বাস্তবে জনসংখ্যা বিতরণ হ'ল স্বাভাবিক হবে না এবং নাল হাইপোথেসিসকে প্রত্যাখাত করে কেবল তাকেই বলে চলেছে যে তার বিতরণটি কিছুটা অস্বাভাবিক, তিনি বিপথগামী হবেন না। তদন্তকারীকে তারপরেই বিচার করা উচিত যে স্বাভাবিকতা অনুমান করা উদ্বেগজনক কিনা বা পরীক্ষাটি সনাক্ত করে এমন সামান্য বিদায় দেওয়া হয়নি whether শাপিরো-উইলক আসলে স্বাভাবিকতার অনুমানের বিরুদ্ধে অন্যতম শক্তিশালী পরীক্ষা।
মাইকেল আর চেরনিক

+1, আমি বিশেষত পয়েন্ট # 2 পছন্দ করি; এই রেখাগুলি বরাবর, এটি লক্ষণীয় যে স্কু বা কুর্তোসিস মোটামুটি খারাপ হলেও ডাব্লু / সত্যই বড় এন, কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্য আপনাকে আবরণ করবে, সুতরাং সেই সময়ে আপনার স্বাভাবিকতার প্রয়োজন least
গুং - মনিকা পুনরায়

3
@ গুং এমন কিছু পরিস্থিতি রয়েছে যখন স্বাভাবিকতার জন্য একটি ভাল আনুমানিকতা গুরুত্বপূর্ণ will উদাহরণস্বরূপ, সাধারণ অনুমানগুলি ব্যবহার করে পূর্বাভাস অন্তরগুলি তৈরি করার সময়। তবে আমি এখনও পরীক্ষার চেয়ে ডায়াগনস্টিকের উপর নির্ভর করতে পারি (এটি যে কতটা অস্বাভাবিক তা দেখায়)
Glen_b -Rininstate Monica

পূর্বাভাস অন্তর সম্পর্কে আপনার বক্তব্য একটি ভাল।
গুং - মনিকা পুনরায়

8

শাপিরো-উইলক পরীক্ষাটি একটি সম্ভাবনা।

শাপিরো-উইলক পরীক্ষা

এই পরীক্ষাটি প্রায় সমস্ত পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার প্যাকেজগুলিতে প্রয়োগ করা হয়। নাল হাইপোথিসিসটি হল অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয়, সুতরাং একটি ছোট পি-মান ইঙ্গিত দেয় যে আপনার নালটিকে প্রত্যাখ্যান করা উচিত এবং অবশেষে সিদ্ধান্ত নেওয়া উচিত যে অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয় না।

মনে রাখবেন যে আপনার নমুনার আকার বড় হলে আপনি প্রায় সর্বদা প্রত্যাখ্যান করবেন, তাই অবশিষ্টাংশের দৃশ্যায়ন আরও গুরুত্বপূর্ণ।


এটি "উইলক" "উইলকস" নয়।
মাইকেল আর চেরনিক

1

উইকিপিডিয়া থেকে:

অবিচ্ছিন্ন স্বাভাবিকতার টেস্টগুলির মধ্যে রয়েছে ডি অগোস্টিনোর কে-স্কোয়ার্ড পরীক্ষা, জার্কি-বেরা পরীক্ষা, অ্যান্ডারসন-ডার্লিং পরীক্ষা, ক্র্যামার-ভন মাইসেস মানদণ্ড, স্বাভাবিকতার জন্য লিলিফর্স পরীক্ষা (নিজেই কোলমোগোরভ mir স্মিমনভ পরীক্ষা), দ্য ডিগ্রি শাপিরো – উইলক পরীক্ষা, পিয়ারসনের চি-স্কোয়ার পরীক্ষা এবং শাপিরো – ফ্রান্সিয়া পরীক্ষা। জার্নাল অফ স্ট্যাটিস্টিকাল মডেলিং অ্যান্ড অ্যানালিটিক্সের একটি ২০১০ এর গবেষণাপত্রে এই সিদ্ধান্তে পৌঁছেছে যে শাপিরো-উইলকের একটি নির্দিষ্ট তাৎপর্যের জন্য সর্বোত্তম ক্ষমতা রয়েছে, শাপিরো-উইলক, কলমোগোরভ-স্মারনভ, লিলিফর্স এবং অ্যান্ডারসন- এর সাথে তুলনা করার সময় অ্যান্ডারসন-ডার্লিংয়ের কাছাকাছিভাবে অনুসরণ করা হয়েছে Sha প্রিয়তম পরীক্ষা।


1
-1: আপনি উইকিপিডিয়া পৃষ্ঠায় একটি লিঙ্ক অন্তর্ভুক্ত করতে পারেন, পাদটীকা ("[1]") সরিয়ে ব্লককোট ফাংশনটি ব্যবহার করতে পারেন।
বার্ড ওয়েইস

1
গ্লেন_বি যে সতর্কতা অবলম্বন করে তা যখনই ফিট পরীক্ষাগুলির মধ্যে এই কোনও সদ্ব্যবহার ব্যবহার করা হয় তা মনে রাখা ভাল। আমি মনে করি শাপিরো-উইলকের সম্পর্কে আপনি যে ফলাফলটি স্থির করেছেন, তেমন সাধারণ হয় নি যতটা আপনি তা তৈরি করেন। স্বাভাবিকতার জন্য বিশ্বব্যাপী সবচেয়ে শক্তিশালী পরীক্ষা আছে বলে আমি বিশ্বাস করি না।
মাইকেল আর চেরনিক

2
এন1

@ গ্রেগস্নো আপনার প্যাকেজটি পুরোপুরিভাবে দেখার জন্য আমার কাছে সময় নেই এবং আমি সমস্ত কিছু অনুসরণ করার জন্য আর যথেষ্ট পরিমাণে পারদর্শী হতে পারি না। আপনি কি বলছেন যে স্বাভাবিকতার জন্য বিশ্বব্যাপী সবচেয়ে শক্তিশালী পরীক্ষা রয়েছে বা আপনি বলছেন যে বিভিন্ন পরীক্ষাগুলি সর্বাধিক শক্তিশালী হয় এবং তখন বৈশ্বিক কোনটির অস্তিত্ব থাকে না তা দেখাতে আপনি উদাহরণ সরবরাহ করেন। আমার সন্দেহ আছে যে একটি আছে এবং আমি মনে করি না শাপিরো-উইলক এটি হবে। আপনি যদি দাবি করে থাকেন যে একটি বিদ্যমান, আমি একটি গাণিতিক প্রমাণ বা এর একটি উল্লেখ দেখতে চাই।
মাইকেল আর চেরনিক

1
@ মিশেল চের্নিক, আমার দাবিটি যে আমার পরীক্ষার স্বাভাবিকতার অন্য পরীক্ষা হিসাবে যতটা শক্তি বা তত বেশি (কোনও সঠিক থেকে আগত ডেটার নাল হাইপোথিসিটি প্রত্যাখ্যান করার সম্ভাবনা বেশি) থাকবে। আর কোডটি অনুসরণ করা শক্ত নয়, পি-মান গণনার মূল কোডটি "tmp.p <- যদি (কোনও (is.rational (x))) {0" হয় তবে এর পাওয়ার প্রমাণটি সুস্পষ্ট হওয়া উচিত ( আমি কেবল দাবি করেছি যে এটি শক্তিশালী এবং ডকুমেন্টেশনগুলি দরকারী হতে পারে, পরীক্ষা নিজেই দরকারী নয়, "কোচরানের অ্যাফোরিজম" এর জন্য গুগল)।
গ্রেগ স্নো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.