দূর্বিন-ওয়াটসনকে বাদ দিয়ে কোন অনুমানের পরীক্ষাগুলি অনির্বাচিত ফলাফল আনতে পারে?


10

ডার্বিন-ওয়াটসন পরীক্ষার পরিসংখ্যান একটি মীমাংসাহীন অঞ্চলে, যেখানে এটা সম্ভব হয় প্রত্যাখ্যান বা নাল হাইপোথিসিস প্রত্যাখ্যান করার (এই ক্ষেত্রে শূন্য autocorrelation এর,) ব্যর্থ নয় থাকা পারবেন না।

অন্যান্য কোন পরিসংখ্যানগত পরীক্ষাগুলি "অনির্বাচিত" ফলাফল আনতে পারে?

কেন এই সাধারণ পরীক্ষাগুলি বাইনারিকে "প্রত্যাখ্যান" / "প্রত্যাখ্যান করতে ব্যর্থ" সিদ্ধান্ত নিতে ব্যর্থ হয় তার জন্য সাধারণ ব্যাখ্যা (হাত-তেলাওয়াত ঠিক আছে)?

এটি যদি কোনও উত্তর-পরবর্তী প্রশ্নের উত্তর হিসাবে সিদ্ধান্ত-তাত্ত্বিক প্রভাবগুলি উল্লেখ করতে পারে তবে এটি একটি বোনাস হবে - (ইন) উপসংহারের অতিরিক্ত শ্রেণির উপস্থিতির অর্থ কি আমাদের টাইপ 1 এবং টাইপ II এর ব্যয় বিবেচনা করতে হবে? আরও পরিশীলিত পথে ত্রুটি?


2
কিছুটা অফ-টপিক, তবে এলোমেলো পরীক্ষায় এমন স্বাদ রয়েছে। ডেটার কিছু মানগুলির জন্য, আপনাকে গ্রহণ এবং প্রত্যাখ্যান করার কারণে এলোমেলোভাবে করা প্রয়োজন।
ক্রিস্টোফ হ্যাঙ্ক

@ ক্রিসটফহ্যাঙ্ক ধন্যবাদ, এটি একটি আকর্ষণীয় সংযোগ যা আমি লক্ষ্য করি না। আমি যা করতে চাইছিলাম তা নয়, তবে আমি প্রশ্নটিকে উদ্দেশ্যমূলকভাবে অস্পষ্ট করে রাখছিলাম যে এটি ধরা পড়বে - এই উত্তর (গুলি) এর উপর নির্ভর করে আমি পরে এর ফোকাসটি আরও দৃighten় করতে পারি।
সিলভারফিশ

উত্তর:


10

Wikipedia নিবন্ধটি ব্যাখ্যা করেছেন যে নাল হাইপোথিসিস অধীনে পরীক্ষার পরিসংখ্যান বিতরণের নকশা ম্যাট্রিক্স-বিশেষ রিগ্রেশন ব্যবহৃত predictor মূল্যবোধের কনফিগারেশনের উপর নির্ভর করে। ডুরবিন ও ওয়াটসন পরীক্ষার পরিসংখ্যানগুলির জন্য নিম্ন সীমানা গণনা করেছেন যার অধীনে ধনাত্মক স্বতঃসংশোধনের জন্য পরীক্ষাটি কোনও ডিজাইনের ম্যাট্রিক্স এবং উপরের সীমানার জন্য নির্দিষ্ট গুরুত্বের স্তরে প্রত্যাখ্যান করতে হবে যার উপর পরীক্ষা কোনও ডিজাইনের ম্যাট্রিক্সের জন্য প্রত্যাখ্যান করতে ব্যর্থ হতে হবে । একটি "সীমাবদ্ধ অঞ্চল" কেবলমাত্র সেই অঞ্চল যেখানে আপনার সঠিক নকশার ম্যাট্রিক্সকে বিবেচনায় রেখে সঠিক সমালোচনামূলক মান গণনা করতে হবে, একটি নির্দিষ্ট উত্তর পেতে।

একটি অনুরূপ অবস্থা একটি এক নমুনা ওয়ান-টেইলড t-test এর সম্পাদন করতে যখন আপনি শুধু টি-পরিসংখ্যাত জানেন না থাকার করা হবে, & না নমুনা আকার : 1,645 & 6.31 (স্বাধীনতা ও শুধুমাত্র এক অসীম ডিগ্রী সংশ্লিষ্ট) হবে ০.০৫ আকারের পরীক্ষার জন্য সীমানা।

সিদ্ধান্ত তত্ত্ব যতদূর যায় s নমুনা বৈচিত্রের বিষয়টি বিবেচনায় নেওয়ার জন্য আপনি অনিশ্চিয়তার একটি নতুন উত্স, তবে কেন এটি যৌগিক নাল অনুমানের মতো একই ফ্যাশনে প্রয়োগ করা উচিত নয় তা আমি দেখতে পাই না। আপনি সেখানে কীভাবে এসেছেন তা নির্বিশেষে আপনি একজন অজানা উপদ্রব প্যারামিটারের সাথে একই পরিস্থিতিতে রয়েছেন; সুতরাং আপনার যদি সমস্ত সম্ভাবনার উপরে টাইপ আই ত্রুটি নিয়ন্ত্রণ করার সময় আপনার কোনও প্রত্যাখ্যান / বজায় রাখা সিদ্ধান্ত নিতে হয় তবে রক্ষণশীলতার সাথে প্রত্যাখ্যান করুন (অর্থাত্ ডুর্বিন – ওয়াটসন পরিসংখ্যানগুলি নীচের দিকে আবদ্ধ হলে, বা stat.৩১ এর বেশি টি-স্ট্যাটিস্টিকস)।

† অথবা সম্ভবত আপনি আপনার টেবিলগুলি হারিয়েছেন; তবে মানক গাউসিয়ান এবং কাচি কোয়ান্টাইল ফাংশনের সূত্রের জন্য কিছু সমালোচনামূলক মান মনে রাখতে পারে।


(+1) ধন্যবাদ আমি জানতাম এটি ডার্বিন-ওয়াটসন পরীক্ষার ক্ষেত্রে ছিল (আমার প্রশ্নে সত্যই এটি উল্লেখ করা উচিত ছিল) তবে ভাবছিলেন যে এটি আরও সাধারণ ঘটনার উদাহরণ কিনা, এবং যদি তাই হয় তবে তারা সকলেই মূলত একইভাবে কাজ করে কিনা। আমার অনুমান ছিল যে এটি ঘটতে পারে, উদাহরণস্বরূপ, নির্দিষ্ট পরীক্ষা করার সময় একজনের কাছে কেবলমাত্র সংক্ষিপ্ত তথ্যের অ্যাক্সেস থাকে (অগত্যা কোনও রিগ্রেশনে নয়), তবে ডিডাব্লু একমাত্র ক্ষেত্রে আমি উচ্চতর এবং নিম্ন সমালোচনামূলক মানগুলি সংকলিত এবং ট্যাবুলেটেড দেখে মনে করতে পারি । আমি কীভাবে প্রশ্নটিকে আরও ভাল টার্গেট করে তুলতে পারি সে সম্পর্কে আপনার যদি কিছু চিন্তা থাকে তবে এটি খুব স্বাগত।
সিলভার ফিশ

প্রথম প্রশ্নটি কিছুটা অস্পষ্ট ("কী অন্যান্য পরিসংখ্যানমূলক পরীক্ষা [...]?"), তবে আমি মনে করি না যে আপনি দ্বিতীয়টির উত্তর না দিয়েই এটি পরিষ্কার করতে পারবেন ("এখানে কোনও সাধারণ ব্যাখ্যা আছে [...]?") নিজেকে - সামগ্রিকভাবে আমি মনে করি এটি যেমন দাঁড়িয়েছে ঠিক আছে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

7

সম্ভবত অসম্পূর্ণ ফলাফলের সাথে পরীক্ষার আরেকটি উদাহরণ হ'ল অনুপাতের জন্য দ্বিপদী পরীক্ষা যখন নমুনার আকার নয়, অনুপাতের মাত্রা পাওয়া যায়। এটি পুরোপুরি অবাস্তব নয় - আমরা প্রায়শই ফর্মটির খারাপ চিত্রিত দাবীগুলি দেখতে পাই বা শুনে থাকি "that৩% লোকেরা তাতে সম্মত হন ..." এবং অন্যদিকে, যেখানে ডিনোমিনেটর পাওয়া যায় না।

ধরুন উদাহরণস্বরূপ আমরা কেবল নমুনা অনুপাত জানি কাছাকাছি সমগ্র শতাংশে সঠিক বৃত্তাকার , এবং আমরা পরীক্ষা করতে ইচ্ছুক বিরুদ্ধে এইচ 1 : π 0.5α = 0.05 স্তর।এইচ0:π=0.5এইচ1:π0.5α=0.05

যদি আমাদের পর্যবেক্ষিত অনুপাত ছিল তারপর পর্যবেক্ষিত অনুপাত জন্য নমুনা আকার কমপক্ষে 19 হয়েছে, যেহেতু 1পি=5% হ'ল সর্বনিম্ন ডিনোমিনেটরের সাথে ভগ্নাংশ যা5% হয়ে যাবে। আমরা জানি না যে পর্যবেক্ষণ করা সাফল্যের সংখ্যাটি আসলে ১৯ টির মধ্যে ১ জন, ২০ জনের মধ্যে ১ জন, ২১ জনের মধ্যে ১ টি, ২২ টির মধ্যে ১ টি, ৩ of টির মধ্যে ২ টি, ৫ 55 টির মধ্যে ৩, ৫ টির মধ্যে ৫ ১০০০ এর মধ্যে ১০০ বা ৫০ ... তবে এগুলির মধ্যে যে কোনও একটি, ফলাফলটিα=0.05স্তরেউল্লেখযোগ্য হবে।1195%α=0.05

অন্যদিকে, যদি আমরা জানি যে নমুনা অনুপাতটি তবে আমরা জানি না যে পর্যবেক্ষণ করা সাফল্যের সংখ্যা 100 এর মধ্যে 49 ছিল (যা এই স্তরে তাৎপর্যপূর্ণ হবে না) বা 10,000 এর মধ্যে 4900 (যা কেবলমাত্র তাত্পর্য অর্জন করে)। সুতরাং এক্ষেত্রে ফলাফলগুলি বেআইনী।পি=49%

পি=50%এইচ0

পি=0%পি=50%পি=5%পি=0%পি=100%পি=16%pr(এক্স3)0,00221<0.025পি=17%pr(এক্স1)0,109>0.025পি=16%পি=18%pr(এক্স2)0,0327>0.025পি=19%pr(এক্স3)0,0106<0.025

পি=24%পি=13%α=0.05: রেখার নীচের পয়েন্টগুলি দ্ব্যর্থহীনভাবে তাৎপর্যপূর্ণ তবে এটির উপরে এটিগুলি অনির্বাচিত। পি-মানগুলির প্যাটার্নটি এমন যে ফলাফলগুলি নির্বিঘ্নে তাৎপর্যপূর্ণ হওয়ার জন্য পর্যবেক্ষণ করা শতাংশের উপর একক নিম্ন এবং উচ্চতর সীমা থাকবে না।

অজানা নমুনা আকারের সাথে দ্বিপদী পরীক্ষার স্বল্পতম পি-মান p

আর কোড

# need rounding function that rounds 5 up
round2 = function(x, n) {
  posneg = sign(x)
  z = abs(x)*10^n
  z = z + 0.5
  z = trunc(z)
  z = z/10^n
  z*posneg
}

# make a results data frame for various trials and successes
results <- data.frame(successes = rep(0:100, 100),
    trials = rep(1:100, each=101))
results <- subset(results, successes <= trials)
results$percentage <- round2(100*results$successes/results$trials, 0)
results$pvalue <- mapply(function(x,y) {
    binom.test(x, y, p=0.5, alternative="two.sided")$p.value}, results$successes, results$trials)

# make a data frame for rounded percentages and identify which are unambiguously sig at alpha=0.05
leastsig <- sapply(0:100, function(n){
    max(subset(results, percentage==n, select=pvalue))})
percentages <- data.frame(percentage=0:100, leastsig)
percentages$significant <- percentages$leastsig
subset(percentages, significant==TRUE)

# some interesting cases
subset(results, percentage==13) # inconclusive at alpha=0.05
subset(results, percentage==24) # unambiguously sig at alpha=0.05

# plot graph of greatest p-values, results below red line are unambiguously significant at alpha=0.05
plot(percentages$percentage, percentages$leastsig, panel.first = abline(v=seq(0,100,by=5), col='grey'),
    pch=19, col="blue", xlab="Rounded percentage", ylab="Least significant two-sided p-value", xaxt="n")
axis(1, at = seq(0, 100, by = 10))
abline(h=0.05, col="red")

( এই স্ট্যাকওভারফ্লো প্রশ্নটি থেকে গোলাকার কোডটি ছিটকে গেছে ))

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.