ক্রমশক্তি পরীক্ষার প্যারামিটারের জন্য আমরা কীভাবে একটি আস্থার ব্যবধান তৈরি করব?


9

মূল ডেটা থেকে এলোমেলোভাবে আঁকা ক্রম ছাড়ার উপর ভিত্তি করে পারমুয়েশন টেস্টগুলি তাত্পর্য পরীক্ষা। বুটস্ট্র্যাপ নমুনাগুলির বিপরীতে প্রতিস্থাপন ছাড়াই পেরমুয়েশন রেসামগুলি আঁকা হয়, যা প্রতিস্থাপনের সাথে আঁকা হয়। এখানে একটি সাধারণ ক্রমানুসারে পরীক্ষার আমি আর এর উদাহরণ দিয়েছি । (আপনার মন্তব্য স্বাগত)

পেরমুয়েশন টেস্টগুলির দুর্দান্ত সুবিধা রয়েছে। এগুলির জন্য সাধারণতার মতো নির্দিষ্ট জনসংখ্যার আকারের প্রয়োজন হয় না। এগুলি নাল অনুমানের অধীনে একটি সাধারণ বন্টন রয়েছে এমন পরিসংখ্যানগুলিতে নয়, বিভিন্ন পরিসংখ্যানের ক্ষেত্রে প্রযোজ্য। তারা জনসংখ্যার আকার এবং আকার নির্বিশেষে খুব সঠিক পি-মান দিতে পারে (যদি পর্যাপ্ত অনুমান ব্যবহার করা হয়)।

আমি আরও পড়েছি যে পরীক্ষার সাথে একটি আস্থা অন্তর দেওয়া প্রায়শই দরকারী, যা ক্রুয়েশন রিম্যাম্পলিংয়ের পরিবর্তে বুটস্ট্র্যাপ পুনরায় মডেলিং ব্যবহার করে তৈরি করা হয়েছিল।

আপনি কীভাবে ব্যাখ্যা করতে পারেন (বা কেবলমাত্র আর কোডটি দিতে পারেন) কীভাবে একটি আত্মবিশ্বাসের ব্যবধানটি নির্মিত হয় (উদাহরণস্বরূপ উপরোক্ত উদাহরণে দুটি নমুনার মাধ্যমের মধ্যে পার্থক্য রয়েছে)?

সম্পাদনা

কিছু গুগল করার পরে আমি এই আকর্ষণীয় পড়া খুঁজে পেল ।

উত্তর:


7

ক্রমশক্তি পুনরায় মডেলিং ব্যবহার করা ঠিক আছে। এটি সত্যিই বিভিন্ন কারণের উপর নির্ভর করে। যদি আপনার অনুমতিগুলি তুলনামূলকভাবে কম সংখ্যার হয় তবে আপনার আত্মবিশ্বাসের বিরতি সম্পর্কে আপনার অনুমানের অনুমতি ছাড়াই এত বড় নয়। আপনার অনুমতিগুলি কিছুটা ধূসর অঞ্চলে এবং সম্ভবত ভাল।

আপনার পূর্ববর্তী কোড থেকে একমাত্র পার্থক্য হ'ল আপনি অনুমতিগুলির পরিবর্তে এলোমেলোভাবে আপনার নমুনাগুলি তৈরি করতে চান। এবং, আপনি তাদের আরও তৈরি করতে চান, উদাহরণস্বরূপ 1000 বলুন। আপনার পরীক্ষার 1000 প্রতিরূপের জন্য পার্থক্য স্কোর পান। 950 (95%) মাঝের জন্য কাট অফগুলি নিন। এটাই আপনার আত্মবিশ্বাসের ব্যবধান। এটি সরাসরি বুটস্ট্র্যাপ থেকে পড়ে।

আপনি ইতিমধ্যে আপনার উদাহরণটিতে বেশিরভাগ কাজটি করেছেন। dif.treat 462 আইটেম দীর্ঘ। অতএব, আপনার নিম্ন 2.5% এবং উপরের 2.5% কাট অফগুলি (প্রতিটি প্রান্তে প্রায় 11 টি আইটেম) প্রয়োজন।

আপনার কোডটি আগে থেকেই ব্যবহার করা হচ্ছে ...

y <- sort(dif.treat)
ci.lo <- y[11]
ci.hi <- y[462-11]

অফ হ্যান্ড আমি বলব যে 462 সামান্য কম তবে আপনি দেখতে পাবেন 10,000 এর একটি বুটস্ট্র্যাপ স্কোর যা কিছুটা পৃথক (সম্ভবত গড়ের কাছাকাছি) থেকে বেরিয়ে আসে।

ভেবেছি আমি বুট লাইব্রেরির জন্য প্রয়োজনীয় কিছু সাধারণ কোডও যুক্ত করব (আপনার পূর্ববর্তী কোডের ভিত্তিতে)।

diff <- function(x,i) mean(x[i[6:11]]) - mean(x[i[1:5]])
b <- boot(total, diff, R = 1000)
boot.ci(b)

ধন্যবাদ. নমুনা ব্যবহার করে sampleএবং তৈরি করা কি ঠিক replace=TRUE? প্যাকেজ ব্যবহার করার মতো কোনও কারণ আছে কি boot?
জর্জ ডোনটাস

সাধারণত এটি প্রতিস্থাপনের সাথে সম্পন্ন হয় যাতে আপনি এটি সত্যে সেট করতে চান। কেন ... প্যাকেজটি অনুকূলিত হয়েছে তাই এটি দ্রুত চালানো উচিত .... এটি কখনই শেষ হয় নি। আপনি আর বড় সেট করে দিলে সমস্যা হতে পারে। এবং, আপনি দেখতে পাচ্ছেন যে কোডটি দুর্দান্ত এবং সংক্ষিপ্ত। এটিতে এমন অনেকগুলি বৈশিষ্ট্য রয়েছে যা আপনি সহজেই নিজের ঘূর্ণায়মান হতে পারবেন না।
জন

boot.ci আত্মবিশ্বাসের ব্যবধানটি প্রদান করে। P.value দেয় এমন কোনও (বুট) ফাংশন আছে কি? (উত্পন্ন নমুনার মোট সংখ্যার তুলনায় কমপক্ষে তত বেশি পার্থক্যের সংখ্যার অনুপাত হিসাবে)
জর্জ ডোনটাস

ঠিক আছে, আমি এটি পাওয়ার জন্য একটি উপায় খুঁজে পেয়েছি:sum(b$t>=b$t0)/b$R
জর্জ ডন্টাস

@ gd047: এটি বিবেচনা করুন যে এটি আপনি এককতরফা p- মান গণনা করছেন।
জোরিস মাইস

4

একটি বিন্যাস পরীক্ষা হিসাবে একটি হল সঠিক পরীক্ষা, আপনি একটি সঠিক P-মান প্রদান করে। পারমিটেশন পরীক্ষার বুটস্ট্র্যাপিংয়ের অর্থ হয় না।

তার পরেও, পরীক্ষার পরিসংখ্যানের আশেপাশের একটি আস্থার ব্যবধান নির্ধারণ করা কোনও অর্থবোধ করে না, কারণ এটি আপনার নমুনার ভিত্তিতে গণনা করা হয় এবং অনুমানের ভিত্তিতে নয়। আপনি আত্মবিশ্বাসের ব্যবধানগুলি যেমন অর্থ এবং পছন্দগুলি হিসাবে অনুমানের কাছাকাছি নির্ধারণ করেন তবে পরীক্ষার পরিসংখ্যানের কাছাকাছি নয়।

পারমুটেশন টেস্টগুলি ডেটাসেটগুলিতে ব্যবহার করা উচিত নয় যা এত বড় যে আপনি আর সমস্ত সম্ভাব্য ক্রমশক্তি গণনা করতে পারবেন না। যদি এটি হয় তবে আপনি যে পরীক্ষামূলক পরিসংখ্যান ব্যবহার করছেন তা কাট-অফ নির্ধারণ করতে একটি বুটস্ট্র্যাপ পদ্ধতি ব্যবহার করুন। তবে আবার, 95% আত্মবিশ্বাসের ব্যবধানের সাথে এটির খুব সামান্যই।

একটি উদাহরণ: আমি এখানে ক্লাসিক টি-স্ট্যাটিস্টিক ব্যবহার করি তবে আমার পরিসংখ্যানের অভিজ্ঞতাগত বন্টনের গণনার জন্য বুটস্ট্র্যাপিংয়ের জন্য একটি সহজ পদ্ধতির ব্যবহার করি। তার উপর ভিত্তি করে, আমি একটি অনুমিত পি-মান গণনা করি:

x <- c(11.4,25.3,29.9,16.5,21.1)
y <- c(23.7,26.6,28.5,14.2,17.9,24.3)

t.sample <- t.test(x,y)$statistic
t.dist <- apply(
      replicate(1000,sample(c(x,y),11,replace=F)),2,
      function(i){t.test(i[1:5],i[6:11])$statistic})

# two sided testing
center <- mean(t.dist)
t.sample <-abs(t.sample-center)
t.dist <- abs(t.dist - center)
p.value <- sum( t.sample < t.dist ) / length(t.dist)
p.value

অ্যাকাউন্টে বিবেচনা করুন যে এই দ্বি-পার্শ্বযুক্ত পরীক্ষাটি কেবলমাত্র প্রতিসম বিতরণের জন্য কাজ করে। অ-প্রতিসাম্যিক বিতরণগুলি সাধারণত একতরফা পরীক্ষা করা হয়।

সম্পাদনা:

ঠিক আছে, আমি প্রশ্নটি ভুল বুঝেছি। পার্থক্যের প্রাক্কলনের জন্য যদি আপনি একটি আত্মবিশ্বাসের ব্যবধান গণনা করতে চান তবে প্রতিটি নমুনার মধ্যে বুটস্ট্র্যাপিংয়ের জন্য আপনি এখানে উল্লিখিত কোডটি ব্যবহার করতে পারেন । মনে মনে, এটি একটি পক্ষপাতদুষ্ট অনুমান: সাধারণত এটি একটি সিআই দেয় যা খুব ছোট। আত্মবিশ্বাসের ব্যবধান এবং পি-মানটির জন্য আপনাকে আলাদা পদ্ধতির ব্যবহার করতে হবে এমন কারণ হিসাবে সেখানে দেওয়া উদাহরণটি দেখুন।


1
আপনি ডেটাসেটগুলিতে কেন পারমিটেশন টেস্ট ব্যবহার করা উচিত নয় তার একটি ব্যাখ্যা আপনি দিতে পারেন যা আপনি সমস্ত সম্ভাব্য অনুমতি নির্ধারণ করতে পারবেন না?
অ্যান্ডি ডব্লিউ

@ অ্যান্ডি ডাব্লু: প্রথমে "অনুক্রম পরীক্ষা" সংজ্ঞায়িত করুন। আমার জন্য, ক্রমুয়েশন পরীক্ষাগুলি হ'ল পরীক্ষা, প্রতিটি সম্ভাব্য ক্রমশ ব্যবহার করে। বড় ডেটাসেটে এটি অসম্ভব। "আনুমানিক অনুক্রমের পরীক্ষাগুলি" আসলে মন্টি কার্লো পদ্ধতিটি প্রায় কাছাকাছি এবং এটিকে ঠিকভাবে সাজানো উচিত। তার পরে, কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি বেশিরভাগ ক্ষেত্রে আশ্বাস দেয় যে বড় ডেটাসেট ব্যবহার করার সময় পরীক্ষার পরিসংখ্যান বিতরণ সম্পর্কিত অনুমানগুলি পূরণ হয়। জটিল পরীক্ষায়, বড় ডেটাসেটগুলিতে ক্রমচারণ পরীক্ষার ব্যবহার কোনও উল্লেখযোগ্য মান যোগ না করে গণনার সময়কে অসহনীয়ভাবে দীর্ঘ করে দেয়। my2cents
জোরিস

পারমিটেশন পরীক্ষার বুটস্ট্র্যাপিংয়ের মতো কিছুই আমি বলিনি। [বিভাগ 14.5 | এর শেষ অনুচ্ছেদটি পড়ে আমি এই প্রশ্নের মধ্যে এসেছি সংক্ষিপ্তসার], সংযুক্ত পিডিএফ এ।
জর্জ ডোনটাস

@ gd047 তারপরে আমি আপনার প্রশ্নটি ভুলভাবে লিখেছি। তবে আপনার অবশ্যই সত্যিকারের আত্মবিশ্বাসের ব্যবধান এবং পি.ভ্যালুগুলি পৃথক করে রাখা উচিত। প্রতিটি নমুনার মধ্যে বুটস্ট্র্যাপিংয়ের উপর ভিত্তি করে আত্মবিশ্বাসের ব্যবধানটি অনুমান করা হয় (যদিও এটি সংজ্ঞা অনুসারে পক্ষপাতদুষ্ট), ক্রমুয়েশন পরীক্ষা সম্পূর্ণ ডেটাসেটের মাধ্যমে অনুমতি দ্বারা করা হয়। এগুলি দুটি সম্পূর্ণ ভিন্ন জিনিস।
জোরিস মেজ

@ কেভিন: কোডটি ডান ছিল ঠিকই। কোডটি আবার পড়ুন: প্রয়োগের মধ্যে বেনামী ফাংশনের x[6:11]যুক্তিকে বোঝায় x। বিভ্রান্ত হতে পারে তবে আপনার সম্পাদনাটি খুব ভুল ফলাফল দিয়েছে। কোডটি সম্পাদনার আগে আপনার কী হওয়া উচিত বলে মন্তব্য করুন। আমাকে রোলব্যাক বাঁচায় আরও বিভ্রান্তির এড়ানোর জন্য, আমি যে পরিবর্তন xকরতেi
Joris Meys

0

উত্তরগুলিতে জরিস মাইস কোড থেকে তবে একক পরিস্থিতিতে আরও টিতে প্রয়োগ করার অনুমতি না দেওয়ার জন্য পরিবর্তন সহ:

আমি অন্যটি সম্পাদনা করার চেষ্টা করেছি তবে শেষ করার মতো সময় আমার হাতে নেই এবং কোনও কারণে আমি মন্তব্য করতে পারছি না (সম্ভবত এটি একটি পুরানো প্রশ্ন)।

x <- c(11.4,25.3,29.9,16.5,21.1)
y <- c(23.7,26.6,28.5,14.2,17.9,24.3)

t.sample <- t.test(x,y)$statistic

t.dist <- apply(
          replicate(1000,sample(c(x,y),length(c(x,y)),replace=F)), 2,
          function(i){t.test(i[1:length(x)],i[length(x)+1:length(c(x,y))])$statistic})

# two sided testing
center <- mean(t.dist)
t.sample <-abs(t.sample-center)
t.dist <- abs(t.dist - center)
p.value <- sum( t.sample < t.dist ) / length(t.dist)
p.value
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.