যখন দুটি নমুনার মাধ্যমগুলি উল্লেখযোগ্যভাবে পৃথক হয় তবে কী করতে হবে তবে তাত্পর্যটি খুব কম মনে হচ্ছে


13

আমার দুটি নমুনা রয়েছে ( উভয় ক্ষেত্রেই )। উপায় প্রায় দ্বিগুণ পুলের দ্বারা পৃথক হয় দেব। ফলাফলের মানটি প্রায় 10। যদিও আমি এটা অবাক করে জেনেছি যে আমি নির্ধারিতভাবে দেখিয়েছি যে উপায়গুলি এক নয়, এটি আমার কাছে বড় এন দ্বারা চালিত বলে মনে হয়। ডেটাগুলির হিস্টোগ্রামগুলি দেখে আমি অবশ্যই অনুভব করি না যে ছোট পি-ভ্যালু যেমন ডেটার প্রতিনিধিত্ব করে এবং সত্য বলতে সত্যই এটি উদ্ধৃত করতে স্বাচ্ছন্দ্য বোধ করে না। আমি সম্ভবত ভুল প্রশ্ন জিজ্ঞাসা করছি। আমি যা ভাবছি তা হ'ল: ঠিক আছে, উপায়গুলি ভিন্ন তবে বিতরণগুলি একটি উল্লেখযোগ্য ওভারল্যাপ ভাগ করে নেওয়ার সাথে কী তা সত্যই আসে যায়?টিn70T

এখানেই বায়েশিয়ান টেস্টিং কার্যকর? যদি তাই শুরু করার জন্য ভাল জায়গা কোথায়, কিছুটা গুগল উপকারী কিছু দেয় নি তবে আমি সঠিক প্রশ্ন জিজ্ঞাসা করে নাও করতে পারি। এটি যদি ভুল হয় তবে কারও কি কোনও পরামর্শ আছে? বা এটি কি পরিমাণগত বিশ্লেষণের বিরোধিতা হিসাবে আলোচনার জন্য কেবল একটি বিষয়?


আমি কেবলমাত্র অন্য সমস্ত উত্তরগুলিতে যুক্ত করতে চাই যে আপনার প্রথম বক্তব্যটি ভুল: আপনি সিদ্ধান্তে দেখাতে পারেন নি যে উপায়গুলি আলাদা । একটি টি-পরীক্ষার পি-মান আপনাকে জানিয়ে দিচ্ছে যে আপনার ডেটা পর্যালোচনা করার সম্ভাবনা বা এর বেশি চরম মানগুলি নাল অনুমানের ( সম্ভবত টি-পরীক্ষার জন্য হ'ল , :: { "মাধ্যমগুলি সমান"}), যার অর্থ এই নয় যে উপায়গুলি আসলে, আলাদা । এছাড়াও, আমি ধরে নিয়েছি যে আপনি পুলের ভেরিয়েন্স টি-টেস্ট করার আগে বৈকল্পের সাম্যতা পরীক্ষা করার জন্য একটি এফ-টেস্টও করেছিলেন? μA=μBH0
নস্টোর

আপনার প্রশ্নটি খুব ভাল, যেহেতু এটি একটি গুরুত্বপূর্ণ পার্থক্য নিয়ে আসে এবং এটি দেখায় যে আপনি একটি পরিসংখ্যানগত আউটপুটটিতে কিছু তারকাকে সন্ধান করার চেয়ে এবং নিজেকে সম্পন্ন করার ঘোষণা দেওয়ার চেয়ে আপনার ডেটা সম্পর্কে চিন্তাভাবনা করছেন। বেশ কয়েকটি উত্তর যেমন উল্লেখ করেছে, পরিসংখ্যানগত তাত্পর্য অর্থবহ হিসাবে একই নয় । এবং আপনি যখন এটি সম্পর্কে ভাবেন, তখন সেগুলি হতে পারে না: একটি পরিসংখ্যান পদ্ধতি কীভাবে জানতে পারে যে একটি পরিসংখ্যানগতভাবে উল্লেখযোগ্য গড় পার্থক্যটি ফিল্ড এ এর ​​কিছু অর্থ, কিন্তু ক্ষেত্র বিতে অর্থহীনভাবে ছোট?
ওয়েইন

যথেষ্ট উপযুক্ত, ল্যাঙ্গেজটি স্পট করা হয়নি তবে পি-ভ্যালুটি যখন পাই তখন তার মতো শব্দগুলি সম্পর্কে আমি খুব বেশি উদ্রেক না করি। আমি একটি এফ-পরীক্ষা করেছি (এবং একটি কিউকিউ-প্লট)। এটি যেমন জাজের জন্য যথেষ্ট, ততটুকুই।
বোলার

1
এফডব্লিউআইডাব্লু, যদি আপনার মাধ্যমটি 2 এসডি বাদে থাকে তবে তা আমার কাছে বেশ বড় পার্থক্যের মতো মনে হয়। এটি অবশ্যই আপনার ক্ষেত্রের উপর নির্ভর করবে, তবে এটি এমন একটি পার্থক্য যা লোকেরা সহজেই ডাব্লু / খালি চোখে লক্ষ্য করতে পারে (যেমন, মার্কিন পুরুষ এবং মহিলাদের বয়স 20-29 বয়সের গড় উচ্চতা প্রায় 1.5 এসডি'র চেয়ে আলাদা) আইএমও, যদি বিতরণ ডোন মোটেও ওভারল্যাপ হবে না, আপনাকে কোনও ডেটা বিশ্লেষণ করার দরকার নেই; সর্বনিম্ন, ডাব্লু / 6 এর মতো ছোট, বিতরণ ওভারল্যাপ না করে থাকলে <.05 হবে। Np
গুং - মনিকা পুনরায়

আমি সম্মতি জানলাম যে পার্থক্যটি বড় আকারের হলেও একেবারে অবাস্তব।
বোলার

উত্তর:


12

যাক বোঝাতে প্রথম জনসংখ্যা ও গড় বোঝাতে দ্বিতীয় জনসংখ্যার গড়। মনে হচ্ছে আপনি একটি দুই নমুনা ব্যবহার করেছি কিনা পরীক্ষা -test । উল্লেখযোগ্য ফলাফলটি বোঝায় যে , তবে আপনার আবেদনের জন্য পার্থক্যটি সামান্য বলে মনে হচ্ছে।μ1μ2tμ1=μ2μ1μ2

আপনি যে সমস্যার মুখোমুখি হয়েছিলেন তা হ'ল পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণভাবে প্রয়োগের ক্ষেত্রে উল্লেখযোগ্য ছাড়া অন্য কিছু হতে পারে । যদিও পার্থক্যটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হতে পারে তবে এটি এখনও অর্থবহ নাও হতে পারে ।

বায়েশিয়ান পরীক্ষার ফলে এই সমস্যাটির সমাধান হবে না - আপনি এখনও কেবল এই সিদ্ধান্তে পৌঁছবেন যে একটি পার্থক্য রয়েছে।

বাইরে যাওয়ার কোনও উপায় থাকতে পারে। উদাহরণস্বরূপ, একজন একতরফা হাইপোথিসিস জন্য আপনি সিদ্ধান্ত নিতে পারে যে যদি হয় ইউনিট চেয়ে বড় তারপর যে একটি অর্থপূর্ণ পার্থক্য আপনার অ্যাপ্লিকেশনের জন্য ব্যাপার বৃহৎ যথেষ্ট যে হবে।μ1Δμ2

আপনি পরীক্ষা করতে হবে পরিবর্তে কিনা । -statistic (সমান ভেরিয়ানস অভিমানী) যে ক্ষেত্রে হতে যেখানে হ'ল পুল স্ট্যান্ডার্ড বিচ্যুতি অনুমান। নাল অনুমানের অধীনে, এই পরিসংখ্যানটি স্বাধীনতার ডিগ্রি দিয়ে বিতরণ করা হয়েছে ।μ1μ2Δμ1μ2=0t

T=x¯1x¯2Δsp1/n1+1/n2
sptn1+n22

এই পরীক্ষাটি পূরণকল্পে একটি সহজ উপায় বিয়োগ হয় প্রথম জনসংখ্যা থেকে আপনার পর্যবেক্ষণ থেকে এবং তারপর একটি নিয়মিত চালায় দুই নমুনা একতরফা -test।Δt


8

বেশ কয়েকটি পদ্ধতির তুলনা করা বৈধ, তবে আমাদের ইচ্ছার / বিশ্বাসের পক্ষে এমন একটি নির্বাচন করার লক্ষ্য নিয়ে নয়।

আপনার প্রশ্নের আমার উত্তর: এটি সম্ভব যে দুটি বিতরণ পৃথক উপায়ে থাকার সময় ওভারল্যাপ হয়ে যায়, যা আপনার ক্ষেত্রে বলে মনে হয় (তবে আরও সুনির্দিষ্ট উত্তর দেওয়ার জন্য আমাদের আপনার ডেটা এবং প্রসঙ্গটি দেখতে হবে)।

আমি সাধারণ উপায়ে তুলনা করার জন্য কয়েকটি পদ্ধতির সাহায্যে এটি চিত্রিত করছি ।

1. -testt

একটি এবং থেকে আকারের দুটি সিমুলেটেড নমুনাগুলি বিবেচনা করুন , তারপরে ভ্যালুটি আপনার ক্ষেত্রে যেমন হয় (নীচের আর কোডটি দেখুন)।70N(10,1)N(12,1)t10

rm(list=ls())
# Simulated data
dat1 = rnorm(70,10,1)
dat2 = rnorm(70,12,1)

set.seed(77)

# Smoothed densities
plot(density(dat1),ylim=c(0,0.5),xlim=c(6,16))
points(density(dat2),type="l",col="red")

# Normality tests
shapiro.test(dat1)
shapiro.test(dat2)

# t test
t.test(dat1,dat2)

তবে ঘনত্বগুলি যথেষ্ট ওভারল্যাপিং দেখায়। তবে মনে রাখবেন যে আপনি উপায়গুলি সম্পর্কে একটি অনুমান পরীক্ষা করছেন, যা এই ক্ষেত্রে স্পষ্টভাবে আলাদা তবে মানের কারণে , ঘনত্বগুলির একটি ওভারল্যাপ রয়েছে।σ

এখানে চিত্র বর্ণনা লিখুন

২. এর প্রোফাইল সম্ভাবনাμ

প্রোফাইল সম্ভাবনা এবং সম্ভাবনার সংজ্ঞা জন্য দয়া করে 1 এবং 2 দেখুন

এই ক্ষেত্রে, প্রোফাইলে সম্ভাবনা আকারের একটি নমুনা এবং নমুনা গড় সহজভাবে হয় ।μnx¯Rp(μ)=exp[n(x¯μ)2]

সিমুলেটেড ডেটাগুলির জন্য, এগুলি নিম্নলিখিত হিসাবে আর এ গণনা করা যেতে পারে

# Profile likelihood of mu
Rp1 = function(mu){
n = length(dat1)
md = mean(dat1)
return( exp(-n*(md-mu)^2) )
}

Rp2 = function(mu){
n = length(dat2)
md = mean(dat2)
return( exp(-n*(md-mu)^2) )
}

vec=seq(9.5,12.5,0.001)
rvec1 = lapply(vec,Rp1)
rvec2 = lapply(vec,Rp2)

# Plot of the profile likelihood of mu1 and mu2
plot(vec,rvec1,type="l")
points(vec,rvec2,type="l",col="red")

আপনি দেখতে পাচ্ছেন, সম্ভাবনা অন্তরগুলি এবং কোনও যুক্তিসঙ্গত স্তরে ওভারল্যাপ হয় না।μ1μ2

৩. জেফ্রি ব্যবহারের পূর্বে পোস্টারিয়রμ

বিবেচনা করুন জেফ্রিস পূর্বে এর(μ,σ)

π(μ,σ)1σ2

প্রতিটি ডেটা সেটের জন্য পোস্টারিয়রটি নিম্নরূপে গণনা করা যায়μ

# Posterior of mu
library(mcmc)

lp1 = function(par){
n=length(dat1)
if(par[2]>0) return(sum(log(dnorm((dat1-par[1])/par[2])))- (n+2)*log(par[2]))
else return(-Inf)
}

lp2 = function(par){
n=length(dat2)
if(par[2]>0) return(sum(log(dnorm((dat2-par[1])/par[2])))- (n+2)*log(par[2]))
else return(-Inf)
}

NMH = 35000
mup1 = metrop(lp1, scale = 0.25, initial = c(10,1), nbatch = NMH)$batch[,1][seq(5000,NMH,25)]
mup2 = metrop(lp2, scale = 0.25, initial = c(12,1), nbatch = NMH)$batch[,1][seq(5000,NMH,25)]

# Smoothed posterior densities
plot(density(mup1),ylim=c(0,4),xlim=c(9,13))
points(density(mup2),type="l",col="red")

আবার, উপায়গুলির জন্য বিশ্বাসযোগ্যতা অন্তরগুলি কোনও যুক্তিসঙ্গত স্তরে ওভারল্যাপ হয় না।

উপসংহারে, আপনি দেখতে পারেন যে কীভাবে এই সমস্ত পদ্ধতিগুলি বিতরণগুলির ওভারল্যাপিং সত্ত্বেও, এর অর্থের একটি গুরুত্বপূর্ণ পার্থক্য (যা মূল আগ্রহ) নির্দেশ করে।

একটি ভিন্ন তুলনা পদ্ধতির

ঘনত্বগুলির ওভারল্যাপিং সম্পর্কে আপনার উদ্বেগের বিচার করে, আর একটি পরিমাণ আগ্রহ হতে পারে , সম্ভবত প্রথম র্যান্ডম ভেরিয়েবল দ্বিতীয় ভেরিয়েবলের চেয়ে ছোট হয়। এই পরিমাণটি এই উত্তর হিসাবে অপরিকল্পিতভাবে অনুমান করা যায় । মনে রাখবেন যে এখানে কোনও বিতরণ অনুমান নেই। সিমুলেটেড ডেটার জন্য, এই , এই অর্থে কিছুটা ওভারল্যাপ দেখায়, অন্যদিকে উল্লেখযোগ্যভাবে পৃথক। দয়া করে নীচে প্রদর্শিত আর কোডটি দেখুন।0.8823825P(X<Y)0.8823825

# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}

# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
} 

KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r ) 
} 

# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))  
}

nonpest(dat1,dat2)

আশা করি এটা কাজে লাগবে.


2
(+1) বেসিয়ান পদ্ধতিতে সত্যই দরকারী জবাবের জন্য ধন্যবাদ। একই সাথে পি (এক্স <ওয়াই) লিঙ্কটি অন্য একটি সমস্যার উত্তর দেয় যা আমি একই বিশ্লেষণে ভাবছিলাম।
বোলার

7

সঠিক প্রশ্নের উত্তর দেওয়া

ঠিক আছে, উপায়গুলি ভিন্ন তবে বিতরণগুলি একটি উল্লেখযোগ্য ওভারল্যাপ ভাগ করে নেওয়ার সাথে এটি কী সত্যিই গুরুত্বপূর্ণ?

যে কোনও পরীক্ষা যা জিজ্ঞাসা করে যে গ্রুপের অর্থগুলি আলাদা ইচ্ছাগুলি কিনা, যখন এটি সঠিকভাবে কাজ করে, তখন আপনাকে উপায়গুলি আলাদা কিনা তা আপনাকে জানায়। এটি আপনাকে বলবে না যে ডেটা বিতরণ নিজেই আলাদা, কারণ এটি একটি ভিন্ন প্রশ্ন a এই প্রশ্নটি অবশ্যই উপায়গুলি পৃথক কিনা তা নির্ভর করে কিন্তু এমন অনেকগুলি বিষয়ের উপরও নির্ভর করে যা অসম্পূর্ণতা, স্কিউ এবং কুর্তোসিস হিসাবে সংক্ষেপিত হতে পারে (অসম্পূর্ণভাবে)।

আপনি সঠিকভাবে নোট করে রেখেছেন যে উপায়গুলি যেখানে রয়েছে সেগুলি সম্পর্কে যে পরিমাণ তথ্য আপনি নির্ধারণ করতে পারেন তার উপর নির্ভর করে, সুতরাং আরও ডেটা থাকার ফলে আপনি প্রায় ওভারল্যাপিং বিতরণগুলিতে গড় পার্থক্য চিহ্নিত করতে পারবেন। তবে আপনি ভাবছেন কিনা

যেমন ছোট পি-মানটি ডেটার প্রতিনিধিত্ব করে

আসলে এটি না হয়, অন্তত সরাসরি না। এবং এটি নকশা দ্বারা। এটি আপনার কাছে যে নির্দিষ্টতার (ডেটা নিজেই নয়) নমুনা পরিসংখ্যানের একটি পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক অবস্থান নিশ্চিত করার জন্য এটি আপনার প্রতিনিধিত্বকারী (আনুমানিক কথা বলা) is

আপনি যদি হিস্টোগ্রামগুলি দেখানোর এবং এর মুহুর্তগুলি পরীক্ষা করার চেয়ে ডেটাটিকে আরও আনুষ্ঠানিক উপায়ে উপস্থাপন করতে চান তবে সম্ভবত এক জোড়া ঘনত্ব প্লট সহায়ক হতে পারে। এটি বরং আপনি যে যুক্তিটি পরীক্ষার জন্য ব্যবহার করছেন তা নির্ভর করে depends

একটি বায়েশিয়ান সংস্করণ

এই সমস্ত ক্ষেত্রে, বায়েশিয়ান পার্থক্য 'পরীক্ষা' এবং টি-টেস্টগুলি একইভাবে আচরণ করবে কারণ তারা একই জিনিস করার চেষ্টা করছে। বায়সিয়ান পদ্ধতির ব্যবহারের জন্য কেবলমাত্র আমি যে সুবিধাগুলি চিন্তা করতে পারি তা হ'ল: ক) প্রতিটি গ্রুপের জন্য সম্ভবত পৃথক পৃথক প্রকারের অনুমতি দেওয়া পরীক্ষা করা সহজ হবে, এবং খ) যে পার্থক্যের সম্ভাব্য আকারটি নির্ধারণের ক্ষেত্রে এটি ফোকাস করবে? পার্থক্যের কিছু পরীক্ষার জন্য পি-মান সন্ধান করার চেয়ে। এটি বলেছিল যে এই সুবিধাগুলি বেশ সামান্য: যেমন খ) আপনি সর্বদা এই পার্থক্যের জন্য একটি আত্মবিশ্বাসের বিরতি রিপোর্ট করতে পারেন।

'পরীক্ষার' উপরের উদ্ধৃতি চিহ্নগুলি ইচ্ছাকৃত। বায়েশীয় হাইপোথিসিস টেস্টিং করা অবশ্যই সম্ভব এবং লোকেরা তা করে। যাইহোক, আমি পরামর্শ দেব যে পদ্ধতির তুলনামূলক সুবিধা তথ্যগুলির একটি প্রশংসনীয় মডেল তৈরি করা এবং তার গুরুত্বপূর্ণ দিকগুলি যথাযথ স্তরের অনিশ্চয়তার সাথে যোগাযোগের দিকে ফোকাসে রয়েছে।


3

এই প্রথমত ঘন ঘন পরীক্ষামূলক পিন করা কোনও সমস্যা নয়। সমস্যাটি নাল অনুমানের মধ্যে নিহিত যে এর অর্থগুলি হুবহু সমান। সুতরাং জনসংখ্যা যদি কোনও ক্ষুদ্র পরিমাণের দ্বারা পৃথক হয় এবং নমুনার আকারটি যথেষ্ট বড় হয় তবে এই নাল অনুমানটি প্রত্যাখ্যান করার সুযোগ খুব বেশি। অতএব আপনার পরীক্ষার জন্য পি-মানটি খুব সামান্যই পরিণত হয়েছিল। অপরাধী নাল অনুমানের পছন্দ is ডি> 0 বাছুন এবং নাল অনুমানটি ধরে রাখুন যে উপায়টি d এর চেয়ে কম মানের দ্বারা পরম মানের চেয়ে আলাদা হয়। আপনি ডি বাছাই করেন যাতে প্রত্যাখ্যান করতে সত্যিকারের পার্থক্যটি সন্তোষজনকভাবে বড় হতে হয়। আপনার সমস্যা দূরে যায়। বায়সিয়ান টেস্টিং আপনার সমস্যার সমাধান করে না যদি আপনি অর্থের সঠিক সাম্যতার নাল অনুমানের উপর জোর দেন।


আমি অন্য দু'জনের মতো একই সাথে আমার উত্তর লিখছিলাম।
মাইকেল আর চেরনিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.