কত ছোট করতে পারেন ANOVA থেকে মান একাধিক থেকে যারা বনাম হতে -test একই ডেটার উপর -tests?


13

পরিচয়: এই প্রশ্নের দ্বারা আজ যে মনোযোগ পেয়েছে তা উল্লেখ করে, " যখন জুটিযুক্ত টি-টেস্টগুলির মধ্যে কোনওটিই এএনওভা তাৎপর্যপূর্ণ হতে পারে?, " আমি ভেবেছিলাম যে আমি এটি একটি আকর্ষণীয় উপায়ে এটি পুনরায় প্রকাশ করতে সক্ষম হব যা তার নিজস্ব সেটগুলির উত্তর প্রাপ্য হবে would ।

যখন পরিসংখ্যানগত তাত্পর্যকে একটি সাধারণ দ্বিধাত্বিক ধারণা হিসাবে বোঝা যায় এবং কেবলমাত্র বা ভিত্তিতে বিচার করা হয় তখন বিভিন্ন বিবিধ ফলাফল (মুখের মূল্যে) দেখা দিতে পারে । উপরের প্রশ্নের উত্তর @ গ্লেন_ব এর উত্তর একটি মামলার কার্যকর উদাহরণ উপস্থাপন করেছে যেখানে:pα

  • একটি ANOVA -test একটি উত্পাদন করে চার স্তর সঙ্গে এক স্বতন্ত্র ভেরিয়েবলের (চতুর্থ), কিন্তু জন্যFpF<.05
  • pt>.08 আইভির চার স্তরের প্রতিটি জোড়ের সাথে পর্যবেক্ষণের মধ্যে একই নির্ভরশীল চলক (ডিভি) এর মধ্যে পার্থক্যগুলির তুলনা করে এমন দুটি দ্বি-নমুনা টেস্টের জন্য।t

এই প্রশ্নের মাধ্যমে বোনফেরোনি যুগোত্তর যুগের তুলনায় সংশোধন সত্ত্বেও একই রকম একটি পরিস্থিতি উত্থাপিত হয়েছিল: আনোবার পুনরাবৃত্তি ব্যবস্থাগুলি তাৎপর্যপূর্ণ, তবে বনফেরোনি সংশোধনের সাথে সমস্ত একাধিক তুলনা কি নয়? পূর্বে উল্লিখিত কেসগুলি একাধিক প্রতিরোধের ক্ষেত্রে কিছুটা পৃথক পরীক্ষার সাথে উপস্থিত রয়েছে:

আমি বাজি ধরছি যে এই জাতীয় ক্ষেত্রে, কিছু (তবে সমস্ত নয়) জোড়াযুক্ত তুলনা '(বা রিগ্রেশন সহগের' তাত্পর্য পরীক্ষা ') মানগুলি অবশ্যই কাছাকাছি থাকতে হবে যদি কোনও সম্পর্কিত ওমনিবাস পরীক্ষা অর্জন করতে পারে । আমি @ Glen_b এর প্রথম উদাহরণে এটি দেখতে পাচ্ছি, যেখানে , এবং সবচেয়ে বড় পার্থক্যটি সবচেয়ে ছোট । এটি কি সাধারণভাবে হওয়া উচিত? আরও নির্দিষ্টভাবে :α p < α pαp<αপি এফ = .046 পি টিF(3,20)=3.19pF=.046pt=.054


প্রশ্ন: যদি কোনও অ্যানোভা একটি অবিচ্ছিন্ন ডিভিতে একটি চতুর্থের প্রভাবের জন্য একটি উত্পন্ন করে , তবে চতুর্থ স্তরের প্রতিটি জোড়কে তুলনা করে এমন দুটি দ্বি-নমুনা টেস্টের মধ্যে সর্বনিম্ন মান কতটা বেশি হতে পারে ? ন্যূনতম তাত্পর্য কি বেশি হতে পারে ?p F = .05 p t p t = .50FpF=.05ptpt=.50


আমি উত্তরগুলি ঠিকানাটি কেবল মাত্র নির্দিষ্ট প্রশ্ন স্বাগত জানাই । যাইহোক, এই প্রশ্নটি আরও প্রেরণা জানাতে, আমি কয়েকটি সম্ভাব্য বক্তৃতামূলক প্রশ্নগুলি বিস্তারিতভাবে বর্ণনা করব এবং নিক্ষেপ করব। এই উদ্বেগগুলিও সমাধান করতে স্বাগত বোধ করুন এবং এমনকি আপনি যদি চান তবে নির্দিষ্ট প্রশ্নটিকে উপেক্ষা করার জন্যও বিশেষত যদি নির্দিষ্ট প্রশ্নটির একটি নির্দিষ্ট উত্তর পাওয়া যায়।

তাৎপর্য: বিবেচনা করুন যে এবং একটি মধ্যে পার্থক্যটি কত কম গুরুত্বপূর্ণ তা যদি নাল অনুমানের বিরুদ্ধে প্রমাণের শক্তির ধারাবাহিকভাবে বিচার করা হয় (রন ফিশারের , আমার মনে হয়?), নাল পাইকারকে প্রত্যাখ্যান করা উচিত কিনা তা বেছে নেওয়ার ক্ষেত্রে ত্রুটির গ্রহণযোগ্য সম্ভাবনার জন্য above থ্রেশহোল্ডের উপরে বা নীচের হিসাবে দ্বিগুণ পদগুলিতে নয় । " হ্যাকিং " একটি পরিচিত সমস্যা যা আংশিকভাবে এর কুখ্যাতিকে ব্যাখ্যা দ্বারা প্রবর্তিত একটি অপ্রয়োজনীয় দুর্বলতার কাছে প্রাপ্যপি টি = .06 α = .05 পি পি পি পি .10pF=.04pt=.06α=.05pp"যথেষ্ট ভাল" এবং "যথেষ্ট ভাল না" এর সমতুল্য হিসাবে দ্বিধাইকরণের তাত্পর্যপূর্ণ সাধারণ অনুশীলন অনুসারে মানগুলি। যদি কেউ এই অনুশীলনটি নিষ্পত্তি করে এবং অবিচ্ছিন্ন বিরতিতে শূন্যের বিরুদ্ধে প্রমাণের শক্তি হিসাবে মানগুলিকে ব্যাখ্যা করার পরিবর্তে মনোনিবেশ করতে থাকে, তবে যখন কোনও ব্যক্তি একাধিক যুগলতর তুলনা সম্পর্কে সত্যই যত্নশীল হন তখন কি সর্বজনীন পরীক্ষাটি কিছুটা কম গুরুত্বপূর্ণ হতে পারে? অগত্যা বেহুদা নয়, পরিসংখ্যানগত সঠিকতা কোনো যুক্তিসঙ্গতভাবে দক্ষ উন্নতি কাম্য অবশ্যই হয়, কিন্তু ... যেন, উদাহরণস্বরূপ, সর্বনিম্ন pairwise তুলনা এর মান মধ্যে অগত্যা হয় ANOVA এর (অথবা অন্যান্য সমস্ত টেস্ট)pp.10αpমান, এটি কি সর্বজনীন পরীক্ষাকে কিছুটা তুচ্ছ, কম বাধ্যতামূলক, এবং আরও বিভ্রান্তিমূলক করে তোলে না (প্রাইসিসিস্টিং ভুল বোঝাবুঝির সাথে একত্রে), বিশেষত যদি একাধিক পরীক্ষায় নিয়ন্ত্রণ করতে না চায় ?α

বিপরীতভাবে, যদি ডেটা এমন এক অস্তিত্ব থাকতে পারে যে কোনও ওমনিবাস , তবে সমস্ত জোড়ায় , তবে কি অনুশীলন এবং শিক্ষাগত জুড়ে সর্বজনীন এবং বৈপরীত্য পরীক্ষাটি আরও উত্সাহিত করা উচিত নয় ? আমার কাছে মনে হয় যে এই ইস্যুতে দ্বৈতত্ত্ব বনাম একটি ধারাবাহিকতা অনুসারে পরিসংখ্যানগত তাত্পর্য বিচার করার ক্ষেত্রে আপেক্ষিক গুণাগুণকেও অবহিত করা উচিত, যাতে পার্থক্যগুলি "প্রান্তিকভাবে তাত্পর্যপূর্ণ" যখন দ্বি-দ্বৈত ব্যাখ্যামূলক ব্যবস্থা ছোট সামঞ্জস্যের প্রতি আরও সংবেদনশীল হওয়া উচিত, তবে উভয়ই সিস্টেম তত্ত্বের ক্ষেত্রে এই পার্থক্য / সমন্বয় খুব বড় (যেমন, হতে পারে তবে একাধিক তুলনা বা সামঞ্জস্য সমন্বয়ের ক্ষেত্রে ব্যর্থতা থেকে নিরাপদ ।p > .50 পি টি - পি এফ > .40 )p=.05p>.50ptpF>.40)

বিবেচনা বা উপেক্ষা করার জন্য অন্যান্য alচ্ছিক জটিলতা - যা উত্তর দেওয়া সহজ এবং আরও সার্থক করে তোলে :


1
আপনি এই বিষয়টি পরিষ্কার করতে চাইতে পারেন যে পেয়ারওয়াইজ টি-টেস্টগুলি সর্বজনীন এফ-টেস্টের মতো একই ত্রুটি বৈকল্পিক প্রাক্কলনটি ব্যবহার করা উচিত (গ্লেনের উদাহরণে তারা দেয় না)।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

1
আমি ব্যবহারের অর্থের পার্থক্যের জন্য একটি সাধারণ টি-টেস্ট বলতে , তবে সহ আনোভারের বর্গমূল হিসাবে গণনা করা মানে বর্গ ত্রুটি। এটি হ'ল পোস্ট-হক পেয়ারওয়াইজ টি-টেস্ট এবং টুকির এইচএসডি থেকে পৃথক একাধিক তুলনার জন্য সামঞ্জস্য করে না । এটি সমস্ত গোষ্ঠীর তথ্য অন্তর্ভুক্ত করে না, তবে গ্রুপ উপায়ে পার্থক্য থেকে স্বতন্ত্র। σt=(y¯1y¯2)/(σ^1n1+1n2)σ^
স্কোর্টচি - মনিকা পুনরায় ইনস্টল করুন

1
দেখি (সাজানো)! আমি @ Glen_b এর উদাহরণ অনুসরণ করতে এবং using ব্যবহার না করার ক্ষেত্রে প্রাথমিকভাবে আগ্রহী , তবে আপনি সমস্ত গ্রুপ থেকে তথ্য অন্তর্ভুক্ত করতে এড়াতে প্রথম সূত্রটি ব্যবহার করেছেন। এটি বলার অপেক্ষা রাখে না যে আমার এখানে দৃ strong় অগ্রাধিকার রয়েছে ... তবে আমার মূল উদ্দেশ্যটির অংশটি ছিল এই প্রশ্নগুলির মধ্যে সাধারণ থিমের একটি বৈকল্পিক উপস্থাপন করা: "যে কোনও প্রশ্নের জন্য দুটি নির্দিষ্ট গ্রুপকে ছাড়িয়ে তথ্য উপেক্ষা করার আসল ক্ষতি কি? অনেকের মধ্যে দ্বি-নমুনা পরীক্ষা? " আমি অনুমান করি যে থিমটি এই সিদ্ধান্তেও বহনযোগ্য। MSE
নিক স্টাউনার

1
@ স্কোর্টচি আমি অন্যান্য প্রশ্নের একটি উদাহরণ অন্তর্ভুক্ত করেছি যাতে আপনার প্রথম মন্তব্য (যেমন পরীক্ষাগুলি সাধারণ ত্রুটির প্রকরণ এবং ডিএফ ব্যবহার করে করা হয়) কভার করে, যদিও সমস্ত পরীক্ষাগুলি (এফ এবং একাধিক তুলনা) খুব কম তাত্পর্যপূর্ণ স্তরে করা হয় (0.0025, 0.05 নয়)। এখানে নিক এস দ্বারা জিজ্ঞাসা করা পৃথক সাধারণ দুটি-নমুনা টি-টেস্টগুলির সাথে তুলনা করা হলে, এটি দেখায় যে তাত্পর্যপূর্ণভাবে যথেষ্ট পার্থক্য সম্ভব (এই ক্ষেত্রে, সমস্ত সাধারণ টি-পরীক্ষার জন্য, এখনও )। আমি অনেক গ্রুপের সাথে বিশ্বাস করি, আরও অনেক বেশি এগিয়ে যাওয়া সম্ভব। পি এফ < 0.002pt>.05pF<0.002
গ্লেন_বি

1
আমি এই প্রশ্নটির প্রথম অংশের উত্তরটি কয়েক মিনিট আগে স্ট্যাটস.স্ট্যাকেক্সেঞ্জার / প্রশ্নস / ৮৮০৩০/২০ তে একটি মন্তব্যে লিখেছিলাম
whuber

উত্তর:


8

একতরফা বিন্যাসে প্রতিটি চিকিত্সার জন্য সমান (তবে নীচের দ্রষ্টব্য 2 টি দেখুন) ধরে নেওয়া, এবং সমস্ত গ্রুপের পুলযুক্ত এসডি পরীক্ষায় ব্যবহৃত হয় (সাধারণ পোস্টের তুলনায় করা হয়), সর্বাধিক সম্ভব পরীক্ষার জন্য মান হ'ল (এখানে, সিডিএফ নির্দেশ করে )। সুতরাং, কোনও বেশি হতে পারে না । মজার ব্যাপার (এবং বরং bizarrely), আবদ্ধ শুধু নয় ঝুলিতে , কিন্তু কোনো তাত্পর্য স্তরের জন্য আমরা জন্য প্রয়োজন ।t p tntptΦএন(0,1)পিটি0.5.1573পিএফ=.05এফ2Φ(2).1573ΦN(0,1)pt0.5.1573pF=.05F

নিম্নরূপ: নমুনা প্রদত্ত পরিসীমাটির জন্য, , অর্ধেক এক চূড়ান্ত এবং অন্য অর্ধেকটি থাকে তখন সর্বাধিক সম্ভব পরিসংখ্যান অর্জন করা হয়। এটি সেই ক্ষেত্রে প্রতিনিধিত্ব করে যেখানে সবচেয়ে তাত্পর্যপূর্ণ দেখায় যে দুটি উপায় প্রায় এ দ্বারা পৃথক হয় ।এফ ˉ Y আমিএফmaxi,j|y¯iy¯j|=2aFy¯iF2a

সুতরাং, সাধারণতার ক্ষতি ছাড়াই, ধরুন যে যাতে এই সীমানা ক্ষেত্রে । এবং আবার সাধারণতার ক্ষতি ছাড়াই, ধরুন যে , যেমন আমরা সর্বদা এই মানটিকে ডেটা পুনরুদ্ধার করতে পারি। এখন অর্থ বিবেচনা করুন (যেখানে এমনকি সরলতার জন্য [তবে নীচের নোটটি দেখুন 1]), আমাদের কাছে । সেট করা যাতে , আমরা । সব যখন হয় (এবং এখনো , প্রতিটি অশূন্য) ˉ yy¯.=0এম এস = 1 কে কে এফ = এন ˉ 2 / (y¯i=±aMSE=1kk পিএফ=αএফ=এফα=এফα,কে-1,কে(এন-1)F=ny¯2/(k1)MSE=kna2k1pF=αF=Fα=Fα,k1,k(n1) ˉyi±aMSE=1tta=(k1)Fαkny¯i±aMSE=1t পরিসংখ্যাত এইভাবে হয়। এই ক্ষুদ্রতম সর্বোচ্চ মান সম্ভব যখন । tF=t=2a12/n=2(k1)FαktF=Fα

সুতরাং আপনি কেবল এবং , গণনা এবং এর সাথে সম্পর্কিত বিভিন্ন ক্ষেত্রে চেষ্টা করতে পারেন । তবে খেয়াল করুন যে প্রদত্ত , হ্রাস পাচ্ছে [তবে নীচের নোটটি দেখুন 3]; তদতিরিক্ত, হিসাবে , ; তাই । দ্রষ্টব্য যে এর অর্থ এবং এসডি । সুতরাং , নির্বিশেষেএন টি পি টি কে এফ α n এন ( কে - 1 ) এফ α , কেkntptkFαnn টি টি এম আমি এন =(k1)Fα,k1,k(n1)χα,k12 χ2/কে= কে - 1ttmin=2χα,k12/kকে-1χ2/k=k1kχ2/(k1) k-1k1k লিমিকেtমিiএনk1k2k1limktmin=2α , এবং উপরের প্রথম অনুচ্ছেদে আমি যে ফলাফলটি বলেছি তা অ্যাসিপটোটিক স্বাভাবিকতা থেকে প্রাপ্ত।

যদিও এই সীমাটি পৌঁছাতে দীর্ঘ সময় লাগে। ব্যবহার করেR বিভিন্ন মানের জন্য ফলাফলগুলি (গণনা করে ) দেওয়া হচ্ছে :α = .05kα=.05

k       t_min    max p_t   [ Really I mean min(max|t|) and max(min p_t)) ]
2       1.960     .0500
4       1.977     .0481   <--  note < .05 !
10      1.840     .0658
100     1.570     .1164
1000    1.465     .1428
10000   1.431     .1526

কয়েকটি শিথিল প্রান্ত ...

  1. যখন ট বিজোড় হল: সর্বোচ্চ পরিসংখ্যাত এখনও ঘটে যখন সব ; যাইহোক, আমরা আরো এক অন্য চেয়ে পরিসীমা এক শেষে থাকবে, গড় উপার্জন , এবং আপনি দেখাতে পারি যে, ফ্যাক্টর মধ্যে পরিসংখ্যাত দ্বারা প্রতিস্থাপিত হয় । এটি এর ডিনোমিনেটরকেও প্রতিস্থাপন করে , এটি কিছুটা বড় করে এবং তাই হ্রাস ।ˉF±±/কেকেএফকেy¯i±a±a/kkF tptk1ktpt
  2. অসম S:n সর্বোচ্চ এখনও সঙ্গে অর্জিত হয় , লক্ষণ সঙ্গে প্রায় সমানভাবে যতটা সম্ভব নমুনা মাপ সামঞ্জস্য বজায় রাখা ব্যবস্থা। তারপরে একই মোট নমুনার আকার জন্য পরিসংখ্যানগুলি ভারসাম্যপূর্ণ ডেটার তুলনায় একই বা ছোট হবে। তদুপরি, সর্বাধিক পরিসংখ্যান বৃহত্তর হবে কারণ এটি সবচেয়ে বড় সহ এক হবে । সুতরাং ভারসাম্যহীন কেস আমরা বড় মানগুলি অর্জন করতে পারি না ।ˉ y i = ± ±FF N = n i t n i p ty¯i=±aFN=nitnipt
  3. সামান্য সংশোধন: আমি ন্যূনতম করেছিলাম যে আমি সর্বাধিক করার চেষ্টা করছি এবং এটি কম স্পষ্ট যে কম ডিএফ সহ একটি বৃহত চেয়ে কম গুরুত্বপূর্ণ হবে না আরও df সহ যাইহোক, আমি যাচাই করেছি যে এর মানগুলি পক্ষে সামান্য পার্থক্য না করা পর্যন্ত গণনা করে এটিই কেস । কেস আমি এমন কোনও ক্ষেত্রে যেখানে মানগুলি দিয়ে বাড়েনি । নোট করুন যে তাই সম্ভব ডিএফ যা যখন বড় হয় তখনপি টি টি এন = 2 , 3 , 4 , α = .05 , কে 3 পি টি এন ডি f = কে ( এন - 1 ) কে , 2 কে , 3 কে , কে α = .25 .1573 কে = 3 , এন = 2tpttn=2,3,4,α=.05,k3ptndf=k(n1)k,2k,3k,kবড়. সুতরাং আমি উপরের দাবিটি নিয়ে এখনও নিরাপদ স্থানে আছি। আমি করেছি এবং শুধুমাত্র ছাড়িয়ে ক্ষেত্রে আমি ।α=.25.1573k=3,n=2
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.