কোন গ্রুপ পার্থক্য অনুমানের পরীক্ষা কিভাবে?


39

আপনি দুটি গ্রুপ (যেমন, পুরুষ এবং মহিলা) একটি সংখ্যার উপর নির্ভরশীল ভেরিয়েবল (উদাহরণস্বরূপ, গোয়েন্দা পরীক্ষার স্কোর) খুঁজছেন এবং আপনার কোন অনুমান আছে যে কোন গ্রুপ পার্থক্য আছে সঙ্গে আপনার একটি অধ্যয়ন আছে কল্পনা করুন।

প্রশ্ন:

  • কোন গ্রুপ পার্থক্য আছে কিনা তা পরীক্ষা করার একটি ভাল উপায় কী?
  • দলগত কোনও পার্থক্যের জন্য পর্যাপ্তভাবে পরীক্ষা করার জন্য প্রয়োজনীয় নমুনার আকারটি আপনি কীভাবে নির্ধারণ করবেন?

প্রাথমিক চিন্তা:

  • এটি একটি স্ট্যান্ডার্ড টি-টেস্ট করা যথেষ্ট হবে না কারণ নাল অনুমানকে প্রত্যাখ্যান করতে ব্যর্থতার অর্থ এই নয় যে সুদের প্যারামিটার সমান বা শূন্যের কাছাকাছি; এটি বিশেষত ছোট নমুনাগুলির ক্ষেত্রে।
  • আমি 95% আত্মবিশ্বাসের ব্যবধানে তাকিয়ে দেখতে পারি যে সমস্ত মানগুলি যথেষ্ট পরিমাণের মধ্যে রয়েছে; সম্ভবত প্লাস বা বিয়োগ 0.3 মানক বিচ্যুতি।

"এটি নাল অনুমানটি সত্য বলে ধরে নিয়েছে" এর অর্থ কী?
রবিন গিরার্ড

আপনি যদি ভুলভাবে "একটি পার্থক্য আছে" ঘোষণার সম্ভাবনাটি নিয়ন্ত্রণ করতে চান তবে আপনাকে দুটি হাইপোথিসিস পৃথক করতে হবে (আমি ইতিমধ্যে উল্লেখ করেছি আমি এই উদ্ধৃতিটি পছন্দ করি: stats.stackexchange.com/questions/726/… ;))
রবিন গিরার্ড

@ নাল অনুমানের তাত্পর্য পরীক্ষার পি মানটি রবিন হ'ল নাল অনুমানটি সত্য বলে ধরে নেওয়া পর্যবেক্ষণের চেয়ে বেশি বা চরম ডেটা দেখার সম্ভাবনা; তবে সম্ভবত আমি উপরের বক্তব্যটি আরও ভাল বলতে পারতাম।
জেরোমি অ্যাংলিম

@Robin আমি প্রশ্ন পরিবর্তিত আমার পয়েন্ট স্বচ্ছ করে তুলতে চেষ্টা
Jeromy Anglim

উত্তর:


20

আমি মনে করি আপনি সমতার জন্য পরীক্ষার বিষয়ে জিজ্ঞাসা করছেন । মূলত আপনাকে সিদ্ধান্ত নিতে হবে যে দুটি গ্রুপ কার্যকরভাবে সমতুল্য তা এই সিদ্ধান্তে পৌঁছতে আপনার পক্ষে কত বড় পার্থক্য গ্রহণযোগ্য। এই সিদ্ধান্তটি 95% (বা অন্যান্য) আত্মবিশ্বাসের ব্যবধান সীমা নির্ধারণ করে এবং নমুনা আকারের গণনাগুলি এই ভিত্তিতে করা হয়।

বিষয়টিতে একটি সম্পূর্ণ বই রয়েছে।

সমতুল্য পরীক্ষার একটি খুব সাধারণ ক্লিনিকাল "সমতুল্য" হ'ল অ-নিকৃষ্টতা পরীক্ষা / পরীক্ষা । এক্ষেত্রে আপনি একটি গ্রুপকে অন্য দলের (একটি প্রতিষ্ঠিত চিকিত্সা) তুলনায় "পছন্দ" করেন এবং এটি পরীক্ষা করে দেখান যে নতুন চিকিত্সা কোনও পরিসংখ্যানের প্রমাণের পর্যায়ে প্রতিষ্ঠিত চিকিত্সার চেয়ে নিকৃষ্ট নয়।

আমি মনে করি আমি ক্রেডিট প্রয়োজন হার্ভে Motulsky জন্য GraphPad.com সাইট (অধীনে "লাইব্রেরি" )।


16

ইতিমধ্যে উল্লিখিত সম্ভাবনার এক ধরণের সমতা পরীক্ষার সম্ভাবনা ছাড়াও তাদের মধ্যে বেশিরভাগই আমার জ্ঞানের সেরা, বেশিরভাগ ক্ষেত্রেই ভাল পুরাতন ঘনত্ববাদী traditionতিহ্যে গড়িয়ে পড়েছে, পরীক্ষাগুলি পরিচালনার সম্ভাবনা রয়েছে যা সত্যই প্রমাণের পরিমাণ নির্ধারণ করে নাল হিপথিস, বায়েসিয়ান টেস্টের পক্ষে

বেইসিয়ান টি-টেস্টের একটি বাস্তবায়ন এখানে পাওয়া যাবে: ওয়েটজেলস, আর।, রাইজমেকার্স, জেজিডাব্লু, জাকাব, ই।, এবং ওয়াগেনমেকার্স, ই.জে. (2009)। নাল হাইপোথিসিসের পক্ষে ও বিপক্ষে সমর্থন কীভাবে নির্ধারণ করা যায়: একটি ডিফল্ট বায়েশিয়ান টি-টেস্টের একটি নমনীয় উইনবিইউজিএস বাস্তবায়ন। সাইকোনমিক বুলেটিন এবং পর্যালোচনা, 16, 752-760।

আর-তে কীভাবে এটি করা যায় সে সম্পর্কে একটি টিউটোরিয়াল রয়েছে:

http://www.ruudwetzels.com/index.php?src=SDtest


এই গবেষণাপত্রে ক্রুশেকে একটি বেইশিয়ান টি-পরীক্ষার বিকল্প (সম্ভবত আরও আধুনিক পদ্ধতির) সরবরাহ করেছেন (কোড সহ):

কুরুস্কে, জে কে (২০১৩)। বায়েশিয়ান অনুমান টি পরীক্ষাকে ছাড়িয়ে গেছেপরীক্ষামূলক মনোবিজ্ঞানের জার্নাল: সাধারণ , 142 (2), 573–603। ডোই: 10,1037 / a0029146


এই উত্তরের সমস্ত ক্রপগুলি (ক্রুশকে যোগ করার আগে) আমার সহকর্মী ডেভিড কেলেনের কাছে যাওয়া উচিত। আমি এই প্রশ্ন থেকে তার উত্তর চুরি ।


আমি ভাবছিলাম যে কেউ বায়েশিয়ান পদ্ধতি সরবরাহ করবে কিনা। চমৎকার। ধন্যবাদ।
জেরোমি অ্যাংলিম

1
আর এর জন্য দুর্দান্ত বায়েস ফ্যাক্টর প্যাকেজের একটি রেফারেন্স অন্তর্ভুক্ত করার জন্য এই উত্তরটি আপডেট করার উপযুক্ত হতে পারে
ক্রিশ

13

থাইলাকোলিওর উত্তর অনুসরণ করে আমি কিছুটা গবেষণা করেছিলাম।

আর এর সমতুল্য প্যাকেজটির tost()কাজ রয়েছে।

আরও তথ্যের জন্য রবিনসন এবং ফ্রোজ (2004) " সমতা পরীক্ষা ব্যবহার করে মডেল বৈধকরণ " দেখুন।


লিঙ্ক এবং equivalenceপ্যাকেজ পয়েন্টার জন্য ধন্যবাদ ।
chl

8

আমি জানি যে কয়েকটি কাগজপত্র সেগুলি আপনার পক্ষে সহায়ক হতে পারে:

ট্রিওন, ডাব্লুডাব্লু (2001) অনন্য আত্মবিশ্বাসের অন্তরগুলি ব্যবহার করে পরিসংখ্যানগত পার্থক্য, সমতা এবং অনির্দিষ্টতার মূল্যায়ন: নাল হাইপোথিসিসের পরিসংখ্যানগত পরীক্ষা পরিচালনা করার একটি সংহত বিকল্প পদ্ধতি। মনস্তাত্ত্বিক পদ্ধতি, 6, 371-386। ( বিনামূল্যে পিডিএফ )

এবং একটি সংশোধন:
ট্রিওন, ডাব্লুডাব্লু, এবং লুইস, সি। (২০০৮)। ট্রাইনের (2001) হ্রাস কারককে সংশোধন করে পরিসংখ্যানগত সাম্য প্রতিষ্ঠার একটি অনন্য আত্মবিশ্বাসের অন্তর্বর্তী পদ্ধতি। মানসিক পদ্ধতি, 13, 272-278। ( বিনামূল্যে পিডিএফ )

উপরন্তু:

সিমন, এমএ এবং সারলিন, আরসি (1998)। ই দ্বি-গ্রুপ তুলনার জন্য চতুর আস্থা অন্তর । মনস্তাত্ত্বিক পদ্ধতি, খণ্ড 3 (4), 403-411।


এই বিষয়টিতে প্রচুর কাগজপত্র এমনকি বই রয়েছে।
মাইকেল চেরনিক

7

আমি সম্প্রতি দুটি বিতরণের মধ্যকার দূরত্বের ভিত্তিতে "সমতুল্য পরীক্ষার" বিকল্প পদ্ধতির বিষয়ে চিন্তা করেছি ।

দুটি গাউসীয় বিতরণের ওভারল্যাপের জন্য আত্মবিশ্বাসের অন্তরগুলি সরবরাহ করার কিছু পদ্ধতি রয়েছে :এখানে চিত্র বর্ণনা লিখুন

) দুটি বিতরণের মধ্যে ওভারল্যাপ দুটি বিতরণ এবং এর একটি চমৎকার সম্ভাব্য ব্যাখ্যা রয়েছে: যেখানেহয় মোট প্রকরণ দূরত্ব মধ্যে এবং ।পি 1 টি ভি ( পি 1 , পি 2 ) = সাপ | পি 1 ( ) - পি 2 ( ) | পি 1 পি 2O(P1,P2)P1P2

1O(P1,P2)=TV(P1,P2)
TV(P1,P2)=supA|P1(A)P2(A)|P1P2

এর অর্থ হ'ল, উদাহরণস্বরূপ, যদি তবে কোনও ইভেন্টের এবং প্রদত্ত সম্ভাবনাগুলি চেয়ে আলাদা হয় না । মোটামুটিভাবে বলতে গেলে, দুটি বিতরণ পর্যন্ত একই পূর্বাভাস দেয় ।পি 1 পি 2 0.1 10 %O(P1,P2)>0.9P1P20.110%

সুতরাং, শাস্ত্রীয় সমতুল্য পরীক্ষার মতো, এবং এর মাধ্যমের মধ্যে পার্থক্যের জন্য একটি সমালোচনামূলক মানের ভিত্তিতে একটি স্বীকৃতি মানদণ্ড ব্যবহার করার পরিবর্তে , আমরা এটি দ্বারা প্রদত্ত ভবিষ্যদ্বাণীগুলির সম্ভাবনার মধ্যে পার্থক্যের জন্য একটি সমালোচনামূলক মানকে ভিত্তি করতে পারি দুটি বিতরণ।μ 2μ1μ2

আমি মনে করি মানদণ্ডের "আপত্তি" শর্তে একটি সুবিধা আছে। সমালোচনা মান প্রকৃত সমস্যার বিশেষজ্ঞ দ্বারা দেওয়া উচিত: এটি এমন একটি মান হওয়া উচিত যা পার্থক্যটির ব্যবহারিক গুরুত্ব রয়েছে। তবে কখনও কখনও কারও কাছে আসল সমস্যা সম্পর্কে দৃ knowledge় জ্ঞান থাকে না এবং সমালোচনামূলক মূল্য সরবরাহ করতে সক্ষম এমন কোনও বিশেষজ্ঞও নেই। সম্পর্কে একটি প্রচলিত সমালোচনামূলক মান গ্রহণ বিবেচনাধীন শারীরিক সমস্যার উপর নির্ভর না করে একটি মানদণ্ডের উপায় হতে পারে।টি ভি ( পি 1 , পি 2 )|μ1μ2|TV(P1,P2)

একই ভেরিয়ানস সঙ্গে গসিয়ান ক্ষেত্রে, ওভারল্যাপ হল একের সাথে এক আদর্শায়িত গড় পার্থক্য এর সাথে সম্পর্কিত ।|μ1μ2|σ


আপনি ওভারল্যাপ দেখাচ্ছে সম্পদ হচ্ছে না ব্যবহৃত কিছু বাস্তব সমস্যার মধ্যে? এটি অবিশ্বাস্যরূপে প্রতিশ্রুতিবদ্ধ শোনায় তবে এটি সত্য যে কোনও ব্যক্তি এটি কীভাবে প্রয়োগ করবেন তা আমার কাছে স্পষ্ট নয় (যেখানে আপনার সিদ্ধান্তগুলি "এই ডিস্ট্রিবিউশনটি এক্স এর সাথে বেশ সমান") থেকে মুছে ফেলা সম্ভাব্য কয়েকটি পদক্ষেপ রয়েছে যার ফলে এটি কীভাবে দেখা যায় তা একটু কঠিন করে তোলে 10% টিভি অনুসারে প্রভাবের আকারে অনুবাদ করে)।
স্টম্পি জো পিট

1
@ স্টম্পি জোপিট আমি আমার ব্লগে একই চেতনায় কিছু লিখেছি: stla.github.io/stlapblog/posts/…
স্টাফেন লরেন্ট

5

চিকিত্সা বিজ্ঞানের ক্ষেত্রে দুটি একতরফা পরীক্ষা (টোস্ট) এর বিপরীতে আত্মবিশ্বাসের ব্যবধান পদ্ধতির ব্যবহার করা ভাল। আমি বিষয়গুলি খুব স্পষ্ট করতে পয়েন্টের অনুমান, সিআই এবং একটি পূর্ব নির্ধারিত সমতুল্য মার্জিনের গ্রাফিংয়েরও পরামর্শ দিই।

আপনার প্রশ্নটি সম্ভবত এ জাতীয় পদ্ধতির দ্বারা সমাধান করা হবে।

অ-নিকৃষ্টতা / সমতুল্য অধ্যয়নের জন্য কনসার্টের নির্দেশিকা এক্ষেত্রে যথেষ্ট কার্যকর।

দেখুন Piaggio জি, Elbourne ডিআর, অল্টম্যান ডিজি, Pocock এসজে ইভান্স এসজে, এবং সঙ্গী গ্রুপ। অহীনতা এবং সমতুল্যতা এলোমেলোভাবে পরীক্ষার রিপোর্টিং: কনসোর্ট স্টেটমেন্টের একটি এক্সটেনশান। JAMA। 2006, মার্চ 8; 295 (10): 1152-60। (সম্পূর্ণ পাঠ্যের লিঙ্ক।)


1
আমি অগত্যা বলব না যে আত্মবিশ্বাসের ব্যবধানগুলি পছন্দ হয়। আসলে আত্মবিশ্বাসের ব্যবধানগুলি হাইপোথিসিস টেস্টগুলির সাথে মিলে যায়। পদ্ধতিটিতে ব্যবহৃত দুটি একতরফা টি পরীক্ষার সাথে মিলিত দুটি একতরফা আত্মবিশ্বাসের অন্তরকে ছেদ করে আস্থা অর্জনের অন্তরগুলি দেখে টোস্ট অর্জন করা যায়।
মাইকেল চেরনিক 6:59

4

হ্যাঁ. এটি সমতুল্য পরীক্ষা। মূলত আপনি নাল এবং বিকল্প অনুমানকে বিপরীত করে এবং নমুনার আকারটিকে শক্তির উপর ভিত্তি করে দেখান যে উপায়গুলির পার্থক্যটি সমতারের উইন্ডোর মধ্যে রয়েছে। ব্ল্যাকওয়েল্ডার এটিকে "নাল হাইপোথিসিস প্রমান করা" বলে অভিহিত করেছেন। এটি সাধারণত ফার্মাসিউটিক্যাল ক্লিনিকাল ট্রায়ালগুলিতে করা হয় যেখানে বিপণিত ওষুধের সাথে জেনেরিক ড্রাগের সমতা পরীক্ষা করা হয় বা অনুমোদিত ড্রাগটিকে নতুন ফর্মুলেশন (যা প্রায়শই বায়োইকুইভ্যালেন্স বলা হয়) এর সাথে তুলনা করা হয়। একতরফা সংস্করণটিকে নন-নিকৃষ্টতা বলা হয়। কিছু সময় কোনও ওষুধটি কেবল দেখিয়েই অনুমোদিত হতে পারে যে নতুন ড্রাগটি বাজারজাত প্রতিযোগীর তুলনায় নিকৃষ্ট নয়। শাও এবং পাইজট ক্রসওভার ডিজাইন ব্যবহার করে বায়োকিউভ্যালেন্সে একটি সামঞ্জস্যপূর্ণ বুটস্ট্র্যাপ পদ্ধতির বিকাশ করেছে।


0

বুটস্ট্র্যাপের পার্থক্যগুলি (উদাহরণস্বরূপ উপায়গুলির মধ্যে পার্থক্য) 2 টি নমুনা গোষ্ঠীর মধ্যে এবং পরিসংখ্যানগত তাত্পর্য পরীক্ষা করে। ভিন্ন ভিন্ন প্রেক্ষাপটে এই পদ্ধতির আরও বিশদ বিবরণ এখানে পাওয়া যাবে http://www.automated-trading-system.com/a-differences-application-of-the-bootstrap/


1
আপনি এর ভ্রান্ত ধারণা conflating হয় কোন পার্থক্য নাল হাইপোথিসিস গ্রহণ এবং খোঁজার প্রমাণ দুই পরিমাণে হয় সমতুল্য
অ্যালেক্সিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.