বনাম -test 2 দলে দলে একটি ঠান্ডা ধরার মতভেদ তুলনা জন্য -test


12

আমি একটি আকর্ষণীয় পরীক্ষার (একটি উত্স ছাড়া, দুর্ভাগ্যক্রমে) সম্পর্কে একটি বরং সম্মানিত (জনপ্রিয়) বিজ্ঞান ম্যাগাজিনে (জার্মান প্রধানমন্ত্রী, 02/2013, p.36) পড়েছি। এটি আমার দৃষ্টি আকর্ষণ করেছে কারণ স্বজ্ঞাতভাবে আমি ফলাফলটির তাত্পর্য নিয়ে সন্দেহ করেছি, তবে প্রদত্ত তথ্যটি পরিসংখ্যান পরীক্ষার পুনরুত্পাদন করার জন্য যথেষ্ট ছিল।

গবেষকরা ভেবেছিলেন যে ঠান্ডা আবহাওয়ায় শীত পড়লে ঠাণ্ডা ধরার প্রতিকূলতা বাড়ে? সুতরাং তারা এলোমেলোভাবে 180 ছাত্রদের একটি গ্রুপকে দুটি গ্রুপে বিভক্ত করেছে। একদলকে 20 মিনিটের জন্য তাদের পা ঠান্ডা জলে আটকে থাকতে হয়েছিল। অন্যরা তাদের জুতো রাখল। মজাদার হেরফেরের মতো আমি মনে করি, তবে অন্যদিকে আমি একজন ডাক্তার নই এবং সম্ভবত ডাক্তাররা মজার কথা ভাবেন। এথিকাল ইস্যু একপাশে।

যাইহোক, 5 দিন পরে, চিকিত্সা গ্রুপের 13 ছাত্রদের ঠান্ডা লাগছিল, তবে তাদের জুতা চালিয়েছিল এমন গ্রুপে কেবল 5 জন। এই পরীক্ষার বিজোড় অনুপাতটি 2.87।

বরং ছোট নমুনার আকার দেওয়া, আমি ভাবতে শুরু করি এই পার্থক্যটি উল্লেখযোগ্য হতে পারে কিনা। তাই আমি দুটি পরীক্ষা করেছিলাম।

প্রথমে সাধারণ আনুমানিকতা ব্যবহার করে অনুপাতের সমতার এক সাধারণ পরীক্ষা। এই পরীক্ষায় রয়েছে সাথে । আমার ধারণা এটিই গবেষকরা পরীক্ষা করেছিলেন। এটি সত্যই তাৎপর্যপূর্ণ। তবে এই জেড-টেস্টটি কেবলমাত্র বড় স্যাম্পলগুলিতে বৈধ, যদি আমার প্রায় কাছের কারণে ভুল হয় না। তদুপরি, বিস্তৃত হারগুলি বরং ছোট এবং আমি আশ্চর্য হই যে এটি প্রভাবের আত্মবিশ্বাসের ব্যবধানের কভারেজ হারকে প্রভাবিত করবে না।পি = 0,0468z=1.988p=0.0468

সুতরাং আমার দ্বিতীয় চেষ্টাটি ছিল মন্টি-কার্লো সিমুলেশন এবং স্ট্যান্ডার্ড পিয়ারসন চি-স্কোয়ার উভয়ের সাথেই স্বাধীনতার চি-বর্গ পরীক্ষা। এখানে আমি সম্পর্কে -মান উভয়ই ।p=.082

এখন এটি ফলাফল সম্পর্কে এতটা আশ্বাস দেয় না। আমি ভাবলাম যে এই ডেটা পরীক্ষা করার আরও বিকল্প আছে এবং দুটি পরীক্ষার বিষয়ে আপনার মতামত কী (বিশেষত প্রথম, তাৎপর্যপূর্ণ, পরীক্ষার অনুমান)


আমি বিশ্বাস করি যে আপনি পিয়ারসন চি-স্কোয়্যার স্ট্যাটিস্টিক্সের উপর একটি ধারাবাহিকতা সংশোধন করেছেন, যা পি-মানগুলির মধ্যে স্বাতন্ত্র্য accounts
Scortchi - পুনর্বহাল মনিকা

উত্তর:


13

আমি স্বাভাবিক আনুমানিকতা বা চি-স্কোয়ারের পরিবর্তে একটি ক্রোড়পত্র পরীক্ষা ব্যবহার করতাম । ক্রমায়ন পরীক্ষাটি সঠিক এবং সবচেয়ে শক্তিশালী, ডেটা অনুসারে শর্তাধীন upon

এই ক্ষেত্রে, আমরা গোষ্ঠীর সমস্ত ক্রিয়াকলাপ গণনা করতে পারি না, তবে আমরা ডেটাগুলির প্রচুর এলোমেলো ক্রমশক্তি তৈরি করতে পারি এবং একটি যথাযথ নির্ভুল মান পেতে পারি:

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
   temp <- sample(group, size=18)
   n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

যা 0.039 এর পি-মান নির্দেশ করবে।

যাইহোক, এবং এটি তবে বড় একটি বিষয়, আমি অনুমান করছি যে বিষয়গুলি সর্দিযুক্ত হয়ে উঠছে যে বিষয়গুলি স্বাধীন ঘটনা হ'ল এই ধারণাটি লঙ্ঘিত হয়েছে। এই ব্যক্তিরা সম্ভবত একই স্কুলে শিক্ষার্থী। তাদের মধ্যে দু'জন একটি ক্লাস, বা একটি আস্তানা, বা অন্য কোনও ক্রিয়াকলাপ, বা একটি ক্যাফেটেরিয়া (একাধিক ক্যাফেটারিয়াসহ একটি স্কুলে) ভাগ করে নিন; ইভেন্টগুলি "# 1 ঠান্ডা হয়ে যায়" এবং "# 2 ঠান্ডা হয়ে যায়" স্বতন্ত্র নয়। আমি কল্পনা করতে পারি যে একজন ছাত্র বলবে "আসুন এই পরীক্ষার জন্য সাইন আপ করুন!" তার / তার রুমমেট বা বন্ধুদের কাছে; আমি কল্পনা করতে পারি যে অধ্যাপকরা যে ক্লাসগুলি শিখিয়েছিলেন তাদের মধ্য থেকে শিক্ষার্থীদের নিয়োগ দেওয়া হয়েছিল; আমি অনেক উপায় কল্পনা করতে পারি যে স্বাধীনতার অনুমান লঙ্ঘিত হয়। সম্ভবত কাগজটি, যা আমি পড়েনি, এর মধ্যে কয়েকটিকে সম্বোধন করেছে, তবে এটি কীভাবে এটি সমস্তকে সম্বোধন করতে পারে তা দেখা মুশকিল,


ধন্যবাদ @ জবোম্যান - এছাড়াও আপনি একতরফা পরীক্ষা করেছেন, আমি দেখছি। আমি মনে করি এটির পরে আরও দুটি তরফা পরীক্ষা ব্যবহার করেছি। যদি সাধারণ আনুমানিকতা একতরফা হয়ে যায়, পি মানগুলি .023 উপরে। আমি স্বাধীনতা সম্পর্কে কবুতর পছন্দ। সম্ভবত তারা যখন পায়ে পানিতে পা রাখেন তখন শিক্ষার্থীরাও বিচ্ছিন্ন হননি, তাই এটি একটি সর্দি সংক্রমণ করারও একটি উপায়।
টমকা

(+1) তবে এটি লক্ষণীয় যে আপনার অনুকরণের দরকার নেই: আপনার পরীক্ষার পরিসংখ্যান বিতরণ নাল অনুমানের অধীনে একটি হাইপারজমেট্রিক বিতরণ অনুসরণ করে (এবং প্রান্তিক মোটের উপর কন্ডিশনিং)। এটি ফিশারের নির্ভুল পরীক্ষা।
Scortchi - পুনর্বহাল মনিকা

11

zχ2

z টেষ্ট:

টেস্ট ব্যবহারের যথাযথতা সম্পর্কে দুটি উদ্বেগ রয়েছে , অনুমিত নমুনা বিতরণটি সঠিক কিনা তা উভয়ই। প্রথমত, টেষ্টটি ডিস্ট্রিবিউশনের পরিবর্তে সাধারণ বিতরণ ব্যবহার করে , মানক বিচ্যুতিগুলি বোঝায় যে নমুনা ত্রুটি ছাড়াই পরিচিত। দ্বিতীয়ত, নমুনা বিতরণ অবিচ্ছিন্ন, তবে ডেটা পৃথক; যেহেতু কেবলমাত্র ডেটাগুলির নির্দিষ্ট সংমিশ্রণগুলিই সম্ভব, কেবলমাত্র নির্দিষ্ট ফলাফলের দ্বারা উপলব্ধ পরীক্ষার পরিসংখ্যানের মানগুলি সম্ভব, যা তাত্ত্বিক নমুনা বিতরণের সাথে মেলে না। (আমি এখানে অন্যান্য পরীক্ষার প্রসঙ্গে এই সমস্যাটি নিয়ে আলোচনা করেছি: তুলনা এবং বৈসাদৃশ্য, পি-মান, তাত্পর্য স্তর এবং আমি ত্রুটিটি টাইপ করি )) z টিzzt

আসুন প্রথম উদ্বেগকে ভিন্ন প্রসঙ্গে বিবেচনা করি। আপনার যদি সাধারণত বিতরণ করা ডেটা সহ দুটি গ্রুপ থাকে এবং আপনি যদি উপায়গুলি সমান হয় তা দেখতে চান, আপনাকে উপায় এবং মানক বিচ্যুতি উভয়ই গণনা করতে হবে। এখন আমরা জানি যে উপায়গুলি স্যাম্পলিংয়ের ত্রুটির সাপেক্ষে, সে কারণেই এই দুটি নমুনা অর্থটি অভিন্ন নয় বলে কেবল আমাদের পরীক্ষা করা দরকার। যাইহোক, আমাদের স্ট্যান্ডার্ড বিচ্যুতির প্রাক্কলনগুলিও নমুনা ত্রুটির সাপেক্ষে থাকতে হবে এবং আমাদের সেই বাস্তবতাকে কোনওভাবে বিবেচনা করতে হবে। যখন আমরা এটি করি, তখন দেখা যাচ্ছে যে পরীক্ষার পরিসংখ্যান (এক ধরণের আকারের গড় পার্থক্য) হিসাবে বিতরণ করা হয়েছে । আমরা যদি এর পরিবর্তে সাধারণ বিতরণ ব্যবহার করি (যেমন,z ztzসর্বশেষে) এর অর্থ হ'ল আমরা ধরে নিচ্ছি যে মানক বিচ্যুতির বিষয়ে আমাদের অনুমানগুলি ত্রুটিবিহীন - নিখুঁত। তাহলে টেষ্টটি আপনার ক্ষেত্রে কেন ব্যবহার করা যেতে পারে? কারণটি হ'ল আপনার ডেটা দ্বিমুখী (যেমন, পরিচিতের 'পরীক্ষাগুলির মধ্যে' সাফল্যের সংখ্যা ') সাধারণের পরিবর্তে। ইন দ্বিপদ বিন্যাস , স্ট্যানডার্ড ডেভিয়েশন গড় একটি ফাংশন, তাই একবার আপনি অনুমান আছে মানে সম্পর্কে চিন্তা করতে হবে কোন অতিরিক্ত অনিশ্চয়তা নেই। সুতরাং, সাধারণ বিতরণ পরীক্ষার পরিসংখ্যানগুলির নমুনা বিতরণের মডেল হিসাবে ব্যবহার করা যেতে পারে। z

পরীক্ষার পরিসংখ্যানগুলির দীর্ঘমেয়াদী আচরণটি বুঝতে সাধারণ বিতরণটি ব্যবহার করা প্রযুক্তিগতভাবে সঠিক হলেও, অন্য একটি সমস্যা উত্থাপিত হয়েছে। সমস্যাটি হ'ল স্বাভাবিক বিতরণ অবিচ্ছিন্ন, তবে আপনার ডেটা বিচ্ছিন্ন হওয়ার কারণে, তাত্ত্বিক বিতরণের সমস্ত মান সম্ভবত আপনার ডেটাসেটে পাওয়া যাবে না। (আবারও, আমি উপরের লিঙ্কিত উত্তরে এই বিষয়টিকে আরও বিস্তারিতভাবে আলোচনা করছি)) ভাগ্যক্রমে, আপনার ডেটার সম্ভাব্য ফলাফল এবং তাত্ত্বিক সাধারণ নমুনা বিতরণের মধ্যে ম্যাচটি আপনার বৃহত্তর হয় । আপনার ক্ষেত্রে, প্রকৃত অন্তর্নিহিত সম্ভাবনাগুলি যাই হোক না কেন, আপনার যতগুলি সাফল্য বা প্রতিটি গ্রুপে কেউই কম হতে পারে। তার মানে সম্ভাব্য সংমিশ্রনের সংখ্যা91 × 91 = 1 ,Nএন = 180 জেড91×91=1,729, যা অনেক সম্ভাবনা। একটি ছোট ডেটাসেটের সাহায্যে আপনি আমার লিঙ্কিত উত্তরে আমি যে ধরণের সমস্যা নিয়ে আলোচনা করেছি তা সত্যই ডেকে আনতে পারেন তবে দিয়ে আপনার খুব বেশি চিন্তা করার দরকার নেই। আমি বিশ্বাস করি যে টেষ্টটি গবেষকদের জন্য একটি বৈধ পছন্দ ছিল। N=180z

χ2 -প্রতিযোগী:

তবে টেষ্ট সম্পর্কে কী ? আমি মনে করি এটিও একটি বৈধ পছন্দ, তবে এটি আমার প্রথম পছন্দ হবে না। (এই বিষয়টিকে উত্তরণে আমার খেয়াল করা যাক যে দ্বিতীয় উদ্বেগটি উপরে আলোচনা করা হয়েছে - পৃথক তথ্য এবং একটি অবিচ্ছিন্ন রেফারেন্স বিতরণের মধ্যে অমিল) - টেষ্টের মতো as টেষ্টের ক্ষেত্রে ঠিক তেমন প্রযোজ্য , তাই রয়েছে এখানে কোনও সুবিধা নেই))χ 2 z χ 2 χ 2 z zχ2χ2zχ2সর্বাধিক এটি সারি মোটের তুলনায় কলামের योगের বিষয়ে বিশেষ কিছু আছে বলে ধরে নিচ্ছে না; উভয়ই এমন আচরণ করা হয় যেমন তারা অন্যান্য সম্ভাব্য মান হতে পারে। তবে এটি পরীক্ষামূলক সেটআপটিকে সঠিকভাবে প্রতিফলিত করে না। সেখানে 180 জন লোক ছিল এবং প্রতিটি গ্রুপে 90 জনকে নিয়োগ দেওয়া হয়েছিল। বারবার অভিন্ন অধ্যয়ন জুড়ে সত্যই পরিবর্তিত একমাত্র জিনিস হ'ল প্রতিটি গ্রুপে ঠান্ডা লাগা লোকের সংখ্যা। -test ভুল একইরূপে উভয় কাশি সংখ্যা এবং প্রতিটি দল হিসেবে যেন তারা পরিবর্তিত হতে পারে মানুষের সংখ্যা কিন্তু -test অধিকার ধৃষ্টতা করে তোলে। এ কারণেই এখানে টেষ্টের আরও ক্ষমতা রয়েছে। χ2zz

এটি মূল্যবান হিসাবে, @ জাবোম্যান দ্বারা প্রস্তাবিত পারমিটেশন পরীক্ষাটিও আপনার নকশার এই দিকটি সঠিকভাবে পেয়েছে এবং পৃথক-অবিচ্ছিন্ন অমিল ইস্যুতে ভুগছে না। সুতরাং, এটি সেরা বিকল্প। তবে আমি ভেবেছিলাম যে আপনার অবস্থার সাথে - এবং i স্টেটগুলি কীভাবে তুলনা করে সে সম্পর্কে আপনি আরও কিছুটা জানতে চাইবেন। χ 2zχ2


আপনাকে ধন্যবাদ @ গুং, আমি আপনার প্রচেষ্টাকে সত্যই প্রশংসা করছি। এটি বিষয়গুলিকে আরও পরিষ্কার করে তোলে।
টমকা

@ গুং আমি বিভ্রান্ত - চি স্কোয়ার এবং জেড অনুপাতে একই বা না? stats.stackexchange.com/questions/173415/…
জাভিয়ের

@ জাভিয়ারবুরেটসাইকোট, জেড-টেস্টটি প্রায়শই চি-স্কোয়ার্ড টেস্ট হিসাবে হুডের অধীনে প্রয়োগ করা হয়, উদাহরণস্বরূপ আর এটি করে। আমি এখনও প্রায়শই জেড-টেস্ট ব্যবহার করতে পছন্দ করি কারণ 1 টি ভেরিয়েবল একটি সমবায়িক এবং অন্যটি প্রতিক্রিয়া বোঝার সাথে সামঞ্জস্য রেখে তথ্য উপস্থাপন করা হয়।
গুং - মনিকা পুনরায়

1
(+1) @ জাভিয়ারবাউরিটসাইকোট: দুটি অনুপাতের পার্থক্যের জন্য দুটি সাধারণত ব্যবহৃত জেড-টেস্ট রয়েছে: একটি স্কোর পরীক্ষা, পিয়ারসনের চি-স্কোয়ার পরীক্ষার সমতুল্য (যেখানে ডিনোমিনেটরের ভিন্নতা সেরা-ফিটিংয়ের অধীনে গণনা করা হয় শূন্য); অন্যটি হ'ল ওয়াল্ড পরীক্ষা (যার মধ্যে দুটি অনুপাতের পার্থক্যের সর্বাধিক সম্ভাবনার প্রাক্কলনে ডিনোমিনেটরের ভিন্নতা গণনা করা হয়)।
Scortchi - পুনর্বহাল মনিকা

@ স্পোর্টচি এটি পরিষ্কার করার জন্য ধন্যবাদ! আমি প্রথমবারের মত পার্থক্যের এর সুস্পষ্ট ব্যাখ্যাটি দেখতে পেলাম - যেখানে আপনি দুটি পদ্ধতির ব্যাখ্যা করেছেন সেখানে আপনি কি লিঙ্ক করতে সক্ষম হবেন? বৈকল্পিকের জন্য সম্পর্কিত সূত্রগুলির সাথে?
জাভেয়ের বুরেরেট সিকোত্তে 26'19
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.