জোড়যুক্ত টি-পরীক্ষার জন্য সর্বনিম্ন নমুনার আকার


16

টি-পরীক্ষার বৈধ হওয়ার জন্য প্রয়োজনীয় ন্যূনতম নমুনার আকার নির্ধারণের জন্য কি কোনও "নিয়ম" রয়েছে?

উদাহরণস্বরূপ, 2 জনসংখ্যার মাধ্যমের মধ্যে একটি তুলনা সম্পাদন করা প্রয়োজন। একটি জনগোষ্ঠীর 7 টি ডেটা পয়েন্ট এবং অন্যটি থেকে 2 টি পয়েন্ট রয়েছে। দুর্ভাগ্যক্রমে, পরীক্ষাটি খুব ব্যয়বহুল এবং সময়সাপেক্ষ, এবং আরও ডেটা প্রাপ্তি সম্ভব নয়।

একটি টি-টেস্ট ব্যবহার করা যেতে পারে? কেন অথবা কেন নয়? দয়া করে বিশদ সরবরাহ করুন (জনসংখ্যার বিভিন্ন রূপ এবং বন্টন জানা যায় না)। যদি কোনও টি-টেস্ট ব্যবহার না করা যায় তবে একটি প্যারাম্যাট্রিক নন (মান হুইটনি) ব্যবহার করা যেতে পারে? কেন অথবা কেন নয়?


2
এই প্রশ্নটি অনুরূপ উপাদানটি কভার করে এবং এই পৃষ্ঠার দর্শকদের পক্ষে আগ্রহী: টি-পরীক্ষার বৈধ হওয়ার জন্য কি কোনও ন্যূনতম নমুনার আকার প্রয়োজন?
গুং - মনিকা পুনরায়

এমনকি আরও ছোট নমুনা মাপের সাথে পরীক্ষা করার বিষয়ে এই প্রশ্নটি দেখুন ।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


8

আমি এখানে একটি অপ্রীতিকর টি- টেষ্টের চেয়ে নন-প্যারাম্যাট্রিক মান-হুইটনি ইউ পরীক্ষাটি ব্যবহার করার পরামর্শ দেব ।

এটির জন্য কোনো পরম সর্বনিম্ন নমুনা মাপ টি -test, কিন্তু নমুনা মাপ ছোট পেতে, পরীক্ষা ধৃষ্টতা উভয় নমুনা একটি স্বাভাবিক ডিস্ট্রিবিউশনের সাথে জনগোষ্ঠী থেকে টানা হয় আরো সংবেদনশীল হয়ে ওঠে। এই ছোট্ট নমুনাগুলির সাথে, বিশেষত মাত্র দু'জনের একটি নমুনা সহ, আপনার খুব নিশ্চিত হওয়া দরকার যে জনসংখ্যা বিতরণ স্বাভাবিক ছিল - এবং এটি বাহ্যিক জ্ঞানের উপর ভিত্তি করে করা উচিত, যেমন এই জাতীয় ছোট নমুনাগুলি তাদের সম্পর্কে খুব কম তথ্য দেয় স্বাভাবিকতা বা অন্যথায় তাদের বিতরণ। তবে আপনি বলেছেন যে "জনসংখ্যার বৈকল্পিকতা এবং বিতরণগুলি জানা যায় না" (আমার তাত্ত্বিক)।

মান-হুইটনি ইউ পরীক্ষায় বিতরণগুলির প্যারাম্যাট্রিক ফর্ম সম্পর্কে কোনও অনুমানের প্রয়োজন হয় না, কেবলমাত্র এই অনুমানের প্রয়োজন হয় যে দুটি গ্রুপের বিতরণ নাল অনুমানের অধীনে একই।


6
অত্যন্ত ছোট নমুনা মাপের জন্য ভাল প্রস্তাবনা নয়। 7 এবং 2 টি নমুনা সহ, ইউ-পরীক্ষাটি ব্যর্থ হবে, গ্রুপগুলির গড়ের মধ্যকার পার্থক্য যত বড় হোক না কেন। একটি উদাহরণের জন্য আমার উত্তর তাকান।
আলেফসিন

2
@ আলেফসিন যা বলবেন তা আমি দ্বিতীয় করবো। যদি আপনার পক্ষে বৈধ সিদ্ধান্তগুলি আকর্ষণ করা গুরুত্বপূর্ণ (এবং কেবলমাত্র পি-মান পাবেন না) তবে আরও অনুরোধযোগ্য অনুমানগুলি আরও ভাল করে তুলতে পারেন। যদি কোনও ব্যয়েশিয়ার কাঠামোর মধ্যে আপনার বিশ্লেষণটি করা হয় তবে আপনি যদি যুক্তিসঙ্গত পটভূমির তথ্যও পেয়ে থাকেন তবে আপনি আরও বেশি অনুমান যুক্ত করতে পারেন।
রাসমুস বুথ

2
একটি সমস্যা হ'ল এই জাতীয় ছোট নমুনা আকারের সাথে, উইলকক্সন-মান-হুইটনি সাধারণ তাত্পর্যপূর্ণ স্তর অর্জন করতে পারে না। 7 এবং 2 এর নমুনা মাপের সাথে আপনি কখনই 5% স্তরে তাত্পর্যপূর্ণ ফল পাবেন না, তবুও তাত্পর্যপূর্ণ পার্থক্য হোক। বিবেচনা করুন (1.018,1.031,1.027,1.020,1.021,1.019,1.024) বনাম (713.2, 714.5) - 5% স্তরে তাৎপর্যপূর্ণ নয়!
গ্লেন_বি

3
এটি বলেছিল, যদি কারও কাছে এবং n 2 = 2 থাকে তবে খুব ভাল যুক্তি রয়েছে যে 5% পরীক্ষাটি প্রথম স্থানে বোধগম্য হয় কিনা তা বিবেচনা করা উচিত। দুটি ত্রুটির ধরণের দামের যথাযথ মূল্যায়নের ফলে আলাদা আলাদা পছন্দ হতে পারে। n1=7n2=2
গ্লেন_বি -রিনস্টেট মনিকা

6

(অস্বীকৃতি: আমি আজ ভাল টাইপ করতে পারি না: আমার ডান হাতটি ভঙ্গুর হয়ে গেছে!)

অন্যান্য উত্তরে একটি প্যারামিমেট্রিক পরীক্ষা ব্যবহারের পরামর্শের বিপরীতে, আপনার বিবেচনা করা উচিত যে অত্যন্ত ছোট নমুনা আকারের জন্য সেই পদ্ধতিগুলি খুব কার্যকর নয়। এটি সহজেই বোঝা যায় যে: অত্যন্ত ছোট আকারের গবেষণায়, গ্রুপের মধ্যে কোনও পার্থক্য প্রতিষ্ঠিত করা যায় না যদি না বড় প্রভাবের আকার পর্যবেক্ষণ করা হয়। নন-প্যারাম্যাট্রিক পদ্ধতিগুলি অবশ্য গ্রুপগুলির মধ্যে পার্থক্যের বিশালতার জন্য যত্ন করে না। এইভাবে এমনকি যদি দুটি গ্রুপের মধ্যে পার্থক্য বিশাল হয় তবে একটি ক্ষুদ্র নমুনা আকারের সাথে একটি নন-প্যারাম্যাট্রিক পরীক্ষা সর্বদা নাল অনুমানটিকে প্রত্যাখ্যান করতে ব্যর্থ হয়।

এই উদাহরণটি বিবেচনা করুন: দুটি গ্রুপ, সাধারণ বিতরণ, একই বৈকল্পিক। গ্রুপ 1: গড় 1.0, 7 নমুনা। গ্রুপ 2: গড় 5, 2 নমুনা। গড়ের মধ্যে একটি বড় পার্থক্য রয়েছে।

wilcox.test(rnorm(7, 1), rnorm(2, 5))

   Wilcoxon rank sum test

data:  rnorm(7, 1) and rnorm(2, 5)
W = 0, p-value = 0.05556

গণিত পি-মানটি 0.05556 যা নাল অনুমানকে (0.05 এ) প্রত্যাখ্যান করে না। এখন, আপনি যদি 10 এর গুণক দ্বারা দুটি মাধ্যমে মধ্যবর্তী দূরত্ব বৃদ্ধি করেন তবে আপনি একই পি-মান পাবেন:

wilcox.test(rnorm(7, 1), rnorm(2, 50))

   Wilcoxon rank sum test

data:  rnorm(7, 1) and rnorm(2, 50)
W = 0, p-value = 0.05556

এখন আমি আপনাকে অনুরোধ করছি টি-পরীক্ষার মাধ্যমে একই সিমুলেশনটি পুনরাবৃত্তি করতে এবং বৃহত্তর (গড় 5 বনাম 1) এবং বিশাল (গড় 50 বনাম 1) পার্থক্যের ক্ষেত্রে পি-মানগুলি পর্যবেক্ষণ করতে।


5

টি-টেস্টের জন্য কোনও ন্যূনতম নমুনার আকার নেই; আসলে টি-টেস্টটি ছোট ছোট নমুনাগুলির জন্য তৈরি করা হয়েছিল। পুরানো দিনগুলিতে যখন টেবিলগুলি মুদ্রণ করা হত, আপনি খুব ছোট নমুনার (যেমন ডিএফ দ্বারা পরিমাপ করা) টি-টেস্ট টেবিলগুলি দেখেছিলেন।

অবশ্যই, অন্যান্য পরীক্ষাগুলির মতো, যদি একটি ছোট নমুনা থাকে তবে কেবলমাত্র একটি বড় প্রভাব পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হবে।


তবে বিপরীতটিও কি সমস্যা হবে? অর্থাৎ, নমুনাযুক্ত হতে পারে এমন আউটলিয়াররা নাল অনুমানকে মিথ্যাভাবে প্রত্যাখ্যান করতে পারে? বা পার্থক্য সনাক্ত করার জন্য কম শক্তি কি আরও বড় সমস্যা? এই বিশেষ পরিস্থিতিতে আমি মাধ্যমের মধ্যে একটি উল্লেখযোগ্য পার্থক্য দেখছি তবে এটি কতটা "বিশ্বাস" করতে হবে তা জানি না।
জনি

2
এন = 2 দিয়ে আপনি অবশ্যই বহিরাগতদের - জনসংখ্যার বহিরাগতদের প্রভাবের পক্ষে ঝুঁকিপূর্ণ; কীভাবে 2 এর নমুনায় নমুনার মধ্যে আউটলেট থাকে? :-) আমি এই পরিস্থিতিতে কোনও অনুমানমূলক পরিসংখ্যান চেষ্টা করব না। "সত্য" পাওয়ার পক্ষে সম্ভাবনাগুলি দুর্বল এবং আপনি নিজেকে সমালোচনার দিকে ছেড়ে চলে যাবেন।
Rolando2

2
আত্মবিশ্বাসের ব্যবধানটি প্রশস্ত হওয়ার কারণ হ'ল কারণ আপনি কোনও খেলোয়াড় পেতে পারেন। তবে টি-পরীক্ষা এখনও ধরে নেয় নমুনাগুলি একটি সাধারণ জনগণের।
পিটার ফ্লুম - মনিকা পুনরায়

2

আমি ধরে নিলাম আপনার অর্থ একটি গ্রুপের data টি ডাটা পয়েন্ট এবং দ্বিতীয় গ্রুপের ২ টি ডাটা পয়েন্ট, উভয়ই জনসংখ্যার উপসেট (যেমন পুরুষের উপসেট এবং মহিলাদের উপসেট)।

টি-পরীক্ষার জন্য গণিতগুলি এই উইকিপিডিয়া পৃষ্ঠা থেকে প্রাপ্ত করা যেতে পারে । অসম নমুনা আকার (vs বনাম ২) এবং অসম বৈকল্পিক সহ আমরা একটি স্বতন্ত্র দ্বি-নমুনা টি-পরীক্ষা গ্রহণ করব, সুতরাং সেই পৃষ্ঠাটির প্রায় অর্ধেক পথ way আপনি দেখতে পাচ্ছেন যে গণনাটি মাধ্যম এবং মানক বিচ্যুতির ভিত্তিতে। এক গোষ্ঠীতে মাত্র subjects টি বিষয় এবং অন্য একটিতে ২ টি বিষয় নিয়ে আপনি গড় বা মানক বিচ্যুতির জন্য আপনার পক্ষে ভাল অনুমান আছে বলে ধরে নিতে পারবেন না। ২ টি বিষয়যুক্ত গোষ্ঠীর জন্য, গড়টি হ'ল মানটি যা দুটি ডেটা পয়েন্টের ঠিক ঠিক মাঝখানে থাকে তাই এটি খুব ভালভাবে অনুমান করা যায় না। Subjects বিষয় বিশিষ্ট গোষ্ঠীর জন্য, নমুনার আকার প্রকরণটি দৃ strongly়তার সাথে প্রভাবিত করে (এবং সেইজন্য স্ট্যান্ডার্ড বিচ্যুতিগুলি যা প্রকরণের বর্গমূল) কারণ আপনার যখন একটি ছোট নমুনা থাকে তখন চরম মানগুলি আরও দৃ effect়তর প্রভাব ফেলবে।

উদাহরণস্বরূপ, যদি আপনি স্ট্যান্ডার্ড বিচ্যুতির জন্য উইকিপিডিয়া পৃষ্ঠায় মূল উদাহরণটি দেখেন তবে আপনি দেখতে পাবেন যে স্ট্যান্ডার্ড বিচ্যুতিটি 2, এবং তারতম্য (বর্গাকার স্ট্যান্ডার্ড বিচ্যুতি) সুতরাং 4 But তবে আমাদের যদি কেবল প্রথম দুটি ডাটা পয়েন্ট থাকে (9 এবং 1), প্রকরণটি 10/2 = 5 হবে এবং মান বিচ্যুতি হবে 2.2 এবং যদি আমাদের কেবল শেষ দুটি মান (4 এবং 16) থাকে তবে তারতম্যটি 20/2 = 10 হবে এবং স্ট্যান্ডার্ড বিচ্যুতি হবে 3.2। আমরা এখনও একই মানগুলি ব্যবহার করছি, সেগুলির মধ্যে খুব কম, এবং আমরা আমাদের অনুমানের উপর প্রভাবটি দেখতে পারি।

ছোট নমুনা আকারের সাথে অনুমানের পরিসংখ্যান ব্যবহার করার ক্ষেত্রে এটিই সমস্যা, আপনার ফলাফলগুলি নমুনা দ্বারা বিশেষত দৃ strongly়ভাবে প্রভাবিত হবে।

আপডেট: আপনি কেবল বিষয় দ্বারা ফলাফলগুলি প্রতিবেদন করতে এবং নির্দেশিত করতে পারবেন না যে এটি অনুসন্ধানের কাজ? মাত্র দুটি ক্ষেত্রে, ডেটা কেস স্টাডির সাথে খুব মিল এবং এগুলি উভয়ই (1) রচনা করা গুরুত্বপূর্ণ এবং (2) স্বীকৃত অনুশীলন।


ধন্যবাদ মিশেল। এটি জানতে আকর্ষণীয় এবং দরকারী। তবে আপনি ব্যবহারিক দৃষ্টিকোণ থেকে কী প্রস্তাব করবেন? এই পরিস্থিতি দেওয়া, এগিয়ে যাওয়ার সর্বোত্তম উপায় কি? ধন্যবাদ!
জনি

হাই জনি বিস্মিত। আপনার সঠিক পরিস্থিতি সম্পর্কে আরও তথ্য ছাড়াই আমি আরও দিকনির্দেশনা দিতে অক্ষম বোধ করি।
মিশেল

কী ধরণের তথ্য দরকার?
জনি 21'12

1
হাই, আবার আপনার স্টাডি ডিজাইনের আরও তথ্য যেমন আপনার ডেটা কী, আপনি কীভাবে এটি সংগ্রহ করেছেন, আপনার দলগুলি কী, পর্যবেক্ষণগুলি কীভাবে নির্বাচিত হয়েছিল। আমি শুধু জানি যে আপনি দুটি পর্যবেক্ষণ (লোক? ইঁদুর, নিউরনস, পনিরের ব্লকস? বিকিরণ ফ্রিকোয়েন্সি?) নিয়ে একটি পরীক্ষা করেছিলেন যা দুটি গ্রুপের।
মিশেল

ধরা যাক যে মস্তিস্কে সাদা পদার্থের গড় রক্ত ​​প্রবাহ এমআরআই ব্যবহার করে মানুষের মধ্যে পরিমাপ করা হয়েছিল। গ্রুপগুলি হ'ল নিয়ন্ত্রণগুলি (7 জন) এবং বয়স / লিঙ্গের সাথে মিলিত রোগীদের একটি বিশেষ ব্যাধি (2 জন)।
জনি

1

আকর্ষণীয় সম্পর্কিত নিবন্ধ: 'অত্যন্ত কম শাম্পের আকারের সাথে শিক্ষার্থীর টি-টেস্ট ব্যবহার করা' জেসিএফ ডি শীতকালীন (ব্যবহারিক মূল্যায়ন, গবেষণা ও মূল্যায়নে) http://goo.gl/ZAUmGW


0

আমি টি-টেস্ট এবং মান-হুইটনি পরীক্ষা উভয়ের সাথে যে সিদ্ধান্তে পৌঁছেছি তার তুলনা করার জন্য আমি সুপারিশ করব এবং বক্সপ্লটগুলি এবং প্রতিটি জনসংখ্যার গড়ের প্রোফাইল সম্ভাবনা সম্পর্কে একবার নজর রাখি।


হাই @ ডেমিয়ান, আমি নিশ্চিত নই যে একটি গ্রুপের ২ এর আকারের নমুনা থাকলেও একটি বক্সপ্লটও সহায়ক হবে Otherwise
মিশেল

0

Stata 13/SE code for a bootstrap ttestযেহেতু ছোট নমুনাগুলিতে সঞ্চালিত টেস্ট সম্ভবত টেস্টের প্রয়োজনীয়তাগুলি পূরণ করে না (মূলত, জনসংখ্যার স্বাভাবিকতা যেখানে দুটি নমুনা আঁকা রয়েছে), আমি এফ্রন বি অনুসরণ করে একটি বুটস্ট্র্যাপ টেস্ট (অসম বৈকল্পের সাথে) সঞ্চালনের পরামর্শ দেব, তিবশিরানী আরজে। বুটস্ট্র্যাপের একটি ভূমিকা। বোকা রেটন, এফএল: চ্যাপম্যান ও হল / সিআরসি, 1993: 220-224। স্টাটা ১৩ / এসইতে জনি পাজলড সরবরাহ করেছেন এমন ডেটাতে বুটস্ট্র্যাপ টেস্টের কোডটি উপরের চিত্রটিতে জানানো হয়েছে।


আপনার উত্তরে গুরুতর ফর্ম্যাটিং সমস্যা রয়েছে, আপনি কি এটিকে সম্পাদনা করতে আপত্তি করবেন?
অ্যামিবা বলছেন মনিকাকে

আমি উত্তরের পর্যালোচনা সংস্করণে ফর্ম্যাট করার সমস্যাগুলি সমাধান করার চেষ্টা করেছি। এটি নির্দেশ করার জন্য অ্যামিবার ধন্যবাদ Thanks
কার্লো লাজারো

0

2 এর নমুনা আকারের সাথে, সর্বোত্তম কাজটি হতে পারে স্বতন্ত্র সংখ্যাগুলি নিজের দিকে তাকানো এবং এমনকি পরিসংখ্যানগত বিশ্লেষণে বিরক্ত না করা।


1
বর্তমানে এটি একটি মন্তব্য মত আরও পড়তে। যদিও এটি মূল বিষয়, মূল সমস্যাটির যুক্তিসঙ্গত উত্তরের জন্য, ইস্যুটির কিছুটা আলোচনা নিজেই প্রত্যাশিত হতে পারে, শেষ পর্যন্ত যদি কেউ এই সিদ্ধান্তে পৌঁছে যে এটি অন্য কিছু করার জন্য আরও বুদ্ধিমান হয়।
গ্লেন_বি -রিনস্টেট মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.