টি-পরীক্ষাটি বৈধ হওয়ার জন্য কি কোনও ন্যূনতম নমুনার আকার প্রয়োজন?


70

আমি বর্তমানে একটি প্রায়-পরীক্ষামূলক গবেষণা কাগজে কাজ করছি। নির্বাচিত অঞ্চলে কম জনসংখ্যার কারণে আমার কাছে কেবলমাত্র 15 টির একটি নমুনা আকার রয়েছে এবং এটি কেবল 15 আমার মানদণ্ডে ফিট করে। টি-টেস্ট এবং এফ-পরীক্ষার জন্য গণনা করার জন্য কি সর্বনিম্ন 15 টি নমুনার আকার? যদি তা হয় তবে এই ছোট্ট নমুনার আকারটিকে সমর্থন করার জন্য আমি কোথায় একটি নিবন্ধ বা বই পেতে পারি?

এই কাগজটি ইতিমধ্যে গত সোমবার রক্ষা করা হয়েছিল এবং প্যানেলের একজনকে সমর্থনকারী রেফারেন্স দিতে বলেছিল কারণ আমার নমুনার আকার খুব কম। তিনি বলেছিলেন এটি কমপক্ষে 40 জন উত্তরদাতা হওয়া উচিত ছিল।


4
অনুমানগুলি ধরে রাখলে একটি নমুনার আকার 15 এর চেয়ে যথেষ্ট ছোট হতে পারে। টি-বিতরণের বৈধতা কি কেবলমাত্র তিনি আরও বড় নমুনার প্রস্তাব করেছিলেন?
গ্লেন_বি

কেবল পরিষ্কার করার জন্য, আপনি কী ধরণের টি-পরীক্ষা করছেন: একটি নমুনা, জোড়যুক্ত নমুনা বা দুটি নমুনা।
জেরোমি অ্যাংলিম

26
.তিহাসিকভাবে, টি-টেস্টের প্রথম প্রদর্শনী ("ছাত্র" এর 1908 এর গবেষণাপত্রে) চার মাপের আকারের নমুনার আবেদন করেছিল । প্রকৃতপক্ষে, ছোট নমুনাগুলির জন্য উন্নত ফলাফল প্রাপ্তি খ্যাতি অর্জনের দাবী: একবার নমুনার আকার 40 বা তার বেশি হয়ে যায়, 19-শতাব্দীর পুরো গবেষকরা জেড-টেস্টগুলি প্রয়োগ করেছিলেন, তার চেয়ে আলাদা নয় sub আপনি এই কাগজের আধুনিক সংস্করণটি প্যানেল সদস্যের সাথে ভাগ করতে পারেন: york.ac.uk/depts/maths/histtat/student.pdf । তদন্তটি VI ষ্ঠ অনুচ্ছেদ, পৃষ্ঠা 14-18 দেখুন।
হোবার

10
তবে আপনার এই বিষয়টি বিবেচনা করা উচিত যে ছোট নমুনা আকার যেমন 4 টি কাজ করে কারণ শিক্ষার্থীর উচ্চমানের ডেটা ছিল: রাসায়নিক ল্যাব ডেটা, পরীক্ষা-নিরীক্ষা নয়। আপনার মূল সমস্যাটি নমুনা আকারের সাথে নয় তবে প্রতিনিধিত্বমূলকতার সাথে: আপনি কীভাবে জানবেন যে আপনার ডেটা কোনও কিছুর প্রতিনিধি?
কেজেটিল বি হালওয়ারসেন

10
@ সিজারিনা ফ্র্যাঙ্কোয়েজ কেন আমরা বিজ্ঞান <10 বছর বয়সী সীমাবদ্ধ করব?
রিওরাইডার

উত্তর:


56

টি পরীক্ষার জন্য বৈধ হওয়ার জন্য কোনও ন্যূনতম নমুনার আকার নেই। বৈধতার জন্য পরীক্ষার পরিসংখ্যানগুলির অনুমানগুলি প্রায় ধরে রাখা দরকার। এই অনুমানগুলি একটাই নমুনা ক্ষেত্রে যে তথ্যগুলি নাল অনুমানের অধীনে 0 এর সাথে গড় (এবং প্রায় স্বাভাবিক) হয় এবং অদৃশ্য তবে নমুনা থেকে অনুমান করা যায়। দুটি নমুনার ক্ষেত্রে এটি হ'ল উভয় নমুনা একে অপরের থেকে স্বতন্ত্র এবং প্রতিটি নমুনাতে আইআইডি স্বাভাবিক পরিবর্তনশীল থাকে যা দুটি নমুনার একই গড় এবং নাল অনুমানের অধীনে একটি সাধারণ অজানা বৈকল্পিক থাকে। পরিসংখ্যানগুলির জন্য বৈকল্পিকের একটি পোলিত অনুমান ব্যবহৃত হয়।

এক নমুনা ক্ষেত্রে নাল অনুমানের অধীনে বিতরণ একটি কেন্দ্রীয় টি যা স্বাধীনতার এন -1 ডিগ্রি সহ t দুটি নমুনা ক্ষেত্রে নমুনা মাপের এন এবং এম সমেত প্রয়োজনীয় নয় যে পরীক্ষার পরিসংখ্যানগুলির নাল বন্টন স্বাধীনতার এন + এম -2 ডিগ্রি সহ টি । কম নমুনার আকারের কারণে বর্ধিত পরিবর্তনশীলতা বিতরণে জড়িত যা ভারী লেজ রয়েছে যখন স্বাধীনতার ডিগ্রি কম থাকে যা কম নমুনা আকারের সাথে মিলে যায়। সুতরাং পরীক্ষার পরিসংখ্যানগুলির জন্য যে কোনও নমুনা আকারের জন্য একটি নির্দিষ্ট তাত্পর্য স্তর (ভাল, কমপক্ষে 2 মাপের আকার বা এর চেয়েও বড়) সমালোচনামূলক মানগুলি পাওয়া যাবে।

কম নমুনা আকারের সমস্যাটি পরীক্ষার শক্তি সম্পর্কিত। পর্যালোচকটি অনুভব করতে পেরেছেন যে দুটি গ্রুপের মধ্যে ডেল্টা বা একটি নমুনা সমস্যার জন্য পরম মানের চেয়ে ডেল্টার চেয়ে বড় অর্থের মধ্যে একটি অর্থপূর্ণ পার্থক্য সনাক্ত করার উচ্চ ক্ষমতা পাওয়ার জন্য গ্রুপে 15 টি একটি যথেষ্ট পরিমাণে নমুনা আকার নয়। 40 এর প্রয়োজনের জন্য নির্দিষ্ট ব-দ্বীপে একটি নির্দিষ্ট পাওয়ারের স্পেসিফিকেশন প্রয়োজন যা n সমান 40 দিয়ে অর্জিত হবে তবে 40 এর চেয়ে কম নয়।

আমার যুক্ত করা উচিত যে টি পরীক্ষা করার জন্য নমুনাটি অবশ্যই আপনার প্রকরণ বা বৈকল্পিকগুলি অনুমান করার জন্য যথেষ্ট বড় হতে হবে।


2
কিন্তু একটি গুরুত্বপূর্ণ দয়া করে মনে রাখবেন পরীক্ষা হয় বৈধ, এমনকি যদি ডাটা প্রায় স্বাভাবিক, যদি নমুনা আকার যথেষ্ট বড় নয়। যৌক্তিকতাটি প্রায় গোলাকার (স্লটস্কির উপপাদ্য + টি বিতরণ স্বাভাবিকের কাছাকাছি হওয়া) এবং জেড-টেস্টের উপর ব্যবহারের ন্যায্যতা কেবলমাত্র এটি ছোট নমুনায় বেশি রক্ষণশীল। তবে এটি একটি গুরুত্বপূর্ণ নোট যে আমরা যদি অস্বাভাবিকতা নিয়ে সন্দেহ করি তবে বড় নমুনাগুলি আমাদের বাঁচাতে পারে!
ক্লিফ এবি

1
@ ক্লিফ্যাব "বৈধ" দ্বারা আমি ধরে নিয়েছি আপনার মানে "এন \ থেকে \ ইনফটি" হিসাবে সীমাতে প্রায় সঠিক তাত্পর্য স্তর রয়েছে। তবে সাধারণত লোকেরা ত্রুটি হারের ধরণের চেয়ে বেশি চিন্তা করে (বিশেষত যখন এটি কেবলমাত্র নমুনাগুলির নিকটবর্তী হতে পারে যা নমুনার আকার যেটি হাতের চেয়ে বড় হতে পারে) at অ্যাসিম্পটোটিক আপেক্ষিক দক্ষতা প্রকৃতপক্ষে খুব দুর্বল হতে পারে, তাই বিকল্প পছন্দগুলির তুলনায় বড় নমুনায় ছোট প্রভাবগুলির বিরুদ্ধে শক্তি খুব খারাপ হতে পারে, এমনকি প্রথম ধরণের ত্রুটি হারটি যা হওয়া উচিত তা হয়ে ওঠে ..
Glen_b

33

তাঁর প্রতি সমস্ত শ্রদ্ধার সাথে, তিনি জানেন না যে তিনি কী বলছেন। টি-পরীক্ষাটি ছোট নমুনাগুলির সাথে কাজ করার জন্য ডিজাইন করা হয়েছিল। আসলে কোনও সর্বনিম্ন নেই (সম্ভবত আপনি একটি এক-নমুনা টি-টেস্ট, আইডিকে জন্য ন্যূনতম 3 বলতে পারেন) তবে ছোট নমুনাগুলির সাথে পর্যাপ্ত পাওয়ার সম্পর্কে আপনার উদ্বেগ রয়েছে । আপনার ক্ষেত্রে যেমন সম্ভাব্য নমুনার আকার অত্যন্ত সীমাবদ্ধ থাকে তখন আপোষ শক্তি বিশ্লেষণের পিছনে ধারণাগুলি সম্পর্কে পড়তে আপনার আগ্রহী হতে পারে ।

একটি রেফারেন্স হিসাবে প্রমাণিত হয় যে আপনি ছোট নমুনাগুলির সাহায্যে টি-টেস্ট ব্যবহার করতে পারেন, আমি এর একটিও জানি না, এবং আমি সন্দেহ করি যে এটির উপস্থিতি রয়েছে। কেন কেউ তা প্রমাণ করার চেষ্টা করবে? ধারণাটি কেবল নির্বোধ।


6
+1 (আপনার এবং মাইকেলকে)। আগ্রহের বিষয়, অনুমানের একটি সেট করতে ইচ্ছুক থাকলে আপনার সূচনাগুলি করতে দুটি পর্যবেক্ষণেরও দরকার নেই !
অ্যান্ডি ডব্লিউ

4
ছোট নমুনায় টি পরীক্ষার কারণটি হ'ল যদি নমুনাগুলি স্বাভাবিক হয় তবে মানক বিচ্যুতি অজানা থাকলেও সাধারণ জিনিসটি আদর্শ বিচ্যুতির একটি নমুনা অনুমান দ্বারা বিভাজন করে স্বাভাবিক করা হয় by বৃহত্তর নমুনাগুলিতে অনুমান করা যায় যে জনসংখ্যার স্ট্যান্ডার্ড বিচ্যুতির কাছে পরীক্ষার পরিসংখ্যানটি প্রায় স্ট্যান্ডার্ড হবে তবে ছোট নমুনায় এটির পরে ভারী লেজ থাকবে।
মাইকেল চেরনিক

5
স্বাধীনতার এন -1 ডিগ্রি সহ টি ডিস্ট্রিবিউশনটি নাল অনুমানের অধীনে যে কোনও নমুনা আকারের n এর সঠিক বিতরণ এবং ছোট নমুনায় এটি স্বাভাবিকের জায়গায় ব্যবহার করা প্রয়োজন যা এটি আনুমানিকভাবে ভাল করে না। আমি এবং উভয়ই গাং হিসাবে নমুনা আকারের সাথে আসল সমস্যাটি হ'ল শক্তি। যদি আপনি 15 রেফারির সাথে তর্ক করতে চান যে 15 টি যথেষ্ট তাত্পর্যপূর্ণ হওয়া দরকার তখন এটি চিহ্নিত করতে হবে যে আমি অর্থপূর্ণ (ডেল্টাটি উল্লেখ করেছি) এবং তারপরে সেই ব-দ্বীপের জন্য আপনাকে দেখাতে হবে যে বিদ্যুৎ যথেষ্ট 0.80 বা উচ্চতর বলা উচিত ।
মাইকেল চেরনিক

2
@ কেজারিনা ফ্রেঙ্কাইজ সম্পর্কে এন> = ৩০ সম্পর্কে, স্ট্যাটাস.স্ট্যাকেক্সেঞ্জার.কম
স্টাফেন লরেন্ট ২

2
@ গং স্টুডেন্টের আসল (1908!) কাগজটি প্রমাণ করে যে আপনি ছোট নমুনা দিয়ে টি-টেস্ট ব্যবহার করতে পারেন। (এই সম্পর্কে আরো জানার জন্য, মূল প্রশ্ন আমার বর্ধিত মন্তব্য পড়ুন দয়া করে।)
whuber

30

বিদ্যমান উত্তরে উল্লিখিত হিসাবে, একটি ছোট নমুনা আকারের মূল সমস্যাটি হ'ল স্বল্প পরিসংখ্যানের শক্তি। গ্রহণযোগ্য পরিসংখ্যানগত শক্তি কী তা সম্পর্কে থাম্বের বিভিন্ন বিধি রয়েছে। কিছু লোক বলেছেন 80% পরিসংখ্যান শক্তি যুক্তিসঙ্গত, তবে শেষ পর্যন্ত আরও বেশি ভাল। আরও অংশগ্রহণকারীদের পাওয়ার ব্যয় এবং আরও পরিসংখ্যানগত শক্তি পাওয়ার সুবিধার মধ্যে সাধারণত একটি বাণিজ্য বন্ধ রয়েছে।

আপনি আর,, এ একটি সাধারণ ক্রিয়াকলাপ ব্যবহার করে পরীক্ষামূলকভাবে পরিসংখ্যানগত শক্তির মূল্যায়ন করতে পারেন power.t.test

নিম্নলিখিত কোডটি 15 টির নমুনা আকারের, একটি এক-নমুনা টি-পরীক্ষা, স্ট্যান্ডার্ড এবং .2, .5, .8 এর তিনটি পৃথক প্রভাব আকারের জন্য পরিসংখ্যানগত শক্তি সরবরাহ করে যা কখনও কখনও হিসাবে উল্লেখ করা হয়েছে ছোট, মাঝারি এবং বড় প্রভাব যথাক্রমে।α=.05

p.2 <-power.t.test(n=15, delta=.2, sd=1, sig.level=.05, type='one.sample')
p.5 <- power.t.test(n=15, delta=.5, sd=1, sig.level=.05, type='one.sample')
p.8 <-power.t.test(n=15, delta=.8, sd=1, sig.level=.05, type='one.sample')

round(rbind(p.2=p.2$power, p.5=p.5$power, p.8=p.8$power), 2)  

    [,1]
p.2 0.11
p.5 0.44
p.8 0.82

সুতরাং, আমরা দেখতে পাচ্ছি যে জনসংখ্যার প্রভাবের আকারটি "ছোট" বা "মাঝারি" হলে আপনার পরিসংখ্যানের ক্ষমতা কম ছিল (যেমন, যথাক্রমে 11% এবং 44%)। তবে, যদি জনসংখ্যায় এফেক্টের আকার বড় হয় তবে আপনার কাছে এমন কিছু থাকবে যা কিছু "যুক্তিসঙ্গত" শক্তি হিসাবে বর্ণনা করবে (অর্থাত্ 82%)।

দ্রুত-আর ওয়েবসাইটটি আর ব্যবহার করে শক্তি বিশ্লেষণের উপর আরও তথ্য সরবরাহ করে


চমৎকার উত্তর! এছাড়াও জি * পাওয়ার নামে পরিসংখ্যানগত শক্তির কম্পিউটিংয়ের জন্য একটি ভাল সফ্টওয়্যার রয়েছে ।
এনরিক 18

7

দুটি নমুনা টি-পরীক্ষার বৈধতা যদি দুটি নমুনা একই সাধারণতার সাথে সাধারণ বিতরণ থেকে স্বতন্ত্র সরল এলোমেলো নমুনাগুলি হয় এবং নমুনার আকারগুলির প্রতিটি কমপক্ষে দুটি হয় (যাতে জনসংখ্যার বৈচিত্রটি অনুমান করা যায়।) পাওয়ার বিবেচনাগুলি হ'ল পরীক্ষার বৈধতা প্রশ্নে অপ্রাসঙ্গিক। যে প্রভাবটি সনাক্ত করতে ইচ্ছুক তার আকারের উপর নির্ভর করে একটি ছোট নমুনার আকার বুদ্ধিমান হতে পারে, তবে একটি ছোট নমুনার আকার পরীক্ষাটি বাতিল করে না। এটিও নোট করুন যে কোনও নমুনা আকারের জন্য, পিতামাতার বিতরণটি স্বাভাবিক হলে গড়ের নমুনা বন্টনটি স্বাভাবিক। অবশ্যই, বৃহত্তর নমুনার আকারগুলি সর্বদা আরও ভাল কারণ তারা প্যারামিটারগুলির আরও সুনির্দিষ্ট অনুমান সরবরাহ করে। কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য আমাদের বলে যে নমুনার অর্থগুলি স্বতন্ত্র মানগুলির চেয়ে সাধারণত বিতরণ করা হয়, তবে কেসেলা এবং বার্গারের নির্দেশিত হিসাবে, এটি সীমিত উপযোগিতা যেহেতু স্বাভাবিকতার দিকে যাওয়ার হারকে কোনও বিশেষ ক্ষেত্রে পরীক্ষা করতে হবে। থাম্বের নিয়মের উপর নির্ভর করা বুদ্ধিমানের। র্যান্ড উইলকক্সের বইগুলির রিপোর্টিত ফলাফল দেখুন।


5

যদিও এটি সত্য যে টি-বিতরণটি ছোট নমুনার আকারটি বিবেচনায় নিয়েছে, আমি ধরে নেব যে আপনার রেফারি জনসংখ্যাকে সাধারণত বিতরণ করা হয় তা প্রতিষ্ঠার অসুবিধা সম্পর্কে ভাবছিলেন, যখন আপনার কাছে কেবল তথ্য অপেক্ষাকৃত ছোট নমুনা? এটি আকারের 15 এর নমুনা সহ একটি বিশাল সমস্যা নাও হতে পারে, যেহেতু নমুনাটি আশা করা যায় যে সাধারণত অস্পষ্টভাবে সাধারণভাবে বিতরণ হওয়ার লক্ষণগুলি দেখাতে যথেষ্ট? যদি এটি সত্য হয়, তবে আশা করি জনসংখ্যা কোথাও স্বাভাবিকের খুব কাছাকাছি এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের সাথে মিলিত, এটির জন্য আপনাকে নমুনা দেওয়া উচিত যা যথেষ্ট পরিমাণে আচরণ করা।

তবে জনসংখ্যার স্বাভাবিকতা কিছু বাহ্যিক তথ্য বা যান্ত্রিক বোঝাপড়া দ্বারা প্রতিষ্ঠিত না করা হলে আমি ক্ষুদ্র নমুনাগুলির (যেমন আকার চার) টি-টেস্ট ব্যবহারের সুপারিশ সম্পর্কে সন্দেহজনক? জনসংখ্যার বন্টনের আকার হিসাবে কোনও সূত্র থাকতে চার মাপের নমুনায় পর্যাপ্ত তথ্যের কাছাকাছি থাকতে পারে না।


5

সুরো, জে।, এবং লুইস, জেআর (2016) এর পৃষ্ঠা 254-256 থেকে নিম্নলিখিতটি বিবেচনা করুন। ব্যবহারকারীর অভিজ্ঞতা নির্ণয়: ব্যবহারকারীর গবেষণার জন্য ব্যবহারিক পরিসংখ্যান, ২ য় এড। কেমব্রিজ, এমএ: মরগান-কাউফম্যান (আপনি ভিতরে https://www.amazon.com/Quantifying- ব্যবহারকারী- অভিজ্ঞতার- সেকেন্ড- স্ট্যাটিস্টিকস / dp/0128023082/ এ দেখতে পারেন )।


আপনি কি কমপক্ষে 30 ব্যবহারকারীর পরীক্ষার প্রয়োজন?

একহাতে

সম্ভবত আমরা বেশিরভাগ যারা সূচনামূলক পরিসংখ্যান শ্রেণি নিয়েছি (বা এমন শ্রেণি নিয়েছেন এমন কাউকে জানেন) তার থাম্বের নিয়ম শুনেছেন যার অর্থ অনুমান বা তুলনা করার জন্য, আপনার নমুনার আকার কমপক্ষে 30 হওয়া উচিত। কেন্দ্রীয় সীমাবদ্ধ তত্ত্ব অনুসারে, নমুনার আকার বাড়ার সাথে সাথে অন্তর্নিহিত বিতরণটির স্বাভাবিকতা নির্বিশেষে গড় বন্টন আরও বেশি হয়ে যায়। কিছু সিমুলেশন অধ্যয়ন দেখায় যে বিস্তৃত বিভিন্ন বিতরণের জন্য (তবে সমস্ত নয় - ব্র্যাডলি দেখুন, 1978), n = 30 হলে গড়ের বন্টন স্বাভাবিকের কাছাকাছি হয়ে যায়।

আরেকটি বিবেচনা হ'ল টি-স্কোরের চেয়ে জেড-স্কোর ব্যবহার করা কিছুটা সহজ কারণ জেড-স্কোরের জন্য স্বাধীনতার ডিগ্রি ব্যবহারের প্রয়োজন হয় না। সারণী 9.1 এবং চিত্র 9.2-তে দেখানো হয়েছে, আপনার প্রায় 30 ডিগ্রি স্বাধীনতার সময়টি t এর মান z এর মানের খুব কাছে চলে যায়। ফলস্বরূপ, এমন অনুভূতি হতে পারে যে আপনাকে ছোট নমুনাগুলির প্রয়োজন হয় এমন ছোট নমুনাগুলি নিয়ে কাজ করতে হবে না (কোহেন, 1990)। ...

অন্য দিকে

যখন কোনও নমুনার ব্যয় ব্যয়বহুল হয়, কারণ এটি সাধারণত ব্যবহারকারী গবেষণার বিভিন্ন ধরণের (যেমন, পরিমিত ব্যবহারের পরীক্ষা-নিরীক্ষা) থাকে, প্রয়োজনীয় অনুমিত নমুনার আকারটি যথাসম্ভব যথাযথভাবে অনুমান করা গুরুত্বপূর্ণ, এটি বোঝার সাথে বোঝা গেল। নির্দিষ্ট পরিস্থিতিতে একটি নির্দিষ্ট সেটের জন্য 30 হ'ল সঠিক নমুনা হওয়ার সম্ভাবনা খুব কম। নমুনা আকার অনুমানের আমাদের অধ্যায়গুলিতে যেমন দেখানো হয়েছে, একটি পরিসংখ্যান পরীক্ষার তাত্পর্যপূর্ণ স্তরের গণনা করার সূত্রগুলি গ্রহণ করার জন্য আরও উপযুক্ত পদ্ধতির সাথে এবং এন এর সমাধান করতে বীজগণিত ব্যবহার করে সেগুলি নমুনা আকারের অনুমানের সূত্রে রূপান্তরিত করুন। এই সূত্রগুলি তারপরে প্রয়োজনীয় নমুনার আকারটি নির্ধারণের জন্য আপনাকে প্রদত্ত অবস্থার জন্য কী কী জানতে বা অনুমান করতে হবে সে সম্পর্কে নির্দিষ্ট নির্দেশিকা সরবরাহ করে।

এমনকি টি-বিতরণ (জেড-বিতরণের বিপরীতে) আপনার কমপক্ষে 30 টির একটি নমুনা আকার থাকা প্রয়োজন এমন ধারণা বিতরণের বিকাশের ইতিহাসের সাথে অসামঞ্জস্যপূর্ণ। ১৮৯৯ সালে অক্সফোর্ডের নিউ কলেজের রসায়ন ও গণিতে স্নাতক ডিগ্রি অর্জনকারী স্নাতক উইলিয়াম এস গোসেট গিনেস মদপানকারী পদে যোগদানকারী প্রথম বিজ্ঞানী হয়েছিলেন। “তাঁর সময়ের দৈত্যদের সাথে তুলনা করে তিনি খুব অল্পই প্রকাশ করেছিলেন, তবে তাঁর অবদানের গুরুত্ব রয়েছে। … তাপমাত্রা এবং উপাদানগুলির তারতম্যের সাথে ব্রিউিং প্রক্রিয়াটির প্রকৃতির অর্থ দাঁড়ায় যে দীর্ঘ সময়ের জন্য বড় নমুনাগুলি নেওয়া সম্ভব নয় "(কাউউলস, 1989, পৃষ্ঠা 108-1010)।

এর অর্থ হ'ল গোসেট তার কাজগুলিতে জেড-স্কোর ব্যবহার করতে পারে না — তারা কেবল ছোট নমুনাগুলি দিয়ে ভাল কাজ করে না। ছোট নমুনাগুলির সাথে পরিসংখ্যানগত পরীক্ষার জন্য জেড-ডিস্ট্রিবিউশনের ঘাটতিগুলি বিশ্লেষণ করার পরে, তিনি প্রকাশনা নিষিদ্ধের নীতিগুলির কারণে "ছাত্র" ছদ্মনামে প্রকাশিত তার টি টেবিল তৈরির স্বাধীনতার ডিগ্রিগুলির একটি ফাংশন হিসাবে প্রয়োজনীয় সামঞ্জস্যগুলি নিয়ে কাজ করেছিলেন কর্মীদের দ্বারা (স্যালসবার্গ, 2001) টেবিলগুলি প্রকাশের দিকে পরিচালিত সেই কাজটিতে, গোসেট মন্টে কার্লো সিমুলেশনগুলির একটি প্রাথমিক সংস্করণ সম্পাদন করেছিলেন (স্টিলার, 1999)। তিনি অপরাধীদের উপর নেওয়া শারীরিক পরিমাপের লেবেলযুক্ত 3000 কার্ড প্রস্তুত করেছিলেন, তাদের এলোমেলো করে দিয়েছিলেন, তারপরে তাদের 450 আকারের 750 গ্রুপে নিয়ে যান। একটি নমুনা আকার 30 এর চেয়ে অনেক ছোট।

আমাদের সুপারিশ

এই বিতর্কটি "পাঁচটি যথেষ্ট" বনাম "আটটি যথেষ্ট নয়" Chapter অধ্যায়ে আর্গুমেন্টের সমান, তবে গঠনমূলক গবেষণার চেয়ে সংশ্লেষের ক্ষেত্রে প্রয়োগ হয়েছিল applied যে কোনও গবেষণার জন্য, পরীক্ষার ব্যবহারকারীর সংখ্যা পরীক্ষার উদ্দেশ্য এবং আপনি কীভাবে ডেটা সংগ্রহের পরিকল্পনা করছেন তার উপর নির্ভর করে। "ম্যাজিক নম্বর" 30 এর কিছু অভিজ্ঞতাগত যুক্তি রয়েছে তবে আমাদের মতে এটি খুব দুর্বল। আপনি যেমন এই বইয়ের অসংখ্য উদাহরণ থেকে দেখতে পাচ্ছেন যে নমুনা আকারগুলি 30 এর সমান নয় (কখনও কখনও কম, কখনও কখনও বেশি), আমরা থাম্বের এই নিয়মটি খুব বেশি সম্মান করি না। সংক্ষিপ্ত গবেষণার জন্য আমাদের নমুনা আকারের অধ্যায়ে বর্ণিত হিসাবে, অধ্যয়নের জন্য উপযুক্ত নমুনার আকার বিতরণের ধরণ, উপাত্তের প্রত্যাশিত পরিবর্তনশীলতা, আস্থা এবং পাওয়ারের কাঙ্ক্ষিত স্তরগুলির উপর নির্ভর করে,

চিত্র 9.2 তে চিত্রিত হিসাবে, খুব ছোট নমুনাগুলির সাথে টি-বিতরণ ব্যবহার করার সময় (উদাহরণস্বরূপ, 5 এর চেয়ে কম ডিগ্রি সহ স্বাধীনতার ডিগ্রি), টাইপের I টি ত্রুটি নিয়ন্ত্রণের ক্ষেত্রে টি এর খুব বড় মান ছোট নমুনা আকারের ক্ষতিপূরণ দেয় ( পার্থক্য দাবি করা তাৎপর্যপূর্ণ যখন এটি সত্যই নয়)। এই ছোট আকারের নমুনার আকারের সাথে, আপনার আত্মবিশ্বাসের ব্যবধানগুলি বৃহত্তর নমুনাগুলির সাথে আপনি কী পাবেন তার চেয়ে অনেক বেশি প্রশস্ত হবে। তবে একবার আপনি 5 ডিগ্রিরও বেশি স্বাধীনতার সাথে কথা বললে z এর মান এবং টি এর মানের মধ্যে খুব কম পার্থক্য থাকে। টি টু জেডের পদ্ধতির দৃষ্টিকোণ থেকে, স্বাধীনতার 10 ডিগ্রির অতীতে খুব কম লাভ হয়।

জেড-ডিস্ট্রিবিউশনের চেয়ে টি-ডিস্ট্রিবিউশনটি ব্যবহার করা বেশি জটিল নয় (আপনার কেবল স্বাধীনতার ডিগ্রিগুলির জন্য সঠিক মানটি ব্যবহার করা নিশ্চিত হওয়া দরকার), এবং টি-বিতরণের উন্নয়নের কারণটি ছিল ছোট নমুনার বিশ্লেষণ সক্ষম করুন। এটি কেবলমাত্র একটি কম স্পষ্ট উপায় যার মধ্যে ব্যবহারযোগ্যতা চিকিত্সকরা বিয়ার তৈরির বিজ্ঞান এবং অনুশীলন থেকে উপকৃত হন। পরিসংখ্যানের iansতিহাসিকরা গোসেটের প্রকাশ্যে স্টুডেন্টদের টি-টেস্টের প্রকাশনাটিকে একটি যুগান্তকারী ঘটনা হিসাবে বিবেচনা করে (বাক্স, 1984; কাউলেস, 1989; স্টিলার, 1999)। টি টেবিলগুলির প্রারম্ভিক অনুলিপি সহ রোনাল্ড এ ফিশারকে (আধুনিক পরিসংখ্যানগুলির অন্যতম জনক) একটি চিঠিতে গোসেট লিখেছিলেন, "আপনি সম্ভবত একমাত্র ব্যক্তি যিনি এগুলি ব্যবহার করবেন" (বাক্স, 1978)। গোসেট অনেক কিছুই ঠিকঠাক পেয়েছিল তবে অবশ্যই সে ভুল পেয়েছে।

তথ্যসূত্র

বক্স, জিইপি (1984)। পরিসংখ্যান বিকাশে অনুশীলনের গুরুত্ব। টেকনোমেট্রিক্স, 26 (1), 1-8।

বক্স, জেএফ (1978)। ফিশার, একজন বিজ্ঞানীর জীবন। নিউ ইয়র্ক, এনওয়াই: জন উইলি

ব্র্যাডলি, জেভি (1978)। বলিষ্ঠতার? গণিত ও পরিসংখ্যান মনোবিজ্ঞানের ব্রিটিশ জার্নাল, 31, 144-152।

কোহেন, জে। (1990) আমি শিখেছি জিনিস (এখনও অবধি)। আমেরিকান সাইকোলজিস্ট, 45 (12), 1304-1312।

কাওলস, এম (1989)। মনোবিজ্ঞানে পরিসংখ্যান: একটি .তিহাসিক দৃষ্টিকোণ। হিলসডেল, এনজে: লরেন্স এরলবাউম।

স্যালসবার্গ, ডি (2001)। চায়ের স্বাদগ্রহণ মহিলা: বিংশ শতাব্দীতে পরিসংখ্যান বিজ্ঞানে কীভাবে বিপ্লব ঘটিয়েছিল। নিউ ইয়র্ক, এনওয়াই: ফ্রিম্যান WH

স্টিলার, এসএম (1999)। টেবিলে পরিসংখ্যান: পরিসংখ্যান সংক্রান্ত ধারণা এবং পদ্ধতির ইতিহাস। কেমব্রিজ, এমএ: হার্ভার্ড বিশ্ববিদ্যালয় প্রেস।


3

জারিনা তার প্যারামেট্রিক টি-পরীক্ষার ফলাফলগুলি বুটস্ট্র্যাপ টি-পরীক্ষার ফলাফলের সাথে তুলনা করতে আকর্ষণীয় খুঁজে পেতে পারে। স্টাটা 13/1 এর জন্য নিম্নলিখিত কোডটি অসম বৈকল্পের (প্যারামেট্রিক টি-টেস্ট: পি-মান = 0.1493; বুটস্ট্র্যাপ টি-পরীক্ষা: পি-মান = 0.1543) সম্পর্কিত দুটি-নমুনা টি-পরীক্ষা সম্পর্কিত একটি কল্পিত উদাহরণের অনুকরণ করে।

set obs 15
g A=2*runiform()
g B=2.5*runiform()
ttest A == B, unpaired unequal
scalar t =r(t)
sum A, meanonly
replace A=A-r(mean) + 1.110498 ///1.110498=combined mean of A and B
sum B, meanonly
replace B=B-r(mean) + 1.110498
bootstrap r(t), reps(10000) nodots///
saving(C:\Users\user\Desktop\Czarina.dta, every(1) double replace) : ///
ttest A == B, unpairedunequal
use "C:\Users\user\Desktop\Czarina.dta", clear
count if _bs_1<=-1.4857///-1.4857=t-value from parametric ttest
count if _bs_1>=1.4857
display (811+732)/10000///this chunk of code calculates a bootstrap p-value///
to be compared with the parametric ttest p-value

3

টি-পরীক্ষার ব্যবহারকে ন্যায়সঙ্গত করার জন্য দুটি ভিন্ন উপায় রয়েছে।

  • আপনার ডেটা সাধারণত বিতরণ করা হয় এবং আপনার প্রতি গ্রুপে কমপক্ষে দুটি নমুনা রয়েছে
  • আপনার প্রতিটি গ্রুপে বড় আকারের নমুনা আকার রয়েছে

যদি পারেন এইসব ক্ষেত্রে ধরে থাকুন, তারপর t-test এর একটি বৈধ পরীক্ষা বিবেচনা করা হয়। সুতরাং আপনি যদি এই ধারণাটি গ্রহণ করতে ইচ্ছুক হন যে আপনার ডেটা সাধারণত বিতরণ করা হয় (যা অনেক গবেষক যারা ছোট নমুনা সংগ্রহ করেন) তবে আপনার উদ্বেগ করার কিছু নেই।

তবে, কেউ যুক্তিসঙ্গতভাবে আপত্তি জানাতে পারে যে আপনি আপনার ফলাফল পেতে এই অনুমানের উপর নির্ভর করছেন, বিশেষত যদি আপনার ডেটা স্কিউড হিসাবে পরিচিত হয়। তারপরে বৈধ অনুমানের জন্য প্রয়োজনীয় নমুনা আকারের প্রশ্নটি খুব যুক্তিসঙ্গত।

নমুনার আকার কত বড় প্রয়োজন, দুর্ভাগ্যক্রমে এর সত্যিকারের কোনও সঠিক উত্তর নেই; আপনার ডেটা যত বেশি স্কিউড হবে, ততটুকু যুক্তিসঙ্গত করার জন্য প্রয়োজনীয় আকারের আকারের পরিমাণ। প্রতি গ্রুপে 15-20 সাধারণত যুক্তিসঙ্গত বৃহত হিসাবে বিবেচিত হয়, তবে থাম্বের বেশিরভাগ নিয়ম অনুসারে পাল্টা উদাহরণ রয়েছে: উদাহরণস্বরূপ, লটারির টিকিট রিটার্নে (যেখানে 1 ইন বলে দিন, 10,000,000 পর্যবেক্ষণ একটি সুনির্দিষ্ট বাহ্যিক), আপনার আক্ষরিক প্রয়োজন হবে এই পরীক্ষাগুলির আগে কোথাও প্রায় 100,000,000 পর্যবেক্ষণ উপযুক্ত হবে।


1

আমি উত্সাহিত টি-টেস্টের কার্যকারিতা সম্পর্কে সম্মতি জানাই। আমি তুলনা হিসাবে, http://www.indiana.edu/~kruschke/BEST/BEST.pdf- এ ক্রুশকে প্রদত্ত বায়েশিয়ান পদ্ধতিটি দেখে নেওয়ার পরামর্শ দিই । সাধারণভাবে, "কয়টি বিষয়?" সমস্যার সমাধানের ক্ষেত্রে গুরুত্বপূর্ণ প্রভাবের আকার কী হবে তার একটি ধারণা হাতে না নিলে উত্তর দেওয়া যাবে না। এটি হ'ল এবং উদাহরণস্বরূপ, যদি পরীক্ষাটি কোনও নতুন ওষুধের কার্যকারিতা সম্পর্কিত একটি অনুমানমূলক গবেষণা ছিল, তবে মার্কিন খাদ্য ও ওষুধ প্রশাসনের ক্ষেত্রে পুরানোের তুলনায় নতুন ওষুধের ন্যায্যতা অর্জনের জন্য প্রভাবের আকারটি ন্যূনতম আকার হতে পারে।

এই এবং অন্যান্য অনেক আলোচনার মধ্যে কী অদ্ভুত বিষয় তা হ'ল পোষাকের জন্য হ'ল পাইকারি ইচ্ছুকতা যে কিছু ডেটাতে কিছুটা তাত্ত্বিক বিতরণ থাকে, যেমন গাউসিয়ান। প্রথমত, আমাদের পোষ্ট করার দরকার নেই, আমরা ছোট ছোট নমুনাগুলিও পরীক্ষা করতে পারি। দ্বিতীয়ত, কেন কোনও নির্দিষ্ট তাত্ত্বিক বিতরণ স্থির করুন? কেন কেবল ডেটাটিকে নিজের কাছে অভিজ্ঞতা অভিজ্ঞতা হিসাবে গ্রহণ করবেন না?

অবশ্যই, ছোট নমুনা আকারের ক্ষেত্রে, পোষ্ট করে যে কিছু বিতরণ থেকে প্রাপ্ত ডেটা বিশ্লেষণের জন্য অত্যন্ত দরকারী। তবে, ব্র্যাডলি এফ্রনকে প্যারাফ্রেজ করতে, আপনি সবেমাত্র অসীম পরিমাণে ডেটা তৈরি করেছেন। আপনার সমস্যাটি যথাযথ হলে কখনও কখনও এটি ঠিক হয়ে যেতে পারে। কিছু সময় না।


1

যতটা অনুমান দুটি নমুনা কেস জন্য; এটি উভয় নমুনা একে অপরের থেকে স্বতন্ত্র এবং প্রতিটি নমুনা দুটি নমুনার একই গড় এবং নাল অনুমানের অধীনে একটি সাধারণ অজানা বৈকল্পিক সহ আইআইডি সাধারণ ভেরিয়েবল নিয়ে গঠিত।

মানক ত্রুটির জন্য স্যাটারওয়াইট অনুমানকে ব্যবহার করে ওয়েলচ টি-টেস্টও রয়েছে। এটি অসম বৈকল্পিকগুলি ধরে নিয়ে একটি 2 নমুনা টি-পরীক্ষা।

ওয়েলকের টি-টেস্ট

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.