দুটি গ্রুপের জন্য ছোট এবং ভারসাম্যহীন নমুনার আকার - কী করব?


10

আমি দুটি গ্রুপের জন্য ডেটা পেয়েছি (যেমন নমুনা) আমি তুলনা করতে চাই তবে মোট নমুনার আকারটি ছোট (n = 29) এবং দৃ strongly়ভাবে ভারসাম্যহীন (n = 22 বনাম এন = 7)।

এই ডেটাগুলি যৌক্তিকভাবে সংগ্রহ করা কঠিন এবং ব্যয়বহুল, সুতরাং 'আরও ডেটা সংগ্রহ করা' যখন একটি সুস্পষ্ট সমাধান হিসাবে এই ক্ষেত্রে সহায়ক নয়।

বেশ কয়েকটি বিভিন্ন ভেরিয়েবল পরিমাপ করা হয়েছিল (প্রস্থানের তারিখ, আগমনের তারিখ, স্থানান্তরের সময়কাল ইত্যাদি) তাই একাধিক পরীক্ষা রয়েছে, যার কয়েকটি ভেরিয়েন্সগুলি খুব আলাদা (ছোট নমুনার উচ্চতর প্রকরণ রয়েছে)।

প্রাথমিকভাবে কোনও সহকর্মী এই তথ্যগুলিতে টি-টেস্ট চালিয়েছিলেন এবং কিছু পি <0.001 এর সাথে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ ছিলেন, অন্য কোনও পি = 0.069 এর সাথে তাৎপর্যপূর্ণ ছিল না। কিছু নমুনা সাধারণত বিতরণ করা হত, অন্যগুলি ছিল না। কিছু পরীক্ষা 'সমান' বৈকল্পিক থেকে বৃহত্তর প্রস্থান জড়িত।

আমার বেশ কয়েকটি প্রশ্ন রয়েছে:

  1. টি-টেস্টগুলি কি এখানে উপযুক্ত? তা না হলে কেন? এটি কি কেবল সেই পরীক্ষাগুলির ক্ষেত্রেই প্রযোজ্য যেখানে স্বাভাবিকতা এবং বৈচিত্রের সমতার সমমানগুলি সন্তুষ্ট হয়?
  2. উপযুক্ত বিকল্প (গুলি) কী? সম্ভবত একটি অনুচ্ছেদ পরীক্ষা?
  3. অসম বৈকল্পিকতা টাইপ আই ত্রুটিকে স্ফীত করে, তবে কীভাবে? এবং ক্ষুদ্র, ভারসাম্যহীন নমুনা আকারের টাইপ আই ত্রুটিতে কী প্রভাব ফেলবে?

উত্তর:


11

দুটি জনসংখ্যার সমান বৈকল্পিক ধরে নিয়েছে এমন টি-টেস্টগুলি যখন দুটি জনগোষ্ঠীর বিভিন্ন রূপ রয়েছে বৈধ নয়, এবং এটি অসম নমুনার আকারের জন্য আরও খারাপ। ক্ষুদ্রতম নমুনার আকার যদি সর্বোচ্চ বৈকল্পিক হয় তবে টেস্টটি প্রকারের প্রথম ধরণের ত্রুটি ঘটবে)। অন্যদিকে টি-টেস্টের ওয়েলচ-স্যাটার্থওয়েট সংস্করণটি সমান বৈকল্পিকতা ধরে নেয় না। আপনি যদি ফিশার-পিটম্যান ক্রমান্বয়ে পরীক্ষার কথা ভাবছেন তবে এটিও সমান বৈচিত্র্য ধরে নিয়েছে (আপনি যদি কম পি-মান থেকে অসম উপায়গুলি নির্ধারণ করতে চান)।

অন্যান্য অনেকগুলি বিষয় রয়েছে যা সম্পর্কে আপনি ভাবতে চাইতে পারেন:

(1) যদি রূপগুলি পরিষ্কারভাবে অসম হয় তবে আপনি কি এখনও উপায়গুলির মধ্যে পার্থক্যে এত আগ্রহী?

(২) পি-ভ্যালুগুলির তুলনায় আপনার কাছে প্রভাবের অনুমানের বেশি ব্যবহার হতে পারে?

(3) আপনি কি কেবল অবিচ্ছিন্ন তুলনা করে সিরিজের তুলনায় আপনার ডেটার বহুবিধ প্রকৃতি বিবেচনা করতে চান?


হাই স্কর্চচি, আপনার উত্তরের জন্য ধন্যবাদ। আমি প্রশ্ন যাকে জাহির বিবেচিত করেছি:
DeanP

2
(1) ভিন্নতা এবং গড় উভয়ই আমাদের অধ্যয়নের জন্য তথ্যবহুল হতে পারে (যেমন মাইগ্রেশন প্রস্থানের তারিখগুলি এক জনগোষ্ঠীর জন্য পরে উল্লেখযোগ্য হতে পারে এবং প্রস্থানের তারিখগুলির পরিধি আরও পরিবর্তনশীল)।
ডিএনপি

3
(1) কেবল এটি উল্লেখ করেছেন কারণ লোকেরা প্রায়শই অসম্পূর্ণ বৈকল্পগুলি কেবলমাত্র একটি প্রযুক্তিগত সমস্যা হিসাবে দেখেন এবং ভুলে যান এটি তার নিজের মধ্যে একটি আকর্ষণীয় সত্য।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

2
(২) আমার বক্তব্যটি আরও ছিল যে পি-ভ্যালুগুলির একটি তালিকা আত্মবিশ্বাসের অন্তরগুলির সাথে প্রভাব আকারের প্রাক্কলনের (যার অর্থ, মিডিয়ান, ভেরিয়েন্স বা যা কিছু হতে পারে) তালিকার চেয়ে কম কার্যকর useful বিশেষত ছোট নমুনাগুলির সাথে, আত্মবিশ্বাসের ব্যবধানগুলি দেখাতে পারে যে পি-ভ্যালু বেশি থাকা সত্ত্বেও ব্যবহারিক গুরুত্বের প্রভাবের আকারগুলি এখনও ডেটাগুলির সাথে একাত্ম হয়।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

2
(3) আমি একটি স্বতন্ত্র ভেরিয়েবল (গ্রুপ) এবং বেশ কয়েকটি নির্ভরশীল ভেরিয়েবল (মাইগ্রেশন সময় এবং সি।) সম্পর্কে ভাবছিলাম: গ্রুপগুলির মধ্যে একটি আকর্ষণীয় পার্থক্য নির্ভরশীল ভেরিয়েবলের মধ্যে সম্পর্কের পরিবর্তন হতে পারে। প্রথম ধাপ boxplots বা তির্যক বরাবর দলের মধ্যে প্রতিটি DV তুলনা dotplots, & একে অপরের কোষে DVS জোড়া (আবার পার্থক্য গোষ্ঠী) জন্য scatterplots সঙ্গে একটা চমৎকার ম্যাট্রিক্স হবে। এবং সত্যি কথা বলতে, ছোট নমুনা মাপের একটি অনুসন্ধান বিশ্লেষণের জন্য, এটি শেষ ধাপ হতে পারে।
স্কোর্টচি - মনিকা পুনরায় ইনস্টল করুন

1

প্রথমত, স্কোর্টচি যেমন ইতিমধ্যে নির্দেশ করেছে, তথ্য-বন্টন সম্পর্কিত অনুমানের কারণে টি-টেস্টটি আপনার ডেটার পক্ষে এটি উপযুক্ত নয়।

আপনার দ্বিতীয় পয়েন্টে, আমি টি-পরীক্ষার বিকল্প প্রস্তাব করব। যদি আপনার আগ্রহটি কেবল এই বিষয়টির বিষয়ে থাকে তবে আপনার দুটি নমুনার বিতরণ যদি সমান হয় বা না হয় তবে আপনি উইলকক্সন র‌্যাঙ্ক-সামনের পরীক্ষার দ্বি-পার্শ্ববর্তী সংস্করণটিও ব্যবহার করার চেষ্টা করতে পারেন। উইলকক্সন র‌্যাঙ্ক-সমষ্টি পরীক্ষাটি একটি নন-প্যারাম্যাট্রিক পরীক্ষা। আপনি যদি আপনার ডেটার অন্তর্নিহিত বিতরণ সম্পর্কে নিশ্চিত না হন তবে এই ধরণের পরীক্ষাটি বিশেষত সহায়ক।

এটি ছোট নমুনা আকারের পাশাপাশি বৃহত সংঘের জন্য পরীক্ষার একটি সঠিক সমাধান বিদ্যমান । তদতিরিক্ত, একটি আর প্যাকেজও রয়েছে যা উইলকক্সন র‌্যাঙ্ক-সমষ্টি পরীক্ষা উপলব্ধি করে।

যেহেতু এটি একটি প্যারামিটার বিনামূল্যে পরীক্ষা এবং ছোট নমুনা আকারগুলি পরিচালনা করে, তাই পরীক্ষার ক্ষেত্রে আপনার পরীক্ষার ক্ষেত্রে ভাল পরীক্ষা করা উচিত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.