টি-টেস্ট বা নন-প্যারামেট্রিক পরীক্ষার মধ্যে কীভাবে চয়ন করবেন, যেমন ছোট নমুনায় উইলকক্সন


96

কিছু অনুমানের স্টুডেন্টস ব্যবহার পরীক্ষা করা সম্ভব টন -test (হয়তো দুই নমুনা ক্ষেত্রে অসম ভেরিয়ানস জন্য ওয়েলশ এর সংশোধন ব্যবহার করে), অথবা দ্বারা Wilcoxon মত একটি অ-স্থিতিমাপ পরীক্ষা জোড় র্যাঙ্ক পরীক্ষা স্বাক্ষরিত, Wilcoxon-মান-হুইটনি ইউ পরীক্ষা, বা জোড়যুক্ত সাইন পরীক্ষা। কোন পরীক্ষাটি সবচেয়ে উপযুক্ত, বিশেষত যদি নমুনার আকার "ছোট" হয় তবে আমরা কীভাবে নীতিগত সিদ্ধান্ত নিতে পারি?

(- পারেন অনেক পরিচায়ক পাঠ্যবই এবং বক্তৃতা নোট একটি "ফ্লোচার্ট" পদ্ধতির যেখানে স্বাভাবিক পরীক্ষা করা হয় দিতে inadvisedly - স্বাভাবিক পরীক্ষার দ্বারা, বা আরো বিস্তৃতভাবে দ্বারা কিউকিউ চক্রান্ত বা অনুরূপ) একটি মধ্যবর্তী সিদ্ধান্ত নিতে টন -test বা অ- স্থিতিমাপ পরীক্ষা। বিজোড় দুই নমুনার জন্য টি সেখানে সিদ্ধান্ত নিতে ওয়েলশ এর সংশোধন প্রযোজ্য হবে কিনা তা ভ্যারিয়েন্সের সমসত্ত্বতা জন্য আরও চেক করা যেতে পারে -test। এই পদ্ধতির সাথে একটি সমস্যা হ'ল উপায়টি কীভাবে পরীক্ষার প্রয়োগ করা উচিত তা পর্যবেক্ষণ করা ডেটার উপর নির্ভর করে এবং এটি কীভাবে নির্বাচিত পরীক্ষার কার্যকারিতা (পাওয়ার, টাইপ আই ত্রুটির হার) প্রভাবিত করে।

আরেকটি সমস্যা হ'ল ছোট ডেটা সেটগুলিতে চেক করার স্বাভাবিকতা কতটা কঠোর হয়: আনুষ্ঠানিক পরীক্ষার কম শক্তি থাকে যাতে লঙ্ঘনগুলি সনাক্ত করা যায় না, তবে অনুরূপ সমস্যাগুলি কিউকিউ প্লটের ডেটা চোখের সামনে ফেলে প্রয়োগ করে। এমনকি গুরুতর লঙ্ঘনগুলি সনাক্ত করা যায় না, উদাহরণস্বরূপ যদি বিতরণটি মিশ্রিত হয় তবে মিশ্রণের কোনও উপাদান থেকে কোনও পর্যবেক্ষণ আঁকা হয়নি। বৃহত বিপরীতে , আমরা কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের সুরক্ষার জালে এবং পরীক্ষার পরিসংখ্যান এবং টি বিতরণের অ্যাসিম্পটিক স্বাভাবিকতা ঝুঁকতে পারি না ।n

এর একটি নীতিগত প্রতিক্রিয়া হ'ল "সুরক্ষা প্রথম": একটি ছোট নমুনায় স্বাভাবিকতা অনুমানটি নির্ভরযোগ্যতার সাথে যাচাই করার কোনও উপায় ছাড়াই, প্যারামিমেটিকবিহীন পদ্ধতিতে আটকে থাকুন। আর একটি হ'ল স্বাভাবিকতা ধরে নেওয়ার জন্য কোনও ভিত্তি বিবেচনা করা হয়, তাত্ত্বিকভাবে (যেমন ভেরিয়েবল বেশ কয়েকটি এলোমেলো উপাদানগুলির যোগফল এবং সিএলটি প্রযোজ্য) বা বুদ্ধিমানভাবে (উদাহরণস্বরূপ বৃহত্তর সহ পূর্ববর্তী গবেষণাগুলি স্বাভাবিক হিসাবে প্রমাণিত হয় ), এবং কেবলমাত্র যদি এই ধরনের ভিত্তি বিদ্যমান থাকে তবে টি- টেষ্ট ব্যবহার করে । কিন্তু এই সাধারণত শুধুমাত্র যথার্থ আনুমানিক স্বাভাবিক, এবং স্বাধীনতা কম ডিগ্রী তে এটি কিভাবে কাছাকাছি স্বাভাবিক এটি একটি invalidating এড়াতে করা প্রয়োজন বিচার করা কঠিন টি -test।n

স্বাভাবিকতা ইস্যুতে টি-টেস্ট বা নন-প্যারাম্যাট্রিক পরীক্ষার জন্য বেশিরভাগ গাইড। তবে ছোট নমুনাগুলি কিছু দিক-বিষয়ও তুলে ধরে:

  • যদি কোনও "সম্পর্কযুক্ত নমুনা" বা "আনপেইার্ড" টি-পরীক্ষা করে থাকেন, তবে ওয়েলশ সংশোধন ব্যবহার করবেন কিনা ? কিছু লোক বৈচিত্রের সমতার জন্য একটি অনুমান পরীক্ষা ব্যবহার করে তবে এখানে এটির শক্তি কম হবে; অন্যরা এসডিগুলি "যুক্তিসঙ্গতভাবে" নিকটে কিনা (বিভিন্ন মানদণ্ডে) তা পরীক্ষা করে দেখেন। জনসংখ্যার বৈকল্পিক সমান বলে বিশ্বাস করার কোনও ভাল কারণ না থাকলে ছোট নমুনাগুলির জন্য সর্বদা ওয়েলক সংশোধন ব্যবহার করা কি নিরাপদ?

  • আপনি যদি শক্তি এবং দৃust়তার মধ্যে বাণিজ্য-বন্ধ হিসাবে পদ্ধতির পছন্দ দেখতে পান তবে অ-প্যারাম্যাট্রিক পদ্ধতিগুলির অ্যাসেম্পোটিক দক্ষতা সম্পর্কে দাবী অকার্যকর । থাম্বের নিয়ম যে " উইলকক্সন পরীক্ষায় টি-টেস্টের প্রায় 95% শক্তি থাকে যদি ডেটা সত্যিই স্বাভাবিক থাকে এবং ডেটা না হয় তবে প্রায়শই বেশি শক্তিশালী হয়, তাই মাঝে মাঝে শোনা যায় কেবল উইলকক্সন ব্যবহার করুন", যদি 95% কেবলমাত্র বড় জন্য প্রয়োগ হয় তবে এটি ছোট নমুনার জন্য ত্রুটিযুক্ত যুক্তি।n

  • ক্ষুদ্র নমুনাগুলি তথ্যের জন্য কোনও রূপান্তর উপযুক্ত কিনা তা নির্ধারণ করা খুব কঠিন বা অসম্ভব হয়ে উঠতে পারে, কারণ রূপান্তরিত ডেটা কোনও (সাধারণ পর্যায়ে) সাধারণ বিতরণের অন্তর্ভুক্ত কিনা তা বলা মুশকিল। সুতরাং যদি কোনও কিউকিউ প্লটটি খুব ইতিবাচক স্কিউড ডেটা প্রকাশ করে, যা লগগুলি নেওয়ার পরে আরও যুক্তিসঙ্গত বলে মনে হয়, তবে লগ ইন করা ডেটাতে টি-টেস্ট ব্যবহার করা নিরাপদ? বৃহত্তর নমুনাগুলিতে এটি খুব লোভনীয় হবে তবে ছোট আমি প্রথম স্থানে লগ-সাধারণ বিতরণ আশা করার ভিত্তি না থাকলে সম্ভবত বন্ধ করে রাখতাম।n

  • অ-প্যারাম্যাট্রিক্সের জন্য অনুমানগুলি যাচাই করার বিষয়ে কী? কিছু উত্স উইলকক্সন পরীক্ষা প্রয়োগের আগে একটি প্রতিসম বিতরণ যাচাই করার পরামর্শ দেয় (স্টোকাস্টিক আধিপত্যের পরিবর্তে এটি অবস্থানের পরীক্ষা হিসাবে বিবেচনা করে), যা স্বাভাবিকতা পরীক্ষা করার ক্ষেত্রে একই রকম সমস্যা নিয়ে আসে। যদি আমরা প্রথম স্থানে নন-প্যারাম্যাট্রিক পরীক্ষার জন্য আবেদন করি তবে যদি "সুরক্ষা প্রথম" মন্ত্রটির অন্ধভাবে বাধ্যতা হয়, তবে ছোট্ট নমুনা থেকে স্নিগ্ধতা যাচাই করতে অসুবিধা স্পষ্টতই আমাদেরকে যুক্ত জোড় সাইন টেস্টের নিম্ন শক্তিতে নিয়ে যায় ।

এই ছোট-নমুনা বিষয়গুলি মনে রেখে, টি এবং নন-প্যারামেট্রিক পরীক্ষার মধ্যে সিদ্ধান্ত নেওয়ার সময় কোনও ভাল - আশাবাদী শ্রদ্ধেয় পদ্ধতি কী?

বেশ কয়েকটি দুর্দান্ত উত্তর রয়েছে, তবে র‌্যাম্প টেস্টের অন্যান্য বিকল্পগুলি, যেমন ক্রমান্বয়ে পরীক্ষার বিষয়ে বিবেচনা করে, একটি প্রতিক্রিয়াও স্বাগত হবে।


2
আমার একটি "পরীক্ষা চয়ন করার পদ্ধতি" কী হতে পারে তা ব্যাখ্যা করা উচিত - প্রারম্ভিক পাঠ্যগুলি প্রায়শই ফ্লোচার্ট ব্যবহার করে। আনকিয়ারড ডেটার জন্য, সম্ভবত: "1. উভয় নমুনা সাধারণত বিতরণ করা হয়েছে কিনা তা পরীক্ষা করার জন্য কিছু পদ্ধতি ব্যবহার করুন (3 এ না গেলে), ২. অসম বৈকল্পিকতা পরীক্ষা করার জন্য কিছু পদ্ধতি ব্যবহার করুন: যদি তাই হয় তবে দ্বি-নমুনা টি-পরীক্ষা করুন ওয়েলকের সংশোধন, যদি না হয়, সংশোধন না করেই সঞ্চালন করুন 3.. তথ্যকে স্বাভাবিকতায় রূপান্তরিত করার চেষ্টা করুন (যদি কাজগুলি 2 এ চলে যায় 4 এ যান) 4.. পরিবর্তে ইউ পরীক্ষা করুন (সম্ভবত বিভিন্ন অনুমান পরীক্ষা করার পরে) "। তবে এই পদক্ষেপগুলির মধ্যে অনেকগুলি ছোট এন এর জন্য অসন্তুষ্টিজনক বলে মনে হচ্ছে, যেমনটি আশা করি আমার প্রশ্নটি ব্যাখ্যা করেছে!
সিলভারফিশ

2
আকর্ষণীয় প্রশ্ন (+1) এবং একটি অনুদান সেট আপ করার সাহসী পদক্ষেপ। কিছু আকর্ষণীয় উত্তর খুঁজছেন। যাইহোক, আমি প্রায়শই আমার ক্ষেত্রে যা প্রয়োগ করতে দেখি তা হ'ল ফলশ্রুতি পরীক্ষা (টি-টেস্ট বা মান-হুইটনি-উইলকক্সনের পরিবর্তে)। আমার ধারণা এটি এটিকেও উপযুক্ত প্রতিযোগী হিসাবে বিবেচনা করা যেতে পারে। এগুলি ছাড়াও আপনি "ছোট নমুনার আকার" বলতে কী বোঝাতে চান তা কখনও নির্দিষ্ট করেননি ।
অ্যামিবা

1
@ অ্যালেক্সিস অনেক বই দাবি করেছে যে উইলকক্সন পরীক্ষার মধ্যস্থতা সম্পর্কে প্রতিসাম্যতা অনুমান করা হয়েছে, ফলাফলগুলি যদি অবস্থান সম্পর্কিত বিবৃতি হিসাবে দেখা হয় তবে কিছু পরীক্ষা করার জন্য একটি বাক্সের চক্রান্তের প্রস্তাব দেয়: মাল্টেস্টেপের ঝুঁকির জন্য নীচে গ্লেন / ফ্র্যাঙ্ক হ্যারেলের উত্তর সম্পর্কে আমার আলোচনা দেখুন কার্যপ্রণালী)। এছাড়াও কিছু উত্স সূচিত করে যে উইলকক্সন-মান-হুইটনি ইউ অনুমান করে যে গ্রুপ বিতরণগুলি কেবল অনুবাদ দ্বারা পৃথক হয় (এবং হিস্টোগ্রাম বা অভিজ্ঞতা সিডিএফগুলিতে ভিজ্যুয়াল চেকের পরামর্শ দেয়)। একটি সিগ। ইউ টেস্ট বিভিন্ন আকারের বিতরণের কারণে মিডিয়ানদের সমান হলেও হতে পারে। ফ্র্যাঙ্ক হ্যারেলের উত্তরে মন্তব্যে উদ্ধৃত কাগজপত্রগুলিও দেখুন।
সিলভারফিশ

3
0:P(XA>XB)=0.5

2
ছোট্ট নমুনাগুলির জন্য "উইলকক্সনের 95% শক্তি" যুক্তিটি কীভাবে "ত্রুটিযুক্ত" এটি অন্বেষণ করার উপযুক্ত হতে পারে (অংশটি এটি নির্ভর করে যে কোনওটি ঠিক কী করে, কোনওটি কী ছোট এবং কী পরিমাণ ছোট)। উদাহরণস্বরূপ, আপনি 5% এর পরিবর্তে 5.5% বলার জন্য পরীক্ষাগুলি চালাতে খুশি হন, এটি যদি নিকটতম উপযুক্ত অর্জনযোগ্য তাত্পর্য স্তর হতে পারে তবে শক্তি প্রায়শই বেশ ভালভাবে ধরে থাকে। একবার অবশ্যই - তথ্য সংগ্রহের আগে "পাওয়ার গণনা" পর্যায়ে - পরিস্থিতিগুলি কী হতে পারে তা নির্ধারণ করুন এবং আপনি যে নমুনা আকারে বিবেচনা করছেন তাতে উইলকক্সনের বৈশিষ্ট্যগুলি কী তা উপলব্ধি করুন।
Glen_b

উত্তর:


67

আমি সম্পর্কে প্রশ্নের ক্রম পরিবর্তন করতে যাচ্ছি।

আমি পাঠ্যপুস্তক এবং বক্তৃতা নোটগুলি প্রায়শই অসম্মতি পেয়েছি এবং আমি এমন একটি সিস্টেম পছন্দ করতে চাই যাতে নিরাপদে সেরা অনুশীলন হিসাবে সুপারিশ করা যায় এবং বিশেষত একটি পাঠ্যপুস্তক বা কাগজ যা উদ্ধৃত করা যেতে পারে through

দুর্ভাগ্যক্রমে, বইগুলিতে এই বিষয়ে কিছু আলোচনা এবং প্রাপ্ত জ্ঞানের উপর নির্ভর করে। কখনও কখনও যে জ্ঞান প্রাপ্তি যুক্তিযুক্ত, কখনও কখনও এটি কম হয় (কমপক্ষে কোনও অর্থে যে কোনও বৃহত্তর সমস্যা উপেক্ষা করা হলে এটি একটি ছোট ইস্যুতে মনোযোগ দেয়); আমাদের যত্ন সহকারে পরামর্শের জন্য প্রস্তাবিত ন্যায্যতাগুলি (যদি কোনও ন্যায়বিচারই আদৌ দেওয়া হয় তবে) পরীক্ষা করা উচিত।

স্বাভাবিকতা ইস্যুতে টি-টেস্ট বা নন-প্যারাম্যাট্রিক পরীক্ষার জন্য বেশিরভাগ গাইড।

এটি সত্য, তবে এটি বেশ কয়েকটি কারণে ভ্রান্ত that

যদি কোনও "সম্পর্কযুক্ত নমুনা" বা "আনপেইার্ড" টি-পরীক্ষা করে থাকেন, তবে ওয়েলশ সংশোধন ব্যবহার করবেন কিনা?

এটি (আপনার বৈকল্পগুলি সমান হওয়া উচিত বলে মনে করার কারণ না থাকলে এটি ব্যবহার করা) হ'ল অসংখ্য রেফারেন্সের পরামর্শ। আমি এই উত্তরে কিছুকে নির্দেশ করছি।

কিছু লোক বৈকল্পিকতার সমতার জন্য একটি হাইপোথিসিস পরীক্ষা ব্যবহার করে তবে এখানে এটির শক্তি কম হবে। সাধারণত আমি কেবল নমুনা এসডিগুলি "যুক্তিসঙ্গতভাবে" নিকটবর্তী কিনা তা নয় (যা কিছুটা বিষয়গত, তাই এটি করার আরও মূলত উপায় থাকতে হবে) তবে আবার, কম এন দিয়ে এটি ভাল হতে পারে যে জনসংখ্যার এসডিগুলি আরও এগিয়ে রয়েছে নমুনা ছাড়াও।

জনসংখ্যার বৈকল্পিক সমান বলে বিশ্বাস করার কোনও ভাল কারণ না থাকলে ছোট নমুনাগুলির জন্য সর্বদা ওয়েলক সংশোধন ব্যবহার করা কি নিরাপদ? সেই পরামর্শই তাই। পরীক্ষার বৈশিষ্ট্যগুলি অনুমান পরীক্ষার ভিত্তিতে পছন্দ দ্বারা প্রভাবিত হয়।

এ সম্পর্কিত কিছু উল্লেখ এখানে এবং এখানে দেখা যায় , যদিও একই রকম কথা বলার মতো আরও রয়েছে।

সমতা-বৈকল্পিক ইস্যুটির স্বাভাবিকতা ইস্যুটির সাথে অনেকগুলি অনুরূপ বৈশিষ্ট্য রয়েছে - লোকেরা এটি পরীক্ষা করতে চায়, পরামর্শ পরামর্শ দেয় পরীক্ষার ফলাফলের উপর পরীক্ষাগুলির পছন্দগুলি পরের পরীক্ষার উভয় ধরণের ফলাফলকে বিরূপ প্রভাবিত করতে পারে - এটি কেবল অনুমান না করা ভাল better আপনি যথাযথভাবে ন্যায়সঙ্গত করতে পারবেন না (একই ভেরিয়েবল এবং অন্যান্য সম্পর্কিত অন্যান্য স্টাডির তথ্য ব্যবহার করে ডেটা সম্পর্কে যুক্তি দিয়ে)।

তবে, পার্থক্য আছে। একটি হ'ল - কমপক্ষে নাল অনুমানের অধীনে পরীক্ষার পরিসংখ্যান বিতরণের ক্ষেত্রে (এবং তাই এটির স্তর-দৃust়তা) - বড় নমুনাগুলিতে অ-স্বাভাবিকতা কম গুরুত্বপূর্ণ (কমপক্ষে তাত্পর্য স্তরের ক্ষেত্রে, যদিও ক্ষমতা হতে পারে আপনার যদি ছোট প্রভাবগুলি সন্ধান করার প্রয়োজন হয় তবে এখনও একটি সমস্যা হয়ে উঠুন), সমান বৈকল্পিক অনুমানের অধীনে অসম বৈকল্পিকতার প্রভাবটি বড় আকারের নমুনার আকারের সাথে প্রকৃতপক্ষে চলে না।

নমুনার আকার "ছোট" হলে কোনটি সবচেয়ে উপযুক্ত পরীক্ষা বাছাই করার জন্য কোন নীতিগত পদ্ধতির প্রস্তাব দেওয়া যেতে পারে?

হাইপোথিসিস পরীক্ষার সাথে, যা কিছু গুরুত্বপূর্ণ (শর্তগুলির কিছু সেট অনুসারে) মূলত দুটি জিনিস:

  • আসল টাইপ আই ত্রুটির হার কী?

  • শক্তি আচরণ কেমন?

α

এই ছোট-নমুনা বিষয়গুলি মনে রেখে, টি এবং নন-প্যারামেট্রিক পরীক্ষার মধ্যে সিদ্ধান্ত নেওয়ার সময় কাজ করার জন্য কি কোনও ভাল - আশাবাদী কেবল - চেকলিস্ট রয়েছে?

আমি অনেকগুলি পরিস্থিতি বিবেচনা করব যেখানে আমি কিছু সুপারিশ করব, স্বাভাবিকতা এবং অসম বৈচিত্রের সম্ভাবনা উভয় বিবেচনা করে। প্রতিটি ক্ষেত্রে, ওয়েলচ-পরীক্ষা বোঝাতে টি-টেস্টের উল্লেখ করুন:

  • n মাঝারি-বড়

অ-সাধারণ (বা অজানা), এর কাছাকাছি-সমান বৈকল্পিক সম্ভবত:

যদি বিতরণটি ভারী-লেজযুক্ত হয় তবে আপনি সাধারণত মান-হুইটনি দিয়ে আরও ভাল হতে পারেন, যদিও এটি যদি কিছুটা ভারী হয় তবে টি-টেস্টটি ঠিক করা উচিত। হালকা-লেজগুলির সাহায্যে টি-টেস্টটি প্রায়শই পছন্দ করা যায়। পারমুয়েশন টেস্টগুলি একটি ভাল বিকল্প (যদি আপনি খুব ঝোঁক থাকেন তবে আপনি টি-স্ট্যাটিস্টিক ব্যবহার করে একটি ক্রমশক্তি পরীক্ষাও করতে পারেন)। বুটস্ট্র্যাপ পরীক্ষাও উপযুক্ত।

অ-সাধারণ (বা অজানা), অসম বৈকল্পিক (বা বৈচিত্রের সম্পর্ক অজানা):

যদি বিতরণটি ভারী-লেজযুক্ত হয় তবে আপনি সাধারণত মান-হুইটনি দিয়ে আরও ভাল হতে পারেন - যদি বৈষম্যের বৈষম্য কেবলমাত্র গড়ের বৈষম্যের সাথে সম্পর্কিত - যেমন এইচ 0 সত্য হয় তবে স্প্রেডের পার্থক্যটিও অনুপস্থিত থাকতে হবে। জিএলএমগুলি প্রায়শই ভাল বিকল্প হয়, বিশেষত যদি স্কিউনেস থাকে এবং স্প্রেডের সাথে সম্পর্কিত হয়। র‌্যাম-ভিত্তিক পরীক্ষাগুলির মতো অনুরূপ সতর্কতা সহ একটি ক্রমশক্তি পরীক্ষা আরও একটি বিকল্প। বুটস্ট্র্যাপ পরীক্ষা এখানে ভাল সম্ভাবনা।

[1]

  • n মাঝারিভাবে ছোট

যদি আপনি অ-স্বাভাবিকতা আশা করেন (উপরের ক্যাভিয়েটের সাথে আবার) তবে র‌্যাঙ্ক পরীক্ষাগুলি এখানে যুক্তিসঙ্গত ডিফল্ট। আকৃতি বা বৈকল্পিকতা সম্পর্কে আপনার কাছে যদি বাহ্যিক তথ্য থাকে তবে আপনি জিএলএম বিবেচনা করতে পারেন। যদি আপনি আশা করেন যে জিনিসগুলি স্বাভাবিক থেকে খুব বেশি দূরে না থাকে, টি-টেস্টগুলি ভাল হতে পারে।

  • n খুব ছোট

[2]

বিতরণগুলি দৃ strongly়ভাবে স্কিউড এবং খুব বিচ্ছিন্ন উভয় ক্ষেত্রেই পরামর্শটি কিছুটা সংশোধন করতে হবে যেমন লিকার্ট স্কেল আইটেম যেখানে বেশিরভাগ পর্যবেক্ষণগুলি শেষের একটি বিভাগে রয়েছে। তাহলে উইলকসন-মান-হুইটনি অগত্যা টি-টেস্টের চেয়ে ভাল পছন্দ নয়।

যখন আপনার কাছে সম্ভাব্য পরিস্থিতি সম্পর্কে কিছু তথ্য থাকে তখন সিমুলেশন পছন্দগুলি আরও গাইড করতে সহায়তা করতে পারে।

আমি প্রশংসা করি এটি একটি বহুবর্ষজীবী বিষয়, তবে বেশিরভাগ প্রশ্ন প্রশ্নকারীর নির্দিষ্ট ডেটা সেট, কখনও কখনও শক্তির আরও সাধারণ আলোচনা এবং মাঝে মাঝে দুটি পরীক্ষায় অসমত হলে কী করতে হবে তা নিয়ে উদ্বেগ প্রকাশ করে তবে আমি সঠিক পদ্ধতিটি বেছে নেওয়ার জন্য একটি পদ্ধতি চাই প্রথম স্থান!

প্রধান সমস্যাটি হ'ল একটি ছোট ডেটা সেটে স্বাভাবিকতা অনুমানটি পরীক্ষা করা কতটা কঠিন:

এটা তোলে হয় একটি ছোট ডেটা সেটে স্বাভাবিক চেক করা এবং কতক একটি গুরুত্বপূর্ণ বিষয় যে করা কঠিন, কিন্তু আমি মনে হয় গুরুত্বপূর্ণ আরেকটি বিষয় আমরা বিবেচনা করতে হবে। একটি প্রাথমিক সমস্যা হ'ল পরীক্ষার মধ্যে বাছাইয়ের ভিত্তি হিসাবে স্বাভাবিকতা যাচাই করার চেষ্টা করা আপনি যে টেস্টগুলির মধ্যে বেছে নিয়েছেন তার বৈশিষ্ট্যগুলিকে বিরূপ প্রভাবিত করে।

স্বাভাবিকতার জন্য যে কোনও আনুষ্ঠানিক পরীক্ষার শক্তি কম থাকে তাই লঙ্ঘনগুলি সনাক্ত করা যায় না। (ব্যক্তিগতভাবে আমি এই উদ্দেশ্যে পরীক্ষা করবো না, এবং আমি স্পষ্টভাবে একা নই, তবে ক্লায়েন্টরা যখন স্বাভাবিকতা পরীক্ষা করার দাবি করে তখন আমি এই সামান্য ব্যবহারটি খুঁজে পেয়েছি কারণ এটি তাদের পাঠ্যপুস্তক বা পুরাতন বক্তৃতার নোট বা কোনও ওয়েবসাইট যা তারা একবার খুঁজে পেয়েছিল what ঘোষণা করা উচিত। এটি এমন একটি পয়েন্ট যেখানে একটি ভারী চেহারার প্রশংসা স্বাগত জানানো হবে))

[3]

টি- এবং ডাব্লুএমডাব্লু ডিআরএসের মধ্যে পছন্দটি স্বাভাবিকতার পরীক্ষার ভিত্তিতে হওয়া উচিত নয়।

বৈকল্পিকতার সাম্যের জন্য পরীক্ষা না করার বিষয়ে তারা একইভাবে দ্ব্যর্থহীন।

বিষয়টিকে আরও খারাপ করার জন্য, কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যটিকে সুরক্ষা জাল হিসাবে ব্যবহার করা নিরাপদ: ছোট এন এর জন্য আমরা পরীক্ষার পরিসংখ্যান এবং টি বিতরণের সুবিধাজনক অ্যাসেম্পোটিক স্বাভাবিকতার উপর নির্ভর করতে পারি না।

এমনকি বড় আকারের নমুনায়ও - সংখ্যার অ্যাসেম্পোটিক স্বাভাবিকতা বোঝায় না যে টি-স্ট্যাটিস্টিকের টি-বিতরণ হবে। তবে, এটি এতটা গুরুত্বপূর্ণ নয়, যেহেতু আপনার এখনও অ্যাসিপোটিক স্বাভাবিকতা থাকা উচিত (উদাহরণস্বরূপ সংখ্যার জন্য সিএলটি, এবং স্লুটস্কির উপপাদ্যটি পরামর্শ দেয় যে শেষ পর্যন্ত টি-স্ট্যাটিস্টিকগুলি স্বাভাবিক দেখা শুরু করা উচিত, যদি উভয়ের শর্ত থাকে তবে))

এর একটি নীতিগত প্রতিক্রিয়া হ'ল "সুরক্ষা প্রথম": যেহেতু একটি ছোট নমুনায় স্বাভাবিকতা অনুমানটি নির্ভরযোগ্যতার সাথে যাচাই করার কোনও উপায় নেই, পরিবর্তে সমতুল্য নন-প্যারাম্যাট্রিক পরীক্ষা চালান।

এটি আসলে পরামর্শ যা আমি উল্লেখ করি (বা উল্লেখ করার লিঙ্কে) আমি দিই।

আমি দেখেছি কিন্তু এতে কম স্বাচ্ছন্দ্য বোধ করি, এটি একটি ভিজ্যুয়াল চেক করা এবং টি-টেস্ট নিয়ে এগিয়ে যাওয়া যদি অপছন্দিত কিছু না পর্যবেক্ষণ করা হয় ("এই চেকটির স্বল্প শক্তি উপেক্ষা করে" স্বাভাবিকতা প্রত্যাখ্যান করার কোনও কারণ নেই)। আমার ব্যক্তিগত প্রবণতাটি স্বাভাবিকতা ধরে নেওয়ার জন্য কোনও ভিত্তি আছে কিনা তা বিবেচনা করা হয়, তাত্ত্বিক (যেমন পরিবর্তনশীল বেশ কয়েকটি এলোমেলো উপাদানগুলির যোগফল এবং সিএলটি প্রযোজ্য) বা অভিজ্ঞতাবাদী (যেমন বৃহত্তর এন সহ পূর্ববর্তী গবেষণাগুলি স্বাভাবিক কিনা) is

এগুলি উভয়ই ভাল যুক্তি, বিশেষত যখন টি-টেস্টটি স্বাভাবিকতা থেকে মধ্যপন্থী বিচ্যুতির বিরুদ্ধে যুক্তিসঙ্গতভাবে দৃ is়তার সাথে সমর্থন করে। (যাইহোক, আমাদের মনে রাখা উচিত যে "মধ্যপন্থী বিচ্যুতি" একটি জটিল বাক্যাংশ; স্বাভাবিকতা থেকে কিছু ধরণের বিচ্যুতি টি-টেস্টের পাওয়ার পারফরম্যান্সকে কিছুটা প্রভাব ফেলতে পারে যদিও এই বিচ্যুতিগুলি দৃশ্যত খুব ছোট - টি- পরীক্ষা অন্যের চেয়ে কিছু বিচক্ষণতার পক্ষে কম শক্তিশালী whenever আমরা যখনই স্বাভাবিকতা থেকে ছোট বিচ্যুতি নিয়ে আলোচনা করি তখন আমাদের এ বিষয়টি মাথায় রাখা উচিত))

সাবধান, তবে, শব্দগুচ্ছটি "পরিবর্তনশীল স্বাভাবিকের প্রস্তাব দেয়"। স্বাভাবিকতার সাথে যুক্তিসঙ্গতভাবে সামঞ্জস্য থাকা স্বাভাবিকতার মতো জিনিস নয়। আমরা প্রায়শই ডেটা দেখার প্রয়োজন ছাড়াই প্রকৃত স্বাভাবিকতা প্রত্যাখ্যান করতে পারি - উদাহরণস্বরূপ, যদি ডেটা নেতিবাচক না হতে পারে তবে বিতরণটি স্বাভাবিক হতে পারে না। ভাগ্যক্রমে, পূর্ববর্তী গবেষণা থেকে আমাদের কাছে যা থাকতে পারে তার থেকে কী কী গুরুত্বপূর্ণ হয় বা তথ্য কীভাবে রচিত হয় সে সম্পর্কে যুক্তি দিয়ে, যা স্বাভাবিকতা থেকে বিচ্যুতি ছোট হওয়া উচিত।

যদি তা হয়, তবে ডেটা ভিজ্যুয়াল ইন্সপেকশন পাস হলে আমি একটি টি-টেস্ট ব্যবহার করব এবং অন্যথায় নন-প্যারাম্যাট্রিকগুলিতে লেগে থাকবে। তবে যে কোনও তাত্ত্বিক বা অভিজ্ঞতাবাদী ক্ষেত্রগুলি সাধারণত আনুমানিক স্বাভাবিকতা অনুমান করে ন্যায্যতা দেয় এবং স্বাধীনতার নিম্ন ডিগ্রিতে টি-টেস্টকে অকার্যকর এড়াতে এটি কতটা স্বাভাবিকের প্রয়োজন তা বিচার করা শক্ত।

হ্যাঁ, এটি এমন কিছু যা আমরা খুব সহজেই এর প্রভাবের মূল্যায়ন করতে পারি (যেমন সিমুলেশনগুলির মাধ্যমে, যেমনটি আমি আগে উল্লেখ করেছি)। আমি যা দেখেছি, তা থেকে skewness ভারী লেজগুলির চেয়ে বেশি মনে হয় (তবে অন্যদিকে আমি বিপরীত কিছু দাবি দেখেছি - যদিও আমি জানি না যে এটি কিসের উপর ভিত্তি করে)।

শক্তি এবং দৃust়তার মধ্যে ব্যবসায়ের বন্ধন হিসাবে পদ্ধতিগুলির পছন্দকে দেখেন এমন লোকেদের জন্য, অ-প্যারাম্যাট্রিক পদ্ধতিগুলির অ্যাসিম্পটোটিক দক্ষতা সম্পর্কে দাবী করা অসহনীয়। উদাহরণস্বরূপ, "উইলকক্সন পরীক্ষাগুলিতে টি-টেস্টের প্রায় 95% শক্তি যদি থাম্বের নিয়মে থাকে যে ডেটা সত্যিই স্বাভাবিক থাকে এবং ডেটা না হয় তবে প্রায়শই বেশি শক্তিশালী হন, তাই কেবল উইলকক্সন ব্যবহার করুন" কখনও কখনও শুনেছি, তবে যদি 95% কেবলমাত্র বড় n এর জন্য প্রয়োগ হয় তবে এটি ছোট নমুনার জন্য ত্রুটিযুক্ত যুক্তি।


[2]

বিভিন্ন পরিস্থিতিতে এই জাতীয় সিমুলেশনগুলি দুটি-নমুনা এবং এক-নমুনা / জুটিযুক্ত-পার্থক্যের ক্ষেত্রে উভয় ক্ষেত্রেই স্বাভাবিকভাবে অ্যাসিম্পটোটিক দক্ষতার তুলনায় কিছুটা কম বলে মনে হয় তবে দক্ষতা স্বাক্ষরিত র‌্যাঙ্কের এবং উইলকক্সন-মান-হুইটনি পরীক্ষাগুলি খুব সামান্য নমুনার আকারে এখনও খুব বেশি।

কমপক্ষে এটি যদি পরীক্ষাগুলি একই প্রকৃত তাত্পর্য পর্যায়ে করা হয়; আপনি খুব অল্প নমুনা নিয়ে 5% পরীক্ষা করতে পারবেন না (এবং উদাহরণস্বরূপ এলোমেলোভাবে পরীক্ষা না করেও), তবে আপনি যদি এর পরিবর্তে সম্ভবত 5.5% বা 3.2% পরীক্ষা করতে প্রস্তুত হন তবে র‌্যাঙ্ক পরীক্ষা তাত্পর্যপূর্ণ পর্যায়ে টি-টেস্টের সাথে তুলনা করে খুব ভালভাবে ধরে থাকুন।

ক্ষুদ্র নমুনাগুলি তথ্যের জন্য কোনও রূপান্তর উপযুক্ত কিনা তা নির্ধারণ করা খুব কঠিন বা অসম্ভব হয়ে উঠতে পারে, কারণ রূপান্তরিত ডেটা কোনও (সাধারণ পর্যায়ে) সাধারণ বিতরণের অন্তর্ভুক্ত কিনা তা বলা মুশকিল। সুতরাং যদি কোনও কিউকিউ প্লটটি খুব ইতিবাচক স্কিউড ডেটা প্রকাশ করে, যা লগগুলি নেওয়ার পরে আরও যুক্তিসঙ্গত বলে মনে হয়, লগ করা ডেটাতে টি-পরীক্ষা ব্যবহার করা কি নিরাপদ? বৃহত্তর নমুনাগুলিতে এটি খুব লোভনীয় হবে, তবে ছোট এন দিয়ে আমি সম্ভবত প্রথম স্থানে লগ-সাধারণ বিতরণ আশা করার ভিত্তি না রেখে অবিরত থাকতাম।

আরও একটি বিকল্প রয়েছে: একটি পৃথক প্যারাম্যাট্রিক অনুমান করুন। উদাহরণস্বরূপ, যদি স্কিউড ডেটা থাকে তবে উদাহরণস্বরূপ, কিছু পরিস্থিতিতে গামা বিতরণকে যুক্তিসঙ্গতভাবে বিবেচনা করা যেতে পারে, বা অন্য কোনও স্কিউ পরিবারকে আরও ভাল অনুমান হিসাবে বিবেচনা করা যেতে পারে - মাঝারিভাবে বড় আকারের নমুনায় আমরা কেবল একটি জিএলএম ব্যবহার করতে পারি তবে খুব সামান্য নমুনায় এটি একটি ছোট-নমুনা পরীক্ষা দেখার প্রয়োজন হতে পারে - অনেক ক্ষেত্রে সিমুলেশন দরকারী হতে পারে useful

বিকল্প 2: টি-পরীক্ষাটিকে শক্তিশালী করুন (তবে পরীক্ষার পরিসংখ্যানগুলির ফলাফলের বিতরণকে আরও তাত্পর্যপূর্ণ না করার জন্য দৃust় পদ্ধতির নির্বাচনের বিষয়ে যত্ন নেওয়া) - সামর্থ্যের মতো খুব ছোট-নমুনা ননপ্যারমেট্রিক পদ্ধতিতে এর কিছু সুবিধা রয়েছে কম টাইপ আই ত্রুটির হারের সাথে পরীক্ষা বিবেচনা করতে।

এখানে আমি স্বাভাবিকতার থেকে বিচ্যুতির বিরুদ্ধে সহজেই দৃus়মানের জন্য টি-পরিসংখ্যানগুলিতে অবস্থানের এম-অ্যাসেক্টর (এবং স্কেল সম্পর্কিত সম্পর্কিত অনুমানকারী) বলার পংক্তিগুলি নিয়ে ভাবছি। ওয়েলচের মতো কিছু, যেমন:

xySp

Sp2=sx2nx+sy2nyxsx

ψn

আপনি উদাহরণস্বরূপ, পি-মান পেতে স্বাভাবিকভাবে সিমুলেশন ব্যবহার করতে পারেন (যদি নমুনার আকারগুলি খুব ছোট হয় তবে আমি পরামর্শ দিই যে বুটস্ট্র্যাপিং-এর চেয়ে বেশি যদি নমুনার আকারগুলি এত ছোট না হয় তবে সাবধানতার সাথে প্রয়োগকৃত বুটস্ট্র্যাপটি বেশ ভাল করতে পারে , তবে তবে আমরা আবার উইলকক্সন-মান-হুইটনিতে ফিরে যেতে পারি। এরপরে একটি যুক্তিযুক্ত ফ্যাক্টর পাশাপাশি একটি ডিএফ সমন্বয় যা আমি কল্পনা করতাম তা পেতে একটি যুক্তিসঙ্গত টি-আনুষঙ্গিকতা হতে পারে। এর অর্থ হল যে ধরণের বৈশিষ্ট্য আমরা সাধারণের খুব কাছাকাছি চেয়ে থাকি সেগুলি পাওয়া উচিত এবং সাধারণের বিস্তীর্ণ অঞ্চলে যুক্তিসঙ্গত দৃust়তা থাকা উচিত। এমন অনেকগুলি সমস্যা রয়েছে যা বর্তমান প্রশ্নের ক্ষেত্রের বাইরে থাকবে তবে আমি মনে করি খুব সামান্য নমুনায় সুবিধাগুলির ব্যয় এবং প্রয়োজনীয় পরিশ্রমের চেয়ে বেশি হওয়া উচিত।

[আমি খুব দীর্ঘ সময় ধরে এই স্টাফটিতে সাহিত্য পড়িনি, সুতরাং সেই স্কোরটি দেওয়ার জন্য আমার কাছে উপযুক্ত উল্লেখ নেই]]

অবশ্যই যদি আপনি বিতরণটি কিছুটা সাধারণ-মতো হওয়ার চেয়ে প্রত্যাশা না করেন, তবে অন্য কোনও বিতরণের সাথে সমান হয়, তবে আপনি আলাদা প্যারাম্যাট্রিক পরীক্ষার উপযুক্ত প্ররোচনা অর্জন করতে পারেন।

আপনি যদি নন-প্যারাম্যাট্রিক্সের জন্য অনুমানগুলি পরীক্ষা করতে চান তবে কী হবে? কিছু উত্স উইলকক্সন পরীক্ষা প্রয়োগের আগে একটি প্রতিসম বন্টন যাচাই করার পরামর্শ দেয়, যা স্বাভাবিকতা যাচাই করতে অনুরূপ সমস্যা নিয়ে আসে।

প্রকৃতপক্ষে. আমি ধরে নিলাম আপনি স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষা বলতে চাইছেন। জোড়যুক্ত ডেটাতে এটি ব্যবহার করার ক্ষেত্রে, আপনি যদি ধরে নিতে প্রস্তুত হন যে লোকেশন শিফট ব্যতীত দুটি বিতরণ একই আকার হয় তবে আপনি নিরাপদ, যেহেতু পার্থক্যগুলি তখন প্রতিসামান্য হওয়া উচিত। আসলে, আমাদের এমনকি এত কিছু প্রয়োজন হয় না; পরীক্ষার জন্য কাজ করার জন্য শূন্যের নীচে আপনার প্রতিসাম্য প্রয়োজন; এটি বিকল্পের অধীনে প্রয়োজনীয় নয় (যেমন ধনাত্মক অর্ধ-রেখার উপর আকৃতির আকৃতির ডান স্কিউ অবিচ্ছিন্ন বিতরণগুলির সাথে যুক্ত জোড় পরিস্থিতি বিবেচনা করুন, যেখানে স্কেলগুলি বিকল্পের অধীনে তবে শূন্যের নীচে নয়; স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষাটি প্রত্যাশার মতো মূলত কাজ করা উচিত) যে ক্ষেত্রে)। বিকল্পটির অবস্থান স্থানান্তর থাকলেও পরীক্ষার ব্যাখ্যাটি আরও সহজ।

* (উইলকক্সনের নাম দুটি এবং দুটি নমুনা র‌্যাঙ্ক পরীক্ষার সাথে জড়িত - স্বাক্ষরিত র‌্যাঙ্ক এবং র‌্যাঙ্ক যোগফল; তাদের ইউ পরীক্ষার সাথে মান এবং হুইটনি উইলকক্সন দ্বারা অধ্যয়ন করা পরিস্থিতিকে সাধারণীকরণ করেছিলেন এবং নাল বন্টনকে মূল্যায়নের জন্য গুরুত্বপূর্ণ নতুন ধারণাগুলি প্রবর্তন করেছিলেন তবে উইলকক্সন-মান-হুইটনিতে লেখকের দুই সেটগুলির মধ্যে অগ্রাধিকারটি স্পষ্টভাবে উইলকক্সন - এটি যদি কমপক্ষে আমরা কেবল উইলকক্সন বনাম মান ও হুইটনি বিবেচনা করি তবে উইলকক্সন আমার বইতে প্রথম স্থান পেয়েছে। তবে, মনে হয় স্টিলারের আইন আমাকে আবার মারধর করেছে, এবং উইলকক্সন সম্ভবত পূর্বের বেশ কয়েকটি অবদানকারীদের সাথে সেই অগ্রাধিকারটি কিছুটা ভাগ করা উচিত এবং (মান এবং হুইটনি ছাড়াও) সমমানের পরীক্ষার বেশ কয়েকটি ডিসকভারের সাথে creditণ ভাগ করা উচিত [[৪] [৫])

তথ্যসূত্র

[1]: জিমারম্যান ডিডাব্লু এবং জাম্বো বিএন, (1993),
র‌্যাঙ্ক ট্রান্সফর্মেশনস এবং স্টুডেন্ট টি-টেস্টের ক্ষমতা এবং অ-সাধারণ জনগোষ্ঠীর জন্য ওয়েলচ টে-টেস্ট,
কানাডিয়ান জার্নাল এক্সপেরিমেন্টাল সাইকোলজি, 47 : 523–39।

[২]: জেসিএফ ডি শীতকালীন (২০১৩),
"অত্যন্ত ছোট নমুনা আকারের সাথে শিক্ষার্থীর টি-টেস্ট ব্যবহার করা,"
ব্যবহারিক মূল্যায়ন, গবেষণা এবং মূল্যায়ন , 18 : 10, আগস্ট, আইএসএসএন 1531-7714
http://pareonline.net/ getvn.asp? বনাম = 18 & N = 10

[3]: মাইকেল পি। ফে এবং মাইকেল এ। প্রেশান (২০১০),
"উইলকক্সন-মান-হুইটনি বা টি-টেস্ট? অনুমানের পরীক্ষা এবং সিদ্ধান্তের বিধিগুলির একাধিক ব্যাখ্যার অনুমানের উপর,"
স্ট্যাট সার্ভ ; 4 : 1–39।
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2857732/

[৪]: বেরি, কেজে, মিল্কে, পিডাব্লু এবং জনস্টন, জেই (২০১২),
"দ্বি-নমুনা র‌্যাঙ্ক-সমষ্টি পরীক্ষা: প্রাথমিক বিকাশ,"
সম্ভাবনা এবং পরিসংখ্যানের ইতিহাসের জন্য বৈদ্যুতিন জার্নাল , খণ্ড ৮, ডিসেম্বর
পিডিএফ

[৫]: কুরস্কাল, ডাব্লুএইচ (১৯৫7),
" উইলকক্সনের অনুলিপিযুক্ত দ্বি-নমুনা পরীক্ষা,"
আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল , ৫২ , ৩––-৩60০ Histতিহাসিক নোট।


আমি কয়েকটি বিষয় স্পষ্ট করতে চাই। বেশ কয়েকটি পয়েন্ট রয়েছে যেখানে আপনি উল্লেখ করেছেন যেমন "যদি বিতরণটি ভারী লেজযুক্ত হয় ..." (বা স্কিউ ইত্যাদি) - সম্ভবত এটি "বিতরণটি ভারী-লেজযুক্ত হবে" এমন ধারণা করা যুক্তিযুক্ত হিসাবে পড়া উচিত (তত্ত্ব থেকে / পূর্ববর্তী স্টাডিজ / যাই হোক না কেন) "যদি নমুনাটি ভারী-লেজযুক্ত হয়" এর পরিবর্তে, আমরা আবার বহু-পদক্ষেপ পরীক্ষায় ফিরে এসেছি যা আমরা এড়াতে চাইছি? (এটি আমার কাছে মনে হচ্ছে যে এই বিষয়টির একটি কেন্দ্রীয় সমস্যা হ'ল নমুনায় খুব বেশি না পড়ে বিতরণ সম্পর্কে বিশ্বাস বা অনুমানকে কীভাবে ন্যায়সঙ্গত করা যায়))
সিলভারফিশ

হ্যাঁ, এটি বোঝা উচিত যে "জনসংখ্যা হয় ভারী লেজযুক্ত হিসাবে পরিচিত, বা যুক্তিযুক্তভাবে ভারী লেজযুক্ত হওয়ার আশা করা যেতে পারে"। এর মধ্যে অবশ্যই তত্ত্বের মতো বিষয়গুলি রয়েছে (বা কখনও কখনও এমন পরিস্থিতি সম্পর্কে সাধারণ যুক্তি যা তত্ত্বের স্থিতিতে পৌঁছায় না ), বিশেষজ্ঞ জ্ঞান এবং পূর্ববর্তী গবেষণাগুলিও অন্তর্ভুক্ত। এটি ভারী-লেজু হওয়ার জন্য পরীক্ষার পরামর্শ দিচ্ছে না। এমন পরিস্থিতিতে যেখানে এটি কেবল অজানা, এটি বিভিন্ন বিতরণে কীভাবে খারাপ জিনিসগুলি হতে পারে যা আপনার নির্দিষ্ট পরিস্থিতির জন্য প্রশংসনীয় হতে পারে তা খতিয়ে দেখার মতো হতে পারে।
গ্লেন_বি

এই সম্ভাব্য উত্তরের টি-টেস্টকে "শক্তিশালী" করার বিকল্পগুলি কী কী হতে পারে সে সম্পর্কে এটি আরও কিছুটা বিশদে অন্তর্ভুক্ত করতে পারে এমন কোনও সুযোগ?
সিলভারফিশ

সিলভারফিশ - আমি নিশ্চিত নই যে আমি আপনার প্রশ্নকে যথাযথভাবে সম্বোধন করার জন্য রবাস্টিফাইজিংয়ের বিষয়ে বিশদ চেয়ে জিজ্ঞাসা করেছি। আমি এখন আরও কিছু যোগ করব।
Glen_b

সংযোজনের জন্য অনেক ধন্যবাদ, আমি ভেবেছিলাম যে এই উত্তরের মানটিতে অনেক কিছু যুক্ত হয়েছে। এখন এই প্রশ্নটি কিছুটা স্থির হয়েছে, এবং প্রতিক্রিয়াগুলির একটি ভাল সেট তৈরি করেছে, আমি মূল প্রশ্নটি একটি ভাল অনুলিপি-সম্পাদনা দিতে চাই এবং বিভ্রান্তিকর হতে পারে এমন কোনও কিছু সরিয়ে দিতে চাই (যারা পাঠক অতীতে পড়েন না তাদের সুবিধার জন্য) প্রশ্নটি!). আমি যখন আপনার প্রতিক্রিয়াতে যথাযথ সম্পাদনা করার জন্য তাই করি তখন কি পুনর্গঠিত প্রশ্নের সাথে উদ্ধৃতিগুলি মিলে যায়?
সিলভারফিশ

22

YktP

এই সমস্ত একসাথে রেখে, কিছু প্রস্তাবিত নির্দেশনা নীচে নিম্নরূপ:

  1. যদি ডেটা পরীক্ষা করার আগে গাউসীয় বিতরণ অনুমান করার কোন বাধ্যতামূলক কারণ না পাওয়া যায় এবং কোনও কোভারিয়েট সমন্বয় প্রয়োজন হয় না, তবে ননপ্যারামেট্রিক পরীক্ষা ব্যবহার করুন।
  2. যদি কোভারিয়েট সমন্বয় প্রয়োজন হয়, আপনার পছন্দমতো র‌্যাঙ্ক টেস্টের সেমিপ্রেমেট্রিক রিগ্রেশন জেনারালাইজেশন ব্যবহার করুন। উইলকক্সন পরীক্ষার জন্য এটি আনুপাতিক প্রতিকূল মডেল এবং সাধারণ স্কোর পরীক্ষার জন্য এটি প্রোবট অর্ডিনাল রিগ্রেশন।

t3πY

kkloglogসংযুক্তি সংশ্লেষিত সম্ভাবনা অর্ডিনাল মডেল বিতরণগুলি আনুপাতিক ঝুঁকিতে ধরা হয়। লজিট লিঙ্কের জন্য সংশ্লেষিত সম্ভাব্যতা মডেল (আনুপাতিক প্রতিকূলতা মডেল), বিতরণগুলি আনুপাতিক প্রতিকূল অনুমান দ্বারা সংযুক্ত বলে ধরে নেওয়া হয়, অর্থাত, সংযোজন বিতরণ ফাংশনগুলির লগিটগুলি সমান্তরাল। বিতরণগুলির একটির আকারটি অপ্রাসঙ্গিক। হ্যান্ডআউটসের অধ্যায় 15 এর বিবরণটি http://biostat.mc.vanderbilt.edu/CourseBios330 এ পাওয়া যাবে ।

ঘন ঘন বিবেচনা করা হয় এমন ঘন ঘন পরিসংখ্যান পদ্ধতির দুটি ধরণের অনুমান রয়েছে। প্রথমটি সংরক্ষণের ধরণ I টির ত্রুটি তৈরির জন্য প্রয়োজনীয় অনুমানগুলি। দ্বিতীয়টি টাইপ II ত্রুটি সংরক্ষণের সাথে সম্পর্কিত (অনুকূলতা; সংবেদনশীলতা)। আমি বিশ্বাস করি যে দ্বিতীয়টির জন্য প্রয়োজনীয় অনুমানগুলি প্রকাশের সর্বোত্তম উপায় হ'ল উপরের মত একটি সেমিপ্রেমেট্রিক মডেলে একটি ননপ্যারামেট্রিক পরীক্ষা এম্বেড করা। দুজনের মধ্যে আসল সংযোগটি রামি দক্ষ স্কোর পরীক্ষাগুলি যা সেমিপারামেট্রিক মডেল থেকে উদ্ভূত হয়েছিল from দ্বি-নমুনা মামলার জন্য আনুপাতিক প্রতিকূল মডেল থেকে স্কোর পরীক্ষার অঙ্কটি হুবহু র‌্যাঙ্ক-যোগের পরিসংখ্যান।


1
এর জন্য ধন্যবাদ, আমি এই উত্তরের দর্শনের প্রতি খুব সহানুভূতিশীল - উদাহরণস্বরূপ, প্রচুর উত্স বলে যে কোনও পরীক্ষার সিদ্ধান্ত নেওয়ার আগে আমার কমপক্ষে স্বাভাবিকতার জন্য চক্ষু-চেক ডেটা করা উচিত। তবে এই ধরণের মাল্টি-স্টেপ পদ্ধতি পরিষ্কারভাবে, যদিও পরীক্ষাগুলি পরিচালনা করে তা প্রভাবিত করে।
সিলভারফিশ 14

1
nn=15

3
10000p

4
পারমুটেশন পরীক্ষা হ'ল টাইপ আই ত্রুটি নিয়ন্ত্রণ করার উপায়গুলি তবে দ্বিতীয় ধরণের ত্রুটিটি চিহ্নিত করে না। সাবমোটিমাল পরিসংখ্যানের উপর ভিত্তি করে একটি ক্রমায়ন পরীক্ষা (উদাহরণস্বরূপ, সাধারণ গড় এবং বৈকল্পিক যখন ডেটা লগ-গাউশিয়ান বিতরণ থেকে আসে) ক্ষমতার দিক থেকে ক্ষতিগ্রস্থ হবে।
ফ্র্যাঙ্ক হ্যারেল 16

3
হ্যান্ডআউটসের হ্যাঁ 15 নং অধ্যায়টি আমার বইয়ের আসন্ন ২ য় সংস্করণের একটি নতুন অধ্যায়ে প্রসারিত হয়েছে যা আমি পরের মাসে প্রকাশকের কাছে জমা দেব।
ফ্রাঙ্ক হেরেল

13

র্যান্ড উইলকক্স তাঁর প্রকাশনা এবং বইগুলিতে কিছু খুব গুরুত্বপূর্ণ বিষয় তৈরি করেছেন, যার বেশিরভাগ ফ্র্যাঙ্ক হ্যারেল এবং গ্লেন_বি পূর্ববর্তী পোস্টগুলিতে তালিকাভুক্ত করেছিলেন।

  1. গড়টি আমরা প্রয়োজনীয় পরিমাণগুলি নির্ধারণ করতে চাই না তা অগত্যা। অন্যান্য পরিমাণে সম্ভবত একটি আদর্শ পর্যবেক্ষণের আরও ভাল উদাহরণ দেওয়া যায়।
  2. টি-টেস্টের জন্য, স্বাভাবিকতা থেকে ছোট প্রস্থানের জন্যও শক্তি কম হতে পারে।
  3. টি-টেস্টের জন্য, পর্যবেক্ষণ করা সম্ভাবনার কভারেজ নামমাত্রের চেয়ে যথেষ্ট আলাদা হতে পারে।

কিছু মূল পরামর্শগুলি হ'ল:

  1. একটি শক্তিশালী বিকল্প হ'ল টি-টেস্ট ব্যবহার করে ছাঁটাইযুক্ত মাধ্যম বা এম-অনুমানকারীদের তুলনা করা। উইলকক্স 20% ছাঁটাই উপায়ের পরামর্শ দেয়।
  2. অভিজ্ঞতাগত সম্ভাবনা পদ্ধতিগুলি তাত্ত্বিকভাবে আরও সুবিধাজনক ( ওভেন, 2001 ) তবে মাঝারি থেকে ছোট এন এর জন্য অগত্যা নয়।
  3. যদি টাইপ আই ত্রুটিটি নিয়ন্ত্রণ করতে হয় তবে পারমিটেশন টেস্টগুলি দুর্দান্ত, তবে একটি সিআই পেতে পারে না।
  4. অনেক পরিস্থিতিতে উইলকক্স ছাঁটাইযুক্ত উপায়ে তুলনা করতে বুটস্ট্র্যাপ-টি প্রস্তাব করে। আর, এই বাস্তবায়িত ইন ফাংশান উপস্থিত করা হয় yuenbt , yhbt মধ্যে WRS প্যাকেজ।
  5. ট্রেনিংয়ের পরিমাণ> / = 20% হলে পারসেন্টাইল বুটস্ট্র্যাপ পার্সেন্টাইল-টি-এর চেয়ে ভাল। আর এই ফাংশন বাস্তবায়িত হয় pb2gen উপরোক্ত মধ্যে WRS প্যাকেজ।

দুটি ভাল রেফারেন্স হ'ল উইলকক্স ( 2010 ) এবং উইলকক্স ( 2012 )।


8

ব্র্যাডলি, তাঁর রচনায় বিতরণ-মুক্ত পরিসংখ্যান পরীক্ষা (১৯68৮, পৃষ্ঠা -১ )-২৪) তিনি "শাস্ত্রীয়" এবং "বিতরণ-মুক্ত" পরীক্ষার মধ্যে তেরটি বৈপরীত্য আনেন। নোট করুন যে ব্র্যাডলি "নন-প্যারাম্যাট্রিক" এবং "বিতরণ-মুক্ত" এর মধ্যে পার্থক্য করে তবে আপনার প্রশ্নের প্রয়োজনে এই পার্থক্যটি প্রাসঙ্গিক নয়। এই তেরোটিতে অন্তর্ভুক্ত রয়েছে এমন উপাদানগুলি যা কেবলমাত্র পরীক্ষার ডেরিভাটিনোগুলির সাথে নয়, তবে তাদের প্রয়োগগুলির সাথে সম্পর্কিত। এর মধ্যে রয়েছে:

  • তাত্পর্য স্তরের পছন্দ: ধ্রুপদী পরীক্ষাগুলির ক্রমাগত তাত্পর্যপূর্ণ স্তর থাকে; বিতরণ-মুক্ত পরীক্ষায় সাধারণত তাত্পর্যপূর্ণ স্তরগুলির স্বতন্ত্র পর্যবেক্ষণ থাকে, তাই শাস্ত্রীয় পরীক্ষাগুলি বলেন স্তরটি নির্ধারণে আরও নমনীয়তা সরবরাহ করে।
  • প্রত্যাখ্যান অঞ্চলের যৌক্তিক বৈধতা: বিতরণ-মুক্ত পরীক্ষা প্রত্যাখ্যান অঞ্চলগুলি স্বজ্ঞাতভাবে কম বোধগম্য হতে পারে (অগত্যা মসৃণ বা অবিচ্ছিন্ন নয়) এবং পরীক্ষাটি কখন নাল অনুমানকে প্রত্যাখ্যান করে বলে বিবেচনা করা উচিত তা নিয়ে বিভ্রান্তির সৃষ্টি হতে পারে।
  • পরিসংখ্যানগুলির প্রকার যা পরীক্ষামূলক: ব্র্যাডলিকে সরাসরি উদ্ধৃত করার জন্য: " পর্যবেক্ষণের পরিমাণের উপর গাণিতিক ক্রিয়াকলাপের ক্ষেত্রে সংজ্ঞায়িত পরিসংখ্যানগুলি শাস্ত্রীয় কৌশল দ্বারা পরীক্ষা করা যেতে পারে, অর্ডার সম্পর্ক (র‌্যাঙ্ক) বা বিভাগ-ফ্রিকোয়েন্সি ইত্যাদির দ্বারা সংজ্ঞায়িত পৃথকগুলি দ্বারা পরীক্ষা করা যেতে পারে by বিতরণবিহীন পদ্ধতিসমূহ। অর্থ এবং প্রকরণগুলি পূর্ববর্তী এবং মধ্যমা এবং আন্তঃবাহক পরিসীমাগুলির উত্তরগুলির উদাহরণ। "বিশেষত যখন অ-সাধারণ বিতরণগুলি পরিচালনা করা হয় তখন অন্যান্য পরিসংখ্যান পরীক্ষা করার ক্ষমতা মূল্যবান হয়ে যায়, বিতরণ-মুক্ত পরীক্ষায় ওজন ধার দেয় becomes ।
  • উচ্চ-অর্ডার ইন্টারঅ্যাকশনগুলির পরীক্ষামূলকতা: বিতরণ-মুক্ত পরীক্ষার চেয়ে শাস্ত্রীয় পরীক্ষার অধীনে অনেক সহজ।
  • নমুনা আকারের প্রভাব:এটি আমার মতে একটি বরং গুরুত্বপূর্ণ। যখন নমুনার আকার ছোট হয় (ব্র্যাডলি n = 10 এর আশেপাশে বলেছেন), ক্লাসিকাল টেস্টের অন্তর্গত প্যারামেট্রিক অনুমানগুলি লঙ্ঘিত হয়েছে কিনা তা নির্ধারণ করা খুব কঠিন হতে পারে। বিতরণ-মুক্ত পরীক্ষার এই অনুমানগুলি লঙ্ঘন করার মতো নেই। তদুপরি, যখন অনুমানগুলি লঙ্ঘিত করা হয়নি, বিতরণ-মুক্ত পরীক্ষাগুলি প্রায়শই প্রয়োগ করা প্রায় সহজ এবং একটি পরীক্ষার প্রায় দক্ষ are সুতরাং ছোট নমুনা আকারের জন্য (10 এর কম, 30 পর্যন্ত সম্ভব) ব্র্যাডলি বিতরণ-মুক্ত পরীক্ষার প্রায় নিয়মিত প্রয়োগের পক্ষে। বড় আকারের নমুনা আকারের জন্য, কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্যারাম্যাট্রিক লঙ্ঘনগুলিকে ছাপিয়ে যায় যে নমুনাটির অর্থ এবং নমুনার ভিন্নতা স্বাভাবিকের দিকে ঝুঁকবে এবং প্যারামেট্রিক পরীক্ষাগুলি দক্ষতার দিক থেকে উচ্চতর হতে পারে।
  • প্রয়োগের সুযোগ: বিতরণ-মুক্ত হয়ে, এই ধরনের পরীক্ষাগুলি নির্দিষ্ট বন্টনকে ধরে নিয়ে শাস্ত্রীয় পরীক্ষার চেয়ে জনসংখ্যার বৃহত্তর শ্রেণির জন্য প্রযোজ্য।
  • অবিচ্ছিন্ন বিতরণ অনুমানের লঙ্ঘনের সনাক্তকরণ: বিতরণমুক্ত পরীক্ষাগুলিতে দেখতে সহজ (যেমন বাঁধা স্কোরগুলির অস্তিত্ব), প্যারামেট্রিক পরীক্ষায় শক্ত hard
  • অবিচ্ছিন্ন বন্টন অনুমানের লঙ্ঘনের প্রভাব: অনুমানটি লঙ্ঘিত হলে পরীক্ষাটি অক্ষম হয়ে যায় becomes ব্র্যাডলি বিতরণ-মুক্ত পরীক্ষাগুলির জন্য কীভাবে অনভিজ্ঞতার সীমা নির্ধারণ করা যায় তা বোঝাতে সময় ব্যয় করে তবে শাস্ত্রীয় পরীক্ষার জন্য কোনও অনুরূপ রুটিন নেই।

1
উদ্ধৃতি দেওয়ার জন্য আপনাকে ধন্যবাদ! ব্র্যাডলির কাজটি বেশ পুরানো বলে মনে হচ্ছে তাই আমি সন্দেহ করি যে আধুনিক সিমুলেশন স্টাডিতে দক্ষতার সাথে তুলনা করতে এবং বিভিন্ন পরিস্থিতিতে I / II ত্রুটির হার টাইপ করার পক্ষে এটি তেমন কাজ করে না? আমি ব্রুনার-মুনজেল পরীক্ষার বিষয়ে তার পরামর্শ সম্পর্কেও আগ্রহী হব - যদি দুটি গ্রুপের ভেরিয়েন্স সমান না জানা থাকে তবে তাদের কি ইউ পরীক্ষার পরিবর্তে ব্যবহার করা উচিত?
সিলভারফিশ

1
ব্র্যাডলি দক্ষতা নিয়ে আলোচনা করেন, যদিও বেশিরভাগ সময় এটি অসম্পূর্ণ আপেক্ষিক দক্ষতার প্রসঙ্গে। তিনি সীমাবদ্ধ নমুনা-আকারের দক্ষতা সম্পর্কে বিবৃতি দেওয়ার জন্য উত্সটি মাঝে মাঝে উপস্থিত করেন, তবে কাজটি 1968 সাল থেকে, আমি নিশ্চিত যে এর পরে আরও অনেক ভাল বিশ্লেষণ করা হয়েছে। যার কথা বললে, আমার যদি এটি ঠিক থাকে তবে ব্রুনার এবং মুনজেল 2000 সালে তাদের নিবন্ধ লিখেছিলেন , যা ব্র্যাডলে কেন এর কোনও উল্লেখ নেই তা ব্যাখ্যা করে।
অব্রাহাম

হ্যাঁ এটি সত্যিই এটি ব্যাখ্যা করবে! :) ব্র্যাডলির চেয়ে আরও বেশি আপ টু ডেট জরিপ আছে কি জানেন?
সিলভারফিশ

একটি সংক্ষিপ্ত অনুসন্ধান দেখায় যে প্যারামিমেটিকবিহীন পরিসংখ্যান সম্পর্কিত সাম্প্রতিক অনেকগুলি পাঠ্য রয়েছে। উদাহরণস্বরূপ: ননপ্যারামেট্রিক স্ট্যাটিস্টিকাল মেথডস (হল্যান্ডার এট আল, ২০১৩), ননপ্যারামেট্রিক হাইপোথিসিস টেস্টিং: আর (অ্যাপ্লিকেশন সহ রমন এবং পারমিটেশন পদ্ধতি) (বননি এট আল, ২০১৪), ননপ্যারামেট্রিক স্ট্যাটিস্টিকাল ইনফারেন্স, পঞ্চম সংস্করণ (গিবনস এবং চক্রবর্তী, ২০১০)। আরও অনেকগুলি রয়েছে যা বিভিন্ন অনুসন্ধানে উঠে আসে। আমার কোনও নেই বলে আমি কোনও সুপারিশ করতে পারি না। দুঃখিত।
অভ্রাহাম

5

এই খুব আকর্ষণীয় প্রশ্নের উত্তর দেওয়া শুরু।

জোড়যুক্ত ডেটার জন্য:

মর্টেন ডাব্লু ফাগারল্যান্ড, লেভ সানডভিক (পেওয়ালের পিছনে) অসম বৈকল্পিকের সাথে স্কিউ বিতরণের জন্য পাঁচটি দ্বি-নমুনা অবস্থানের পরীক্ষার পারফরম্যান্স 5 টি পৃথক পরীক্ষার (টি-টেস্ট, ওয়েলচ ইউ, ইউয়েন-ওয়েলচ, উইলকক্সন-ম্যান) নিয়ে একাধিক পরীক্ষা-নিরীক্ষা করে -উইটনি এবং ব্রুনার-মুনজেল) নমুনার আকারের বিভিন্ন সংমিশ্রণের জন্য, নমুনা অনুপাত, স্বাভাবিকতা থেকে প্রস্থান ইত্যাদি on কাগজটি শেষ পর্যন্ত ওয়েলচ ইউকে পরামর্শ দিয়েছিল,

তবে কাগজের পরিশিষ্ট এ নমুনা আকারের প্রতিটি সংমিশ্রণের ফলাফলগুলি তালিকাভুক্ত করে। এবং ছোট নমুনা আকারের জন্য (এম = 10 এন = 10 বা 25) ফলাফলগুলি আরও বিভ্রান্তিকর (প্রত্যাশার মতো) - ফলাফলগুলির আমার অনুমানে (লেখকরা নয়) ওয়েলচ ইউ, ব্রুনার-মুঞ্জেল সমানভাবে পারফরম্যান্স করেছে বলে মনে হয়, এবং টি-পরীক্ষা এম = 10 এবং এন = 10 ক্ষেত্রেও ভাল।

এটি আমি এখনও অবধি জানি।

একটি "দ্রুত" সমাধানের জন্য, আমি গবেষণার ফলাফলগুলিতে পরিসংখ্যানের প্রভাব সম্পর্কে ক্রমবর্ধমান চিকিত্সকদের সচেতনতার উল্লেখ করতাম : টি-টেস্টের তুলনামূলক শক্তি এবং প্যাট্রিক ডি ব্রিজ এবং শ্লোমো এস স্যাভলভস্কির ছোট নমুনাগুলি প্রয়োগিত গবেষণায় উইলকক্সন র্যাঙ্ক-সামনের পরীক্ষার তুলনামূলক শক্তি (পেওওয়ালের পেছনেও) এবং নমুনা আকারের কোনও ব্যাপার না হলেও সোজা উইলকক্সনে যান, তবে ক্যাভিয়েট এমপোটার উদাহরণস্বরূপ, দুটি আপাতদৃষ্টিতে অস্বাভাবিক বিতরণগুলির তুলনা করার সময় আমাদের কি সর্বদা একটি ননপ্যারমেট্রিক পরীক্ষা করা উচিত? ইভা স্কোভ্লুন্ড এবং গ্রেট ইউ ফেস্টা দ্বারা

জোড় করা ডেটার জন্য আমি এখনও কোনও অনুরূপ ফলাফল পাইনি


আমি উদ্ধৃতি প্রশংসা করি! স্পষ্টতার জন্য, "ওয়েলচ ইউ" উল্লেখ করা হচ্ছে, একই পরীক্ষাটি "ওয়েলচ টি" বা "ওয়েলচ-অ্যাস্পিন টি" বা (যেমন আমি সম্ভবত প্রশ্নের মধ্যে এটি অনুচিত বলেছি) "" ওয়েলচ সংশোধন নিয়ে টি পরীক্ষা " ?
সিলভারফিশ

যতদূর আমি কাগজটি থেকে বুঝতে পারি, ওয়েলচ ইউ স্বাভাবিক ওয়েলচ-অ্যাস্পিন নয় - এটি স্বাধীনতার ডিগ্রিগুলির জন্য ওয়েলচ – স্যাটার্থওয়েট সমীকরণটি ব্যবহার করে না, তবে এমন একটি সূত্র যা ঘনক এবং নমুনার বর্গের পার্থক্য রাখে আকার।
জ্যাক ওয়াইনার

নাম সত্ত্বেও এটি কি এখনও টি-টেস্ট? অন্য কোথাও আমি "ওয়েলচ ইউ" অনুসন্ধান করি বলে মনে হয় এটি ওয়েলচ-এস্পিনের উল্লেখ করছে যা হতাশাব্যঞ্জক।
সিলভারফিশ

3

নিম্নলিখিত লিঙ্কগুলি বিবেচনা করে:

স্বাভাবিকতা পরীক্ষা করা কি 'প্রয়োজনীয়ভাবে অকেজো'?

ডেটার স্বাভাবিকতা নির্ধারণের প্রয়োজন এবং সর্বোত্তম উপায়

জিনিসগুলিকে সরল করার জন্য, যেহেতু নন-প্যারামিমেট্রিক পরীক্ষাগুলি সাধারণ ডেটার জন্যও যুক্তিসঙ্গতভাবে ভাল, তাই কেন সর্বদা ছোট নমুনাগুলির জন্য সেগুলি ব্যবহার করবেন না।


1

গামা জনসংখ্যার মাধ্যমের পার্থক্য অনুকরণ করে

টি-টেস্ট এবং মান হুইটনি পরীক্ষার তুলনা করা

ফলাফল সংক্ষিপ্তসার

  • যখন দুটি জনগোষ্ঠীর বৈকল্পিকতা একই রকম হয়, মান হুইটনি পরীক্ষায় টি-টেস্টের চেয়ে আরও বড় ধরণের ক্ষমতা থাকে তবে আরও সত্য ধরণের 1 ত্রুটি থাকে।
  • H0
  • যখন দুটি জনগোষ্ঠীর বৈকল্পিকতা পৃথক হয়, তখন মান হুইটনি পরীক্ষা বড় ধরণের 1 ত্রুটির দিকে পরিচালিত করে, এমনকি যখন উপায়গুলি একই হয়। এগুলি আশা করা হয়নি যেহেতু মান হুইটনি বিতরণের ক্ষেত্রে পার্থক্যের জন্য পরীক্ষা করে, অর্থ নয়।
  • টি পরীক্ষাটি ভিন্নতার ক্ষেত্রে ভিন্ন তবে একই উপায়ে শক্তিশালী

পরীক্ষা 1) বিভিন্ন অর্থ, একই বৈকল্পিক

θ

  • X1k=0.5θ=1E[X1]=kθ=0.5Var[X1]=kθ2=0.5
  • X2k=1.445θ=0.588235 E[X2]=.85Var[X2]=.5

X1X2X1X2

d=(.85.5)/.5=0.5

p

  • H0:μX1=μX2=0.5
  • H1:μX1μX2

P(reject|H0)P(reject|H1)H0H1

সূত্র:

জনসংখ্যা বিতরণ

এখানে চিত্র বর্ণনা লিখুন

সিমুলেশন ফলাফল

এখানে চিত্র বর্ণনা লিখুন

আলোচনা

  • N=10
  • সমস্ত নমুনা আকারের জন্য, মান হুইটনি পরীক্ষায় টি-টেস্টের চেয়ে বেশি শক্তি রয়েছে এবং কিছু ক্ষেত্রে 2 এর ফ্যাক্টর দ্বারা
  • সমস্ত নমুনা আকারের জন্য, মান হুইটনি পরীক্ষায় I ত্রুটি বেশি রয়েছে এবং এটি একটি ফ্যাক্টর বা 2 - 3 দ্বারা
  • টি-টেস্টে ছোট নমুনা আকারের জন্য কম শক্তি রয়েছে

আলোচনা : যখন দুটি জনগোষ্ঠীর বৈকল্পিক সত্যই একই রকম হয়, তখন মান হুইটনি পরীক্ষা ক্ষুদ্র নমুনার আকারের ক্ষমতার দিক থেকে টি-টেস্টকে বিস্তৃত করে তোলে, তবে প্রকারের 1 টির ত্রুটির হার উচ্চতর হয়


পরীক্ষা 2: বিভিন্ন বৈকল্পিক, একই গড়

  • X1k=0.5θ=1E[X1]=kθ=.5Var[X1]=kθ2=.5
  • X2k=0.25θ=2 E[X2]=.5Var[X2]=1

H1Var[X1]=Var[X2]Var[X1]Var[X2]

সিমুলেশন থেকে আলোচনার ফলাফলগুলি দেখায় যে টি-পরীক্ষাটি বিভিন্ন বৈকল্পিকের পক্ষে অত্যন্ত দৃust় এবং আমি ধরণের ত্রুটিটি সমস্ত নমুনা আকারের 5% এর কাছাকাছি। যেমনটি প্রত্যাশা করা হয়েছিল, মান হুইটনি পরীক্ষাটি এই ক্ষেত্রে খারাপ সম্পাদন করে যেহেতু এটি কোনও পার্থক্যের জন্য নয় তবে বিতরণে পার্থক্যের জন্য পরীক্ষা করছে

এখানে চিত্র বর্ণনা লিখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.