অনুপাতের প্রসঙ্গে একাধিক তুলনামূলক সমস্যা এড়াতে আমি কি ক্রমান্বন পরীক্ষা ব্যবহার করতে পারি?


9

নির্দিষ্ট বাইনারি ফলাফলের পূর্বাভাস দেওয়ার জন্য আমি তাদের 5 টি বিভিন্ন পদ্ধতির কার্যকারিতা মূল্যায়ন করছি (তাদের 'সাফল্য' এবং 'ব্যর্থতা' বলুন)। ডেটা দেখতে যেমন দেখাচ্ছে:

Method    Sample_Size    Success    Percent_Success
1         28             4          0.14  
2         19             4          0.21  
3         24             7          0.29  
4         21             13         0.61  
5         22             9          0.40 

পদ্ধতির তুলনামূলক শ্রেষ্ঠত্ব নির্ধারণ করতে আমি এই 5 টি পদ্ধতির মধ্যে একটি পরীক্ষা করতে চাই। অন্য কথায়, আমি পদ্ধতি 1> পদ্ধতি 2> ... পদ্ধতি 5 হিসাবে কর্মক্ষমতা অনুসারে পদ্ধতিগুলিকে অর্ডার করতে চাই multiple

পদক্ষেপ 1: সমস্ত ডেটা পুল করুন যাতে সামগ্রিক 37 সাফল্যের সাথে সামগ্রিক নমুনার আকার 114 হয়।

পদক্ষেপ 2: এলোমেলোভাবে 28, 19, 24, 21 এবং 22 এর সাথে সম্পর্কিত নমুনা আকারের সাথে 5 টি গ্রুপে ডেটা বিভক্ত করুন।

পদক্ষেপ 3: পদক্ষেপ 2 থেকে পার্সেন্ট_সুকেসের পর্যবেক্ষণ করা অর্ডারটি আমার ডেটার ক্রম অনুসারে সামঞ্জস্য রাখলে একটি পাল্টা বাড়ান।

পদক্ষেপ 4: বহু বার 2 এবং 3 বার পুনরাবৃত্তি করুন (10000 বলুন)।

পছন্দসই পি-মান = চূড়ান্ত কাউন্টার মান / 10000।

প্রশ্নাবলী:

  1. উপরের পদ্ধতিটি কি ঠিক আছে?

  2. আর-তে এমন কিছু আছে যা আমাকে উপরের পরীক্ষাটি সম্পাদন করতে সক্ষম করবে?

  3. উন্নতি বা বিকল্প পদ্ধতির জন্য কোনও পরামর্শ সহায়ক হবে।


@ ভুবার আপনি কীভাবে এটি ভাগ করে নেওয়ার জন্য আপনার কাছে কি আর কোড আছে?
বি_মিনার

উত্তর:


6

প্রস্তাবিত পদ্ধতিটি আপনার প্রশ্নের উত্তর দেয় না। নাল অনুমানের অধীনে এটি কেবলমাত্র ফ্রিকোয়েন্সিটি অনুমান করে, যার সাথে আপনার পর্যবেক্ষণ আদেশটি ঘটবে। তবে এই শূন্যের অধীনে, একটি ভাল অনুমানের জন্য, সমস্ত ক্রমগুলি সমানভাবে সম্ভবত, যেহেতু আপনার গণনাটি 1/5 এর কাছাকাছি একটি মান উত্পাদন করবে! = প্রায় 0.83%। এটি আমাদের কিছুই বলে না।

আরও একটি সুস্পষ্ট পর্যবেক্ষণ: আপনার ডেটার উপর ভিত্তি করে অর্ডার, 4> 5> 3> 2> 1 their তাদের আপেক্ষিক শ্রেষ্ঠত্বের অনুমান 0.61 - 0.40 = 21%, 0.40 - 0.21 = 11% ইত্যাদি are

এখন ধরুন, আপনার প্রশ্নটি যে কোনও পরিমাণে concerns পার্থক্য তার কোনও উদ্বেগের নাল অনুমানের অধীনে সুযোগের কারণে হতে পারে তা নিয়ে উদ্বেগ রয়েছে । আপনি সত্যিকার অর্থে এই দশটি প্রশ্নের মূল্যায়ন পরীক্ষা দিয়ে পরীক্ষা করতে পারেন। তবে, প্রতিটি পুনরাবৃত্তিতে আপনাকে অনুপাতের তুলনায় দশটি সূচক ট্র্যাক করতে হবে, মোট ক্রমের কোনও বৈশ্বিক সূচক নয়।(52)=10

আপনার ডেটার জন্য, 100,000 পুনরাবৃত্তি সহ একটি সিমুলেশন ফলাফল দেয়

543210,024390,00030,132330,2996120,097630,003740,2922230,202530,0088440,08702

পদ্ধতি 4 এবং পদ্ধতি 1, 2, এবং 3 এর মধ্যে অনুপাতের পার্থক্যের কারণে সম্ভাবনা নেই (আনুমানিক সম্ভাবনাগুলি যথাক্রমে 0.03%, 0.37%, 0.88%, যথাযথভাবে) তবে অন্যান্য পার্থক্যগুলিও হতে পারে। পদ্ধতির 1 এবং 5 এর মধ্যে পার্থক্যের কিছু প্রমাণ রয়েছে (পি = 2.44%) সুতরাং এটি আপনার আত্মবিশ্বাস থাকতে পারে যে সম্পর্কের সাথে জড়িত অনুপাতের পার্থক্য 4> 3, 4> 2, এবং 4> 1 সমস্ত ইতিবাচক , এবং সম্ভবত এটি 5> 1 এর মধ্যে পার্থক্য।


1
এটা আমার চেয়ে অনেক ভাল উত্তর! আমি প্রশ্নটি সঠিকভাবে পড়তে ব্যর্থ হয়েছি আমি ভীত (বিশেষত পদক্ষেপ 3)। আমি আমার উত্তরটি মুছে ফেলার কথা ভেবেছিলাম, তবে আমি কোনও বায়সিয়ান পদ্ধতির বৃহত্তর ব্যাখ্যার পক্ষে দাঁড়িয়েছি এটি সত্যই যে এটির আগ্রহ।
onestop

কেবলমাত্র আমি সঠিকভাবে বুঝতে পেরেছি তা নিশ্চিত করার জন্য - 4 এবং 5 পদ্ধতির মধ্যে অপেক্ষাকৃত পার্থক্যটি চিহ্নিত করা সূচকটি আপডেট হবে যখনই আমরা 0.21 এর চেয়ে বেশি পার্থক্য দেখি।
sxv

@ এসএক্সভি হ্যাঁ, এটা ঠিক। (ঠিক আছে, আমি আসলে তার চেয়েও বড় বা সমান ব্যবহার করেছি ies সম্পর্কগুলি ঘটে I আমি মনে করি উল্লেখযোগ্য ফলাফলের মধ্যে সমতা অন্তর্ভুক্ত করা সঠিক কাজ, কারণ আমরা সম্ভাবনাটি মূল্যায়ন করছি যা এই বৃহত বা বৃহত্তর পার্থক্যের কারণে ঘটতে পারে))
whuber

1

আপনার প্রস্তাবিত মন্টি-কার্লো ক্রমাঙ্কন পরীক্ষা পদ্ধতি নাল অনুমানের একটি পরীক্ষার জন্য পি-মান তৈরি করবে যে সাফল্যের সম্ভাবনা সমস্ত পদ্ধতির ক্ষেত্রে একই same তবে এখানে যথাক্রমে যথাযথ ক্রমানুসারে পরীক্ষা যথাযথভাবে সম্ভব হলে মন্টি কার্লো ক্রমচারণ পরীক্ষা করার সামান্য কারণ আছে । এটি ফিশারের সঠিক পরীক্ষা (ভাল, কিছু লোকের নামটি 2x2 টেবিলের জন্য সংরক্ষণ করা হয়, এক্ষেত্রে এটি শর্তসাপেক্ষ নির্ভুল পরীক্ষা)। আমি কেবলমাত্র আপনার ডেটা স্টাটা এবং-টাবিতে টাইপ করেছি ..., নির্ভুলভাবে দেওয়া পি = .0067 (তুলনা করার জন্য, পিয়ারসনের চি-স্কোয়ার্ড পরীক্ষা পি = .0059 দেয়)। আমি নিশ্চিত যে আর তে একটি সমতুল্য ফাংশন রয়েছে যা আর গুরুরা শীঘ্রই যুক্ত করবে।

আপনি যদি সত্যিই র‌্যাঙ্কিংয়ের দিকে নজর রাখতে চান তবে আপনি সম্ভবত বেয়েশিয়ার পদ্ধতির ব্যবহারে সেরা হতে পারেন, কারণ এটি প্রতিটি পদ্ধতি সত্যই সর্বোত্তম, দ্বিতীয় সেরা, তৃতীয় সেরা, ... এর সম্ভাবনা হিসাবে একটি সহজ ব্যাখ্যা দিতে পারে। এটি অবশ্যই আপনার সম্ভাব্যতার উপর প্রিয়ার স্থাপন করা প্রয়োজনের দামে আসে। পদগুলির সর্বাধিক সম্ভাবনার প্রাক্কলনটি কেবল পর্যবেক্ষণ করা আদেশ, তবে যতটা আমি অবগত আছি তত সহজেই ব্যাখ্যা করা যায় এমন একটি ঘনত্ববাদী কাঠামোয় র‌্যাঙ্কিংয়ের অনিশ্চয়তার পরিমাণ নির্ধারণ করা কঠিন difficult

আমি বুঝতে পেরেছি যে আমি একাধিক তুলনা উল্লেখ করি নি, তবে আমি এটি দেখতে পাচ্ছি না যে এটি কীভাবে আসে।


2
ফিশারের সঠিক পরীক্ষা এবং পিয়ারসনের চি-স্কোয়ারগুলি নাল অনুমানের পরীক্ষা করে যে বিকল্পের বিরুদ্ধে কমপক্ষে 1 টি আরও ভাল যে সমস্ত 5 পদ্ধতি সমান কার্যকর। পি-মানগুলি আমাকে বলে যে নালটি প্রত্যাখ্যান করা হয়েছে। সুতরাং, যদি আমি এটি জানতে চাই যে কোন পদ্ধতিগুলি আসলে অন্যদের চেয়ে ভাল তবে আমাকে 10 জোড়া তুলনা করতে হবে না?
sxv
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.