লেডি টেস্টিং চা পরীক্ষার শক্তি


9

বিখ্যাত ফিশারের পরীক্ষায় পর্যবেক্ষণযোগ্য হ'ল সংশোধিত কাপের সংশোধন করা সংখ্যাk কাপ দুই ধরণের A এবং B। পরীক্ষার আকার দেওয়া হলে নাল অনুমানকে (মহিলাটি এলোমেলোভাবে অনুমান করছেন) প্রত্যাখ্যান করার জন্য সাধারণত সমালোচনামূলক অঞ্চলটি গণনা করা আকর্ষণীয়α। হাইপারজিমেট্রিক বিতরণ ব্যবহার করে এটি সহজেই করা যায়। একইভাবে আমি সমালোচনামূলক অঞ্চলটি দিয়ে পরীক্ষার আকারটি গণনা করতে পারি।

একটি ভিন্ন প্রশ্ন হ'ল: বিকল্প অনুমানের ভিত্তিতে পরীক্ষার শক্তি কীভাবে গণনা করা যায়? ধরুন উদাহরণস্বরূপ যে ভদ্রমহিলা একক কাপে সম্ভাবনার সাথে সঠিকভাবে অনুমান করতে সক্ষমp=90% (P(guessA|trueA)=P(guess B|true B)=0.9)। মোট কাপের সমতুল্য ধরে ধরে পরীক্ষার শক্তিটি কীN=8 এবং এক ধরণের কাপের মোট সংখ্যা n=N/2=4? (দুর্ভাগ্যক্রমে) মহিলা জানেনn

অন্য কথায় বলেছেন: বিতরণ কী k=(বিকল্প অনুমানের অধীনে সঠিক কাপের সংখ্যা) যদি মহিলা জানেন যে সেখানে রয়েছে n এক ধরণের কাপ?


আপনার পোস্টের কথা ভেবে ... যদি ফিশার নালাকে প্রত্যাখ্যান করার সিদ্ধান্ত নেন কেবল তখনই মহিলা যদি তার সমস্ত অনুমানের উপর সঠিক ছিলেন (আমি মনে করি যে এটিই ছিল), এবং সমস্ত কাপ সঠিকভাবে পাওয়ার একমাত্র সম্ভাব্য উপায় আছে, উচিত নয় এই স্থান গ্রহণের সম্ভাবনা হতে পারে 0.94=0.6561প্রকৃত শক্তি হতে পারে?
আন্তনি পরেল্লদা

আপনি সাধারণত প্রত্যাখ্যান করবেন না যখন তিনি সাধারণভাবে সমস্ত কাপ পান। তবে এটি সত্য যে সাথেN=8এটিই সমালোচনামূলক অঞ্চল। আপনি বিবেচনায় নিচ্ছেন না যে মহিলা জানেন যে প্রতিটি ধরণের 4 কাপ রয়েছে। উপায় দ্বারা আমি সাধারণ সমাধানে আগ্রহীN8
রাগেরো তুরা

1
এটি একটি আকর্ষণীয়, তবে শক্ত সমস্যা। টেবিলগুলি নির্ধারণ করা সহজ যা হো প্রত্যাখ্যানের দিকে নিয়ে যায়, তবে হা এর অধীনে এই টেবিলগুলি দেখার সম্ভাবনা সম্পর্কে ভাবতে হবে। নিম্নলিখিত নিবন্ধটি প্রদত্ত সংবেদনশীলতা এবং নির্দিষ্টতার সাথে কিছুটা সংশোধিত টেবিলের জন্য শক্তি গণনা করেছে: ফ্যালিসার্ড এট আল দ্বারা "মনস্তাত্ত্বিক গবেষণায় লিডি কোয়ালিটিভেটিভ এবং কোয়ান্টেটিভ পদ্ধতির সাথে লেডি-টেস্টিং-টি পদ্ধতির একটি সাধারণীকরণ"। আমি হিসাব সঠিক কিনা তা নিশ্চিত নই। যদি আপনার সত্যিকার অর্থে দ্বিপদী সমস্যা থাকে তবে আপনি এক্সট্যাক্ট আর প্যাকেজটি ব্যবহার করতে পারেন তবে এটি অন্যরকম সমস্যা জিজ্ঞাসা করা হয়েছে
পিটার ক্যালহাউন

উত্তর:


3

বিকল্পের অধীনে ভদ্রমহিলা এলোমেলোভাবে অনুমান করছেন না , তবে "এলোমেলোভাবে অনুমান করা নয়" বিভিন্ন পরিস্থিতিতে একটি অনন্তকে coversেকে রাখে। তিনি সর্বদা নিখুঁতভাবে অনুমান করতে পারেন বা এলোমেলো অনুমানের চেয়ে তিনি কেবলমাত্র কিছুটা ভাল করতে পারেন ... এবং সাধারণ ক্ষেত্রে পাশাপাশি কাজ করার জন্য একটি একক-ভেরিয়েবল "স্কেল" নেই এমনকি এলোমেলোভাবে কাজ করতে পারে (তাই আমাদের কোনও শক্তিও নেই) বাঁক না দেওয়া যদি না আমরা যে ধরণের নন-এলোমেলো প্রতিক্রিয়া জানাতে পারি সেগুলি সীমাবদ্ধ করে না)।

তাই যাতে একটি ক্ষমতা গনা, আমরা সম্পর্কে অত্যন্ত সুনির্দিষ্ট হতে হবে কিভাবে এটি নন-র্যান্ডম (এবং ঠিক কিভাবে অ র্যান্ডম এটা যে বিশেষ ফ্যাশন হয়) আছে।

আমরা ধরে নিতে পারি, উদাহরণস্বরূপ, তিনি যে দুধের মতো প্রতিটি কাপ স্বাদে প্রথম যোগ করেছিলেন তার সংবেদন পেয়েছিল - "দুধের প্রথমতা" সূচক যা এলোমেলো পরিবর্তনশীল on (,) প্রথমে দুধ যুক্ত হওয়ার পরে এর আলাদা (উচ্চতর) অর্থ হয় - উদাহরণস্বরূপ আমরা ধরে নিতে পারি যে এটি সাধারণ বা লোগোবাদী, মানে μ0 এবং বৈকল্পিক σ2=1/ω2 (ω2 "নির্ভুলতা" হিসাবে পরিচিত) যখন দুধ শেষ এবং গড় যুক্ত হয় μ1 এবং বৈকল্পিক σ2 যখন প্রথমে দুধ যুক্ত করা হয় (প্রকৃতপক্ষে, একটি সহজ তবে আরও প্রতিরোধমূলক ধারণা সেট করা যেতে পারে, বলুন, μ1=μ0=1যাতে সবকিছু এখন একটি পরিবর্তনশীল, নির্ভুলতার একটি ফাংশন)। সুতরাং এই পরামিতিগুলির কোনও প্রদত্ত মানগুলির জন্য, আমরা সমস্ত 8 কাপ সঠিকভাবে অর্জন করার সম্ভাবনাটি গণনা করতে পারি (যে চারটি ক্ষুদ্রতম "দুধের প্রথম স্তরের" মানগুলি তার অভিজ্ঞতার সাথে চারটি দুধ-দ্বিতীয় কাপের সাথে জড়িত); সঠিক গণনাটি যদি আমাদের পক্ষে খুব কঠিন হত তবে আমরা এটিকে যে কোনও পছন্দসই নির্ভুলতার সাথে অনুকরণ করতে পারি। [ননর্যান্ডমনেসকে কেবলমাত্র একটি ভেরিয়েবলের ফাংশন বলে মনে করা হয়, তবে আমাদের একটি পাওয়ার-কার্ভ থাকবে - প্যারামিটারের প্রতিটি মানের জন্য পাওয়ারের মান]]

এটি কীভাবে তিনি "এলোমেলো চেয়ে ভাল" পারফর্ম করতে পারেন তার জন্য এটি একটি নির্দিষ্ট ধরণের মডেল যা দিয়ে আমরা পরামিতি নির্দিষ্ট করতে পারি এবং পাওয়ারের জন্য কোনও মান অর্জন করতে পারি।

আমরা অবশ্যই এটির তুলনায় নন-এলোমেলোতার অনেকগুলি রূপ অনুমান করতে পারি।


3

বিকল্প অনুমানের অধীনে সঠিক সংখ্যার অনুমানের বন্টন একটি অ-কেন্দ্রীয় হাইপারজোমেট্রিক বিতরণকে অনুসরণ করে , যা প্রতিকূলতার অনুপাতের দিক দিয়ে পরামিতি করা হয়, অর্থাৎ ভদ্রমহিলা "চা প্রথমে" অনুমান করার সময় যে প্রতিকূলতা কত বেশি যখন আসলে দুধ আগে যুক্ত করা হয়েছিল (বা অন্যদিকে চারপাশে) আসলে তার বিপরীতে প্রথমে চা যুক্ত করা হয়েছিল। যদি বিজোড় অনুপাত 1 হয় তবে আমরা কেন্দ্রীয় হাইপারজমেট্রিক বিতরণ পাই।

দেখা যাক এটি কাজ করে কিনা। আমি MCMCpackপ্যাকেজটি ব্যবহার করে উদাহরণের প্রয়োজনে আর ব্যবহার করব , যা dnoncenhypergeom()একটি (নন-সেন্ট্রাল) হাইপারজমেট্রিক বিতরণের ঘনত্বের কম্পিউটিংয়ের জন্য কাজ করে । এটা তোলে আর্গুমেন্ট নেই xঅনুমান সঠিক সংখ্যার জন্য (সতর্ক থাকুন: এই দুই শর্ত এক অধীনে অনুমান সঠিক সংখ্যা, উদাহরণস্বরূপ, যখন চা সত্যিই প্রথম যোগ করা হয়েছিল), আর্গুমেন্ট n1, n2এবং m1চার মার্জিন তিন জন্য, এবং psiজন্য সত্য প্রতিকূল অনুপাত। xআসল প্রতিকূল অনুপাত 1: যখন আসল ঘনত্বটি 0 থেকে 4 এর সমান (4 টির সমান মার্জিন সহ) গণনা করা যাক

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

এই ফলন:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

সুতরাং, সেখানে একটি 1.43% সম্ভাবনা রয়েছে যে ভদ্রমহিলা 8 টি সঠিক অনুমান করবেন (অর্থাত্, তিনি সমস্ত 4 কাপ সঠিকভাবে অনুমান করেছিলেন যেখানে চা আগে যুক্ত হয়েছিল এবং তাই তিনি সমস্ত 4 কাপ সঠিকভাবে অনুমান করেছিলেন যেখানে দুধ আগে যুক্ত হয়েছিল) নাল অনুমানের অধীনে। এটি ফিশার নাল অনুমানকে প্রত্যাখ্যান করার জন্য যথেষ্ট পরিমাণে প্রমাণ হিসাবে বিবেচনা করেছিলেন This

প্রশ্নের মধ্যে বর্ণিত সম্ভাব্যতাগুলি বিজোড় অনুপাত গণনা করতে ব্যবহার করা যেতে পারে, (.90/(1.90))/(.10/(1.10))=81 (অর্থাত, odds(guessA|trueA)/odds(guessA|trueB))। মহিলাটি এখন 8 টি কাপ সঠিকভাবে অনুমান করবে (এখন, সে প্রথমে 4 টি কাপ অনুমান করবে যেখানে প্রথমে চা যুক্ত হয়েছিল এবং তাই 4 কাপও যেখানে দুধ আগে যুক্ত করা হয়েছিল) এখন কী সম্ভাবনা রয়েছে?

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

এই ফলন:

[1] 0.8312221

সুতরাং শক্তি তখন প্রায় 83%।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.