বারবার জমা হওয়া ডেটা পরীক্ষা করার সময় সামগ্রিক টাইপ আই ত্রুটি


12

গ্রুপ সিক্যুয়াল পদ্ধতি সম্পর্কে আমার একটি প্রশ্ন আছে ।

উইকিপিডিয়া অনুসারে:

দুটি চিকিত্সা গ্রুপগুলির সাথে একটি এলোমেলোভাবে পরীক্ষায়, ধ্রুপদী গোষ্ঠীর ক্রমগত পরীক্ষাগুলি নিম্নলিখিত পদ্ধতিতে ব্যবহৃত হয়: প্রতিটি গ্রুপে এন বিষয় উপলব্ধ থাকলে 2n বিষয়গুলির উপর একটি অন্তর্বর্তী বিশ্লেষণ পরিচালিত হয়। দুটি গোষ্ঠীর তুলনা করার জন্য পরিসংখ্যানগত বিশ্লেষণ করা হয় এবং বিকল্প অনুমানটি গৃহীত হলে, বিচারটি সমাপ্ত হয়। অন্যথায়, গ্রুপে প্রতি এন সাবজেক্ট সহ আরও 2n বিষয়ের জন্য ট্রায়াল চলতে থাকে। পরিসংখ্যান বিশ্লেষণ 4n বিষয় আবার সম্পাদিত হয়। যদি বিকল্পটি গ্রহণ করা হয়, তবে বিচারের অবসান হয়। অন্যথায়, 2n বিষয়ের এন সেট উপলব্ধ না হওয়া অবধি এটি পর্যায়ক্রমিক মূল্যায়নের সাথে অব্যাহত থাকে। এই মুহুর্তে, শেষ পরিসংখ্যান পরীক্ষা করা হয়, এবং পরীক্ষাটি বন্ধ করে দেওয়া হয়

কিন্তু এই ফ্যাশনে বারবার তথ্য জমা করার পরীক্ষা করে, ধরণের আই ত্রুটির স্তরটি স্ফীত হয় ...

যদি নমুনাগুলি একে অপরের থেকে স্বতন্ত্র থাকে তবে সামগ্রিক ধরণের I ত্রুটি, beα

α=1(1α)k

যেখানে test হ'ল প্রতিটি পরীক্ষার স্তর এবং অন্তর্বর্তীকালীন চেহারাগুলির সংখ্যা।αk

নমুনাগুলি ওভারল্যাপ হওয়ার পরে সেগুলি স্বাধীন নয়। অন্তর্ভুক্ত অন্তর্বর্তী বিশ্লেষণ সমান তথ্য বর্ধিত সময়ে সম্পাদন করা হয়, এটি পাওয়া যাবে যে (স্লাইড))

এখানে চিত্র বর্ণনা লিখুন

এই টেবিলটি কীভাবে প্রাপ্ত তা আপনি আমাকে ব্যাখ্যা করতে পারেন?

উত্তর:


12

নিম্নলিখিত স্লাইডগুলি 14 এর মাধ্যমে ধারণাটি ব্যাখ্যা করে। পয়েন্টটি, যেমন আপনি লক্ষ্য করেছেন, তা হ'ল পরিসংখ্যানের ক্রমটি পরস্পর সম্পর্কযুক্ত।

প্রসঙ্গটি পরিচিত মান বিচ্যুতি সহ একটি জেড-পরীক্ষা। প্রথম পরীক্ষার পরিসংখ্যান , যথাযথ মানসম্পন্ন, সিডিএফ- সহ একটি সাধারণ (0,1) বিতরণ রয়েছে । তাই দ্বিতীয় পরিসংখ্যাত করে কিন্তু - কারণ প্রথম ব্যবহার সেকেন্ডের জন্য ব্যবহৃত তথ্য একটি উপসেট - দুই পরিসংখ্যান পারস্পরিক সম্পর্কের সহগের সঙ্গে সম্পর্কিত হয় । অতএব এর দ্বিপদী বিতরণ রয়েছে। প্রথম ধরণের ত্রুটির সম্ভাবনা (নাল হাইপোথিসিসের অধীনে) এর সম্ভাবনা সমান হয় যে হয় (ক) টাইপ আই ত্রুটি প্রথম পরীক্ষায় ঘটে থাকে বা (খ) প্রথম ধরণের ক্ষেত্রে ত্রুটি ঘটে না তবে ঘটে থাকে দ্বিতীয় পরীক্ষা। আসুনz1Φz21/2(z1,z2)c=Φ1(10.05/2)সমালোচনামূলক মান হতে হবে (নামমাত্র আকার = 0.05 সহ দ্বি-পার্শ্বিক পরীক্ষার জন্য )। তারপরে দুটি বিশ্লেষণের পরে টাইপ আই ত্রুটির সম্ভাবনা সমান সমান বা এবং । সংখ্যার একীকরণ সারণীর সাথে একমত হয়ে এই সম্ভাবনার জন্য 0.0831178 মান দেয়। সারণীতে পরবর্তী মান একই ধরণের যুক্তি (এবং আরও জটিল সংহতকরণ) দ্বারা প্রাপ্ত হয়।α|z1|>c|z1|c|z2|>c

এই গ্রাফিকটিতে বাইনরমাল পিডিএফ এবং সংহতকরণের অঞ্চল (শক্ত পৃষ্ঠ) চিত্রিত হয়েছে। বাইনরমাল পিডিএফ, 3 ডি সারফেস প্লট


বোঝা গেল, ধন্যবাদ! পারস্পরিক সম্পর্ক কর (z1, z2) পাওয়া কি কঠিন?
অক্টোবর

@ মার্কো, পারস্পরিক সম্পর্ক গণনা করার জন্য সোজা কারণ পরীক্ষার পরিসংখ্যান এত সহজ: এটি সাধারণ ভেরিয়েবলগুলির একটি লিনিয়ার সংমিশ্রণ। (এই কারণ আমরা অনুমান ভ্যারিয়েন্স পরিচিত হয়।) পরিবর্তে, আপনি দুটি স্বাধীন র্যান্ডম ভেরিয়েবল একটি সমষ্টি হচ্ছে দ্বিতীয় পরিসংখ্যাত মনে করতে পারেন: প্রথম এক, , প্লাস পরিবর্তনের ফলে অতিরিক্ত ডেটা সৃষ্টি । আরও জটিল ক্ষেত্রে পারস্পরিক সম্পর্ক গণনা করা বেশ কঠিন হতে পারে: এটি এক কারণ যা কিছুটা আদর্শিক পরিস্থিতিটি অনুক্রমিক পরীক্ষাগুলি উদ্বুদ্ধ করতে ব্যবহৃত হয়! z1z1z2
whuber

আপনাকে অনেক ধন্যবাদ. হ্যাঁ, পারস্পরিক সম্পর্কটি গণনা করা বেশ সহজ দেখাচ্ছে। আসলে, এটি আমার কাছে স্পষ্ট ছিল না যে প্রসঙ্গটি দুটি সাধারণ বিতরণের মাধ্যমের তুলনা ছিল comparison এখন, এটি স্পষ্ট এবং আপনি সমস্ত কিছু খুব স্পষ্ট করে তোলেন! ধন্যবাদ!
অক্টোবরে

আপনি কীভাবে একটি সূত্র (বা আর কোড) সরবরাহ করতে পারেন যেমন এন = 400 এর জন্য এটি গণনা করবেন? আমি এটি নিজেই করতাম তবে দুর্ভাগ্যক্রমে আমি জানি না কীভাবে। এবং আমার যদি একাধিক তুলনা হয় (যেমন 4 অনুপাতের তুলনা করা) এবং বোনফেরনির মতো সংশোধন না করে পুনরাবৃত্তি পরীক্ষা না করা হয় তবে সামগ্রিক ত্রুটি হার গণনা করতে চাইলে কীভাবে সূত্রটি সামঞ্জস্য করতে হবে? আপনি কি আমাকে সাহায্য করতে পারেন?
Andreas
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.