3 টি নমুনা সহ অনুপাতের সমতার জন্য হাইপোথিসিস পরীক্ষা করা


9

আমার কাছে টলোকলম সহ সেল ফোন গ্রাহকের তথ্য উপাত্তের একটি ডেটা সেট রয়েছে। প্রথম কলামটিতে একটি নির্দিষ্ট বিভাগ রয়েছে যা কোনও অ্যাকাউন্টে পড়ে (এ, বি বা সি হয়) এবং দ্বিতীয় কলামে রয়েছে সেই অ্যাকাউন্টটি বাতিল হয়েছে কিনা তার দ্বিপদী মূল্যবান। যেমন

A | cancelled
C | active
B | active
A | cancelled

আমি যা করতে চাই তা পরীক্ষা করার জন্য এক ধরণের হাইপোথিসিস টেস্ট নিয়ে এসেছি যা বাতিল করা অ্যাকাউন্ট বনাম সক্রিয় অ্যাকাউন্টগুলির জন্য এ, বি এবং সি টাইপের অ্যাকাউন্টের অনুপাত আলাদা কিনা - নাল হাইপোথিসিসটি সেগুলি একই। সুতরাং এটি অনুপাতের জন্য অনুমানের পরীক্ষার মতো আমি বাদে 3 টি মানের জন্য এটি কীভাবে করব তা জানি না


6
আপনি তিনটি দলের মধ্যে অনুপাতের সমতার জন্য পরীক্ষা করতে একটি পরীক্ষা ব্যবহার করতে পারেন । χ2

আমি এও ভাবছি যে আমি এ বনাম বি, বি বনাম সি, এবং এ বনাম সি, তিনটি অনুমান পরীক্ষা করতে পারছি সেগুলি দেখতে আলাদা কিনা তা
ইউজার 1893354

5
আপনি করতে পারেন, তবে সচেতন হন যে আপনাকে একাধিক তুলনার সমস্যার জন্য তখন সংশোধন করতে হবে।

আপনার উত্তর করার জন্য আপনাকে ধন্যবাদ। আমি শুধু কৌতূহল করছি আপনি একাধিক তুলনা সমস্যা বলতে কি বোঝায়? বা আরও সুনির্দিষ্টভাবে, কেন তিনটি হাইপোথিসিস পরীক্ষার পদ্ধতিটি অসুবিধে। ধন্যবাদ!
ব্যবহারকারী 1893354

3
তিনটি হাইপোথিসিস টেস্ট ব্যবহার করে দুটি সমস্যা রয়েছে। প্রথমত, তারা পরস্পরের উপর নির্ভরশীল কারণ প্রতিটি জুটি কিছু ডেটা পুনরায় ব্যবহার করে। দ্বিতীয়ত, যদি তারা প্রকৃতপক্ষে স্বাধীন হয়, তবে নাল সত্য হওয়া সত্ত্বেও তাদের মধ্যে কমপক্ষে একটির সম্ভাব্যতা তাত্পর্যপূর্ণ হওয়ার সম্ভাবনা ছিল - অর্থাৎ, মিথ্যা ধনাত্মক ত্রুটির সম্ভাবনা - কাঙ্ক্ষিত মিথ্যা থেকে প্রায় তিনগুণ বেশি হবে ধনাত্মক হার দ্বিতীয় সমস্যাটি পরীক্ষাটি সামঞ্জস্য করা দরকার নির্দেশ করে তবে প্রথমটিটি দেখায় যে উপযুক্ত সমন্বয় সন্ধান করা সমস্যাযুক্ত হতে পারে। পদ্ধতির এই সমস্যার এড়াতে। χ2
হোবার

উত্তর:


13

আমি আমার উত্তরটি সাধারণভাবে ভিত্তি করতে যাচ্ছি এবং আপনার সমস্যা কীভাবে পরীক্ষার কাঠামোর সাথে ফিট করে comments সাধারণভাবে, আমরা একটি পরীক্ষা ব্যবহার করে অনুপাতের সমতার জন্য পরীক্ষা করতে পারি যেখানে আদর্শ নাল অনুমান, , নিম্নলিখিত:χ2H0

H0:p1=p2=...=pk

অর্থাত্ সমস্ত অনুপাত একে অপরের সমান। এখন আপনার ক্ষেত্রে আপনি নিম্নলিখিত অনুমানটি বাতিল করবেন:

H0:p1=p2=p3
এবং বিকল্প অনুমানটি
HA: at leat one pi is different for i=1,2,3

এখন পরীক্ষা চালানোর জন্য আমাদের নিম্নলিখিত পরীক্ষার পরিসংখ্যান গণনা করতে হবে: পরীক্ষার-পরিসংখ্যানের মান হ'লχ2

χ2=i=1n(OiEi)2Ei

কোথায়

  • χ2 = পিয়ারসনের সম্মিলিত পরীক্ষার পরিসংখ্যান, যা সংক্ষিপ্তভাবে একটি বিতরণে পৌঁছায়χ2
  • Oi = পর্যবেক্ষণের ফ্রিকোয়েন্সি
  • Ei = একটি প্রত্যাশিত (তাত্ত্বিক) ফ্রিকোয়েন্সি, নাল অনুমান দ্বারা জোর দেওয়া
  • n = টেবিলের কক্ষের সংখ্যা

আপনার ক্ষেত্রে যেহেতু আমরা এই সমস্যাটিকে নিম্নলিখিত সারণী হিসাবে ভাবতে পারি: n=6এখানে চিত্র বর্ণনা লিখুন

এখন একবার আমাদের পরীক্ষার পরিসংখ্যান থাকলে আমাদের অনুমানের পরীক্ষাটি কীভাবে শেষ করতে হয় তার দুটি বিকল্প রয়েছে two

বিকল্প 1) আমরা আমাদের পরীক্ষার স্থিতিশীল নাল অনুমানের অধীনে উপযুক্ত সমালোচনামূলক মানের সাথে তুলনা করতে পারি । এর অর্থ , যদি সত্য হয়, তবে সারি এবং কলামগুলির সাথে একটি একটি পরিসংখ্যানের ডিগ্রি সহ একটি বিতরণ হওয়া উচিত স্বাধীনতা। আমাদের সমালোচনামূলক মান গণনার পরে যদি আমাদের কাছে সেই তবে আমরা নাল অনুমানটি বাতিল করব। স্পষ্টতই যদি তবে আমরা নাল অনুমানটিকে প্রত্যাখ্যান করতে ব্যর্থ। χ2H0χ2RCχ2(R1)×(C1)χχ2>χχ2χ

গ্রাফিকালি (সমস্ত সংখ্যা তৈরি করা হয়) এটি নিম্নলিখিত: এখানে চিত্র বর্ণনা লিখুন

গ্রাফ থেকে, যদি আমাদের পরীক্ষার পরিসংখ্যান নীল পরীক্ষার পরিসংখ্যানের সাথে মিলে যায় তবে আমরা নাল অনুমানটিকে প্রত্যাখ্যান করতে ব্যর্থ হব কারণ এই পরীক্ষার পরিসংখ্যানগুলি সমালোচনামূলক অঞ্চলের মধ্যে পড়ে না (যেমন, )। বিকল্পভাবে, সবুজ পরীক্ষার পরিসংখ্যানগুলি সমালোচনামূলক অঞ্চলের মধ্যে পড়ে এবং তাই আমরা সবুজ পরীক্ষার পরিসংখ্যান গণনা করে নাল অনুমানটিকে প্রত্যাখ্যান করব।χ2χ2<χ

আপনার উদাহরণে, আপনার স্বাধীনতার ডিগ্রি

df=(R1)×(C1)=(21)×(31)=1×2=2

বিকল্প 2) আমরা নাল অনুমানের অধীনে পরীক্ষার পরিসংখ্যানের সাথে সম্পর্কিত পি-মানটি গণনা করতে পারি এবং যদি এই পি-মানটি কিছু নির্দিষ্ট লেভেলের চেয়ে কম হয় তবে আমরা নাল অনুমানটি বাতিল করতে পারি। যদি পি-মানটি লেভেলের চেয়ে বেশি হয় তবে আমরা নাল অনুমানটিকে প্রত্যাখ্যান করতে ব্যর্থ। নোট করুন যে পি-মানটি হ'ল সম্ভাবনা যা বিতরণ পরীক্ষার পরিসংখ্যানের চেয়ে বেশি।ααχ(R1)×(C1)2

গ্রাফিকালি আমাদের তা আছে এখানে চিত্র বর্ণনা লিখুন

যেখানে পি-মানটি সেই ক্ষেত্র হিসাবে গণনা করা হয় যা আমাদের পরীক্ষার পরিসংখ্যানের তুলনায় বৃহত্তর (উদাহরণে নীল শেডযুক্ত অঞ্চল)।

সুতরাং, যদি তবে নাল অনুমানটি প্রত্যাখ্যান করতে ব্যর্থ হন , অন্যথায়,α>p-valueH0

যদি নাল অনুমানটি প্রত্যাখ্যান করেαp-valueH0

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.