এক্সেল বনাম আর-তে চি-স্কোয়ার গণনার অদ্ভুত উপায়


9

আমি একটি এক্সেল শীট খুঁজছি যা দাবি করে যে গণনা করা হচ্ছে χ2, তবে আমি এটি করার এই পদ্ধতিটি চিনতে পারি না এবং আমি ভাবছিলাম যে আমি কিছু অনুপস্থিত।

এটি বিশ্লেষণ করছে এমন ডেটা এখানে:

+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
|             2000 |       42 | 32.5     |
|             2000 |       42 | 32.5     |
|             2000 |       25 | 32.5     |
|             2000 |       21 | 32.5     |
+------------------+----------+----------+

এবং চি স্কোয়ার গণনা করার জন্য প্রতিটি গ্রুপের জন্য এটির যোগফলগুলি এখানে রয়েছে:

P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B

সুতরাং প্রতিটি দলের জন্য χ2 হল:

2.822793
2.822793
1.759359
4.136448

এবং মোট চি স্কয়ার হল: 11.54139

যাইহোক, প্রতিটি উদাহরণ আমি গণনা করতে দেখেছি χ2এ থেকে সম্পূর্ণ আলাদা। আমি প্রতিটি গ্রুপের জন্য করব:

chiSq = (Observed-Expected)^2 / Expected

এবং তাই উপরের উদাহরণের জন্য আমি একটি মোট চি স্কোয়ার মান পাব 11.3538

আমার প্রশ্নটি হল - কেন এক্সেল শীটে তারা গণনা করছে χ2এভাবে? এটি কি স্বীকৃত পন্থা?

হালনাগাদ

এটি জানতে চাওয়ার আমার কারণটি হ'ল আমি এই ফলাফলগুলিকে আর ভাষায় প্রতিলিপি দেওয়ার চেষ্টা করছি। আমি chisq.test ফাংশনটি ব্যবহার করছি এবং এটি এক্সেল শিটের মতো একই সংখ্যার সাথে প্রকাশিত হচ্ছে না। সুতরাং কেউ যদি এই পদ্ধতিতে আর-তে কীভাবে কাজ করতে জানেন তবে এটি খুব সহায়ক হবে!

আপডেট 2

কারও আগ্রহী হলে, আমি এখানে এটি কীভাবে গণনা করেছি তা এখানে:

res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)

আপনার দ্বিতীয় আপডেটে পদ্ধতির সঠিক পরিসংখ্যান দেওয়া উচিত। যাইহোক, যদি আপনার প্রত্যাশাগুলি পর্যবেক্ষণের অঙ্কের ভিত্তিতে না হয় তবে আপনার সমস্যা হতে পারে কারণ সেখানে পি-ভ্যালু শর্ত রয়েছে। তবে, আমি লক্ষ্য করেছি যে প্রত্যাশিত এবং পর্যবেক্ষণ করা হয়েছে একই মোট (সম্ভাব্য ঘটনা দ্বারা ঘটতে পারে না) তাই এটি সম্ভবত খুব ভাল। আপনি এটি আরও সহজেই এটি করতে পারেন:x=c(42,42,25,21);chisq.test(cbind(x,2000-x))
Glen_b -Rininstate মনিকা

@ গ্লেেন_বি এক্সেল শিটটিতে আমি বিশ্বাস করি যে মোট জনসংখ্যা * আমি উপরে কাজ করেছি 'পি' মানটি করে প্রত্যাশাগুলি কার্যকর হয়। এই একটি সমস্যা হতে যাচ্ছে? এছাড়াও মোট জনসংখ্যা পরিবর্তিত হয় - বেশিরভাগ সময় এটি 2000 হয় তবে এটি কোনও সংখ্যা হতে পারে। আমি এখানে যে এক্সেল শিটটি পুনরায় তৈরি করতে চাইছি তা পি-ভ্যালুটি বিবেচনায় নেই, সুতরাং যদি পরিসংখ্যানগুলি এর দ্বারা প্রভাবিত না হয় তবে এটি কোনও সমস্যা নয় ...
ব্যবহারকারী 1578653

প্রশ্নটি ফুটে উঠেছে পি এর কোথা থেকে আসে। তারা মোট পর্যবেক্ষিত গণনা দেখে জড়িত?
গ্লেন_বি -রিনস্টেট মনিকা

আমার কাছে এটি পিএএস এর মতো দেখাচ্ছে এবং সুতরাং প্রত্যাশিত মোট পর্যবেক্ষণকৃত গণনা এবং মোট জনসংখ্যা উভয়ের উপর ভিত্তি করে ... তবে এক্সেল শীটে আমাকে যে সমস্ত উদাহরণ দেওয়া হয়েছে তাতে প্রত্যাশিত মানটিও মিলবে বলে মনে হচ্ছে মোট পর্যবেক্ষণ গণনা / গণনা সংখ্যা।
ব্যবহারকারী 1578653

যদি পিগুলি সেইভাবে গণনাগুলির ভিত্তিতে থাকে তবে অবশ্যই প্রত্যাশাগুলি অনুসরণ করে। যদি এটি হয় তবে এটি স্বাধীনতার ডিগ্রিগুলির মতো মনে হয় এবং আপনি আর-তে এটি করেছিলেন ঠিকঠাক - তবে আমার ব্যাখ্যাটির কয়েকটি শব্দ পরিবর্তনের প্রয়োজন হতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


13

এটি বেশ সোজা হতে দেখা যাচ্ছে।

এটি স্পষ্টত দ্বিপদী নমুনা। এটি দেখার দুটি উপায় আছে।

পদ্ধতি 1, স্প্রেডশিটের যেটি, এটি পর্যবেক্ষণের গণনাগুলি চিকিত্সা করার জন্য Xi যেমন Bin(Ni,pi), যা হিসাবে প্রায় অনুমান করা যেতে পারে N(μi=Nipi,σi2=Nipi(1pi))। যেমন,Zi=(Xiμi)/σi প্রায় স্ট্যান্ডার্ড স্বাভাবিক, এবং Zএর স্বাধীন, সুতরাং (প্রায়) iZi2χ2

(পি এর যদি পর্যবেক্ষণের ভিত্তিতে ভিত্তি করে থাকে, তবে Zএগুলি স্বাধীন নয়, তবে এটি এখনও আরও কম মাত্রার স্বাধীনতার সাথে চি-স্কোয়ার)

পদ্ধতি 2: আপনার ব্যবহার (OE)2/Eআকারে চি-বর্গক্ষেত্র এছাড়াও কাজ করে, কিন্তু এটি প্রয়োজন যে আপনি বিষয়শ্রেণীতে অন্তর্ভুক্ত আপনি যাদের লেবেল আছে 'পর্যবেক্ষণ করা হয়েছে' কিন্তু না শুধুমাত্র হিসাব সেই না যে বিষয়শ্রেণীতে অন্তর্ভুক্ত:

+------------+------+-------+
| Population | In A | Not A |
+------------+------+-------+
|       2000 |   42 |  1958 |
|       2000 |   42 |  1958 |
|       2000 |   25 |  1975 |
|       2000 |   21 |  1979 |
+ -----------+------+-------+

যেখানে Eপ্রথম কলামটি যেমন আপনার কাছে রয়েছে তেমনই রয়েছে এবং দ্বিতীয় কলামের জন্য রয়েছে Ni(1pi)

... এবং তারপরে যোগফল (OE)2/E উভয় কলাম উপর।

দুটি রূপ বীজগণিতগতভাবে সমতুল্য। মনে রাখবেন যে 1/p+1/(1p)=1/p(1p)। I বিবেচনা করুনth চি-স্কোয়ারের সারি:

(এক্সআমি-μআমি)2σআমি2=(এক্সআমি-এনআমিপিআমি)2এনআমিপিআমি(1-পিআমি)=(এক্সআমি-এনআমিপিআমি)2এনআমিপিআমি+ +(এক্সআমি-এনআমিপিআমি)2এনআমি(1-পিআমি)=(এক্সআমি-এনআমিপিআমি)2এনআমিপিআমি+ +(এনআমি-এনআমি+ +এনআমিপিআমি-এক্সআমি)2এনআমি(1-পিআমি)=(এক্সআমি-এনআমিপিআমি)2এনআমিপিআমি+ +(এনআমি-এক্সআমি-(এনআমি-এনআমিপিআমি))2এনআমি(1-পিআমি)=(এক্সআমি-এনআমিপিআমি)2এনআমিপিআমি+ +((এনআমি-এক্সআমি)-এনআমি(1-পিআমি))2এনআমি(1-পিআমি)=(হেআমি(একজন)-আমি(একজন))2আমি(একজন)+ +(হেআমি(একজন¯)-আমি(একজন¯))2আমি(একজন¯)

যার অর্থ আপনার রাউন্ডিং ত্রুটি পর্যন্ত উভয়ভাবে একই উত্তর পাওয়া উচিত।

দেখা যাক:

             Observed             Expected                 (O-E)^2/E          
  Ni        A     not A          A      not A             A           not A      
 2000     42         1958      32.5     1967.5       2.776923077     0.045870394     
 2000     42         1958      32.5     1967.5       2.776923077     0.045870394     
 2000     25         1975      32.5     1967.5       1.730769231     0.028589581     
 2000     21         1979      32.5     1967.5       4.069230769     0.067217281     

                                            Sum     11.35384615      0.187547649  

চি-স্কোয়ার = 11.353846 + 0.187548 = 11.54139

যা তাদের উত্তরের সাথে মেলে।


1
আপনার সাহায্যের জন্য ধন্যবাদ! আমি কোনও গণিতবিদ / পরিসংখ্যানবিদ নই তাই এটি প্রাথমিকভাবে আমাকে বিভ্রান্ত করেছে, তবে আপনার ব্যাখ্যাটি বোঝা খুব সহজ।
ব্যবহারকারী 1578653
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.