আমি একটি এক্সেল শীট খুঁজছি যা দাবি করে যে গণনা করা হচ্ছে , তবে আমি এটি করার এই পদ্ধতিটি চিনতে পারি না এবং আমি ভাবছিলাম যে আমি কিছু অনুপস্থিত।
এটি বিশ্লেষণ করছে এমন ডেটা এখানে:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
এবং চি স্কোয়ার গণনা করার জন্য প্রতিটি গ্রুপের জন্য এটির যোগফলগুলি এখানে রয়েছে:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
সুতরাং প্রতিটি দলের জন্য হল:
2.822793
2.822793
1.759359
4.136448
এবং মোট চি স্কয়ার হল: 11.54139
।
যাইহোক, প্রতিটি উদাহরণ আমি গণনা করতে দেখেছি এ থেকে সম্পূর্ণ আলাদা। আমি প্রতিটি গ্রুপের জন্য করব:
chiSq = (Observed-Expected)^2 / Expected
এবং তাই উপরের উদাহরণের জন্য আমি একটি মোট চি স্কোয়ার মান পাব 11.3538
।
আমার প্রশ্নটি হল - কেন এক্সেল শীটে তারা গণনা করছে এভাবে? এটি কি স্বীকৃত পন্থা?
হালনাগাদ
এটি জানতে চাওয়ার আমার কারণটি হ'ল আমি এই ফলাফলগুলিকে আর ভাষায় প্রতিলিপি দেওয়ার চেষ্টা করছি। আমি chisq.test ফাংশনটি ব্যবহার করছি এবং এটি এক্সেল শিটের মতো একই সংখ্যার সাথে প্রকাশিত হচ্ছে না। সুতরাং কেউ যদি এই পদ্ধতিতে আর-তে কীভাবে কাজ করতে জানেন তবে এটি খুব সহায়ক হবে!
আপডেট 2
কারও আগ্রহী হলে, আমি এখানে এটি কীভাবে গণনা করেছি তা এখানে:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))