এই সমস্যাটি সর্বদা তার কুশল মাথাটিকে পিছনে ফেলেছে বলে মনে হচ্ছে এবং আমি আমার নিজস্ব পরিসংখ্যান (এবং বিবেকহীনতা) বোঝার জন্য এটিকে ছাড়িয়ে দেওয়ার চেষ্টা করছি।
সাধারণ রৈখিক মডেলগুলির অনুমানগুলি (টি-টেস্ট, আনোভা, রিগ্রেশন ইত্যাদি) এর মধ্যে "স্বাভাবিকতার অনুমান" অন্তর্ভুক্ত থাকে তবে আমি খুঁজে পেয়েছি যে এটি খুব কমই পরিষ্কারভাবে বর্ণনা করা হয়েছে।
আমি প্রায়শই পরিসংখ্যান পাঠ্যপুস্তক / ম্যানুয়াল / ইত্যাদি জুড়ে এসেছি যে কেবল উল্লেখ করে যে "স্বাভাবিকতার অনুমান" প্রতিটি গ্রুপের জন্য প্রযোজ্য (যেমন শ্রেণীবদ্ধ এক্স ভেরিয়েবল), এবং আমাদের প্রতিটি গ্রুপের জন্য স্বাভাবিকতা থেকে প্রস্থান পরীক্ষা করা উচিত ।
প্রশ্নসমূহ :
অনুমানটি Y এর মান বা Y এর অবশিষ্টাংশগুলিকে বোঝায় ?
একটি নির্দিষ্ট গোষ্ঠীর জন্য , ওয়াইয়ের অবশিষ্টাংশের আনুমানিক (বা কমপক্ষে আরও সাধারণ) বন্টন করে তবে ওয়াইয়ের মানগুলির (যেমন, স্কিউড) দৃ strongly়ভাবে অ-স্বাভাবিক বিতরণ করা সম্ভব ?
অন্যান্য উত্স বর্ণনা করে যে অনুমানটি মডেলটির অবশিষ্টাংশের সাথে সম্পর্কিত (যেমন গ্রুপ রয়েছে যেমন, টি-টেস্ট / এনোভা), এবং আমাদের এই অবশিষ্টাংশগুলির স্বাভাবিকতার প্রস্থান পরীক্ষা করা উচিত (যেমন, কেবলমাত্র একটি কিউকিউ প্লট / পরীক্ষার জন্য চালানো)।
জন্য অবশিষ্টাংশ সেই স্বাভাবিকত্বের কারণটি কী মডেল জন্য অবশিষ্টাংশ সেই স্বাভাবিকত্বের কারণটি পরোক্ষভাবে গ্রুপ ? অন্য কথায়, আমরা কি কেবলমাত্র মডেলের অবশিষ্টাংশগুলি পরীক্ষা করব (বহু পাঠের নির্দেশের বিপরীতে)?
এটি একটি প্রসঙ্গে রাখার জন্য, এই অনুমানের উদাহরণটি বিবেচনা করুন:
- আমি দুটি জনসংখ্যার (এক্স) এর মধ্যে গাছের উচ্চতা (Y) তুলনা করতে চাই।
- একটি জনসংখ্যায় Y এর বন্টন দৃ strongly়ভাবে ডান-স্কিউড (যেমন, বেশিরভাগ গাছ সংক্ষিপ্ত, খুব কম লম্বা), অন্যটি কার্যত স্বাভাবিক
- সাধারণত বিতরণ করা জনগোষ্ঠীতে উচ্চতা সামগ্রিকভাবে উচ্চতর হয় (প্রস্তাবিত সেখানে একটি 'আসল' পার্থক্য থাকতে পারে)।
- তথ্যের রূপান্তর প্রথম জনসংখ্যার বিতরণকে যথেষ্ট পরিমাণে উন্নতি করে না।
প্রথমত, মূলত বিভিন্ন উচ্চতার বিতরণ দেওয়া দলগুলির তুলনা করা বৈধ?
আমি কীভাবে এখানে "স্বাভাবিকতা অনুমানের" কাছে যেতে পারি? এক জনগোষ্ঠীর পুনরুদ্ধার উচ্চতা সাধারণত বিতরণ করা হয় না। আমি পরীক্ষা করে না অবশিষ্টাংশ উভয়ের জন্য জনগোষ্ঠী আলাদাভাবে বা অবশিষ্টাংশ জন্য মডেল (t-test এর)?
অনুগ্রহ করে উত্তরগুলিতে সংখ্যায় প্রশ্নগুলি দেখুন, অভিজ্ঞতা আমাকে দেখিয়েছে লোকেরা সহজেই হারিয়ে যায় বা বিযুক্ত হয়ে যায় (বিশেষত আমার!)। মনে রাখবেন আমি কোনও পরিসংখ্যানবিদ নই; যদিও আমার কাছে পরিসংখ্যানের যুক্তিসঙ্গত ধারণা আছে (যেমন প্রযুক্তিগত নয়) not
পিএস, আমি সংরক্ষণাগারগুলি সন্ধান করেছি এবং নিম্নলিখিত থ্রেডগুলি পড়েছি যা আমার বোঝার ত্রুটি করে নি:
- আনোভা অনুমানের স্বাভাবিকতা / অবশিষ্টাংশের সাধারণ বিতরণ
- নমুনা তথ্য বনাম অবশিষ্টাংশের স্বাভাবিকতা; টি-টেস্টের কী হবে?
- স্বাভাবিকতা পরীক্ষা করা কি 'প্রয়োজনীয়ভাবে অকেজো'?
- স্বাভাবিকতা পরীক্ষা করা হচ্ছে
- বিতরণের স্বাভাবিকতা মূল্যায়ন করা
- অবশিষ্টগুলি সাধারণত বিতরণ করা হয় তা নিশ্চিত করতে আমি কোন পরীক্ষা ব্যবহার করব?
- প্যারামেট্রিক টেস্টের অবশিষ্টাংশগুলির জন্য কোলমোগোরভ-স্মারনভ পরীক্ষাটি তাত্পর্যপূর্ণ তবে স্কিউনেস এবং কুর্তোসিসটি স্বাভাবিক দেখায় তখন কী করবেন?