জনসংখ্যার চেয়ে উল্লেখযোগ্যভাবে আরও বেশি হওয়ার মানের পরিসংখ্যানগত পরীক্ষাটির অর্থ: এটি কি জেড-পরীক্ষা বা টি-পরীক্ষা?


12

মানগুলির তালিকার তুলনায় একটি মান কতটা গুরুত্বপূর্ণ? বেশিরভাগ ক্ষেত্রে পরিসংখ্যানগত পরীক্ষার মধ্যে একটি জনসংখ্যার সাথে একটি নমুনা সেটকে তুলনা করা জড়িত। আমার ক্ষেত্রে নমুনাটি একটি মান দ্বারা তৈরি করা হয় এবং আমরা এটি জনসংখ্যার সাথে তুলনা করি।

আমি সম্ভবত সবচেয়ে মৌলিক সমস্যার মুখোমুখি পরিসংখ্যান অনুমান পরীক্ষার একটি দ্বিধাদ্বন্ধী। এটি কেবল একটি পরীক্ষা নয়, শত শত পরীক্ষাও রয়েছে। আমার একটি প্যারামিটার স্পেস রয়েছে এবং প্রতিটি পয়েন্টের জন্য অবশ্যই একটি তাত্পর্য পরীক্ষা করা উচিত। প্রতিটি প্যারামিটার সংমিশ্রণের জন্য উভয় মান এবং পটভূমি তালিকা তৈরি করা হয়। তারপরে আমি পি-ভ্যালু দিয়ে এটি অর্ডার করছি এবং আকর্ষণীয় প্যারামিটার সংমিশ্রণগুলি খুঁজে পাচ্ছি। আসলে, যেখানে এই পি-ভ্যাল বেশি (পরামিতি) প্যারামিটার সংমিশ্রণের সন্ধানও গুরুত্বপূর্ণ।

সুতরাং আসুন একটি একক পরীক্ষা নেওয়া যাক: আমার কাছে একটি নির্বাচিত সেট থেকে উত্পন্ন একটি গণিত মান এবং এলোমেলো প্রশিক্ষণের সেটটি বেছে নিয়ে মানগুলির একটি ব্যাকগ্রাউন্ড সেট তৈরি করা হয়। গণিত মান 0.35 এবং ব্যাকগ্রাউন্ড সেটটি সাধারণত (সম্ভবত?) 0.25 এর গড় এবং খুব সরু স্টাড (ই -7) দিয়ে বিতরণ করা হয়। বিতরণ সম্পর্কে আমার আসলে জ্ঞান নেই, কারণ নমুনাগুলি অন্য কোনও কিছু থেকে গণনা করা হয়, কিছু বিতরণ থেকে এগুলি এলোমেলো সংখ্যার নমুনা নয়, সুতরাং ব্যাকগ্রাউন্ড এটির জন্য সঠিক শব্দ।

নাল হাইপোথিসিসটি হ'ল "নমুনা পরীক্ষার গড়টি আমার গণিত মানের সাথে 0.35 এর সমান"। আমি কখন এটিকে জেড-টেস্ট বা টি-টেস্ট হিসাবে বিবেচনা করব? আমি মানটি জনসংখ্যার গড়ের তুলনায় উল্লেখযোগ্যভাবে বেশি হওয়া চাই, সুতরাং এটি একক লেজযুক্ত পরীক্ষা।

নমুনা হিসাবে কী বিবেচনা করা উচিত সে সম্পর্কে আমি কিছুটা বিভ্রান্ত হয়ে পড়েছি: আমার কাছে হয় একটির নমুনা (পর্যবেক্ষণ) এবং জনসংখ্যা হিসাবে পটভূমি তালিকা বা আমার নমুনা ব্যাকগ্রাউন্ডের তালিকা এবং আমি এটি সম্পূর্ণরূপে (তুলনামূলক) তুলনা করছি নাল অনুমান অনুসারে জনসংখ্যার একই অর্থ হওয়া উচিত। একবার এটি সিদ্ধান্ত নেওয়া হয়ে গেলে, পরীক্ষাটি অনুমান করে বিভিন্ন দিকে চলে যায়।

যদি এটি কোনও টি-পরীক্ষা হয় তবে আমি এর পি-মানটি কীভাবে গণনা করব? আমি আর / পাইথন / এক্সেল ফাংশন ব্যবহার করার চেয়ে এটি নিজেই গণনা করতে চাই (এটি ইতিমধ্যে কীভাবে করতে হয় তা আমি জানি) অতএব আমাকে অবশ্যই প্রথমে সঠিক সূত্র স্থাপন করতে হবে।

T=Z/s,
Z=X¯σn
s=σ^/σ
  1. আমি কীভাবে একটি পি-মান গণনা করব? (যেমন কোনও আর / পাইথন / এক্সেল ফাংশন বা পি-ভ্যালু টেবিল বর্ণন ব্যবহার না করে তবে এটি সূত্রের ভিত্তিতে প্রকৃতভাবে গণনা করুন, কারণ আমি কী করতে চাই তা জানতে চাই)
  2. আমি কীভাবে আমার নমুনার আকারের উপর ভিত্তি করে কোনও তাত্পর্যটি স্থির করব? (একটি সূত্র সুন্দর হবে)

3
1060.35=106×107+0.250.35

1
@ গ্রোক্কাাইন - এই প্রশ্নটি আকর্ষণীয় বিষয় উত্থাপন করে এবং মূল্যবান বলে মনে হয় তবে আপনি যদি আপনার শর্তাবলীর সাথে খুব সুনির্দিষ্ট হওয়ার জন্য যত্ন নিয়ে কিছুটা সম্পাদনা করেন তবে আমি এটিকে আরও মূল্যবান বলে মনে করি।
Rolando2

এটি কেবল একটি পরীক্ষা নয়, শত শত পরীক্ষাও রয়েছে। আমার একটি প্যারামিটার স্পেস রয়েছে এবং প্রতিটি পয়েন্টের জন্য অবশ্যই একটি তাত্পর্য পরীক্ষা করা উচিত। প্রতিটি প্যারামিটার সংমিশ্রণের জন্য উভয় মান এবং পটভূমি তালিকা তৈরি করা হয়। তারপরে আমি পি-ভ্যালু দিয়ে এটি অর্ডার করছি এবং আকর্ষণীয় প্যারামিটার সংমিশ্রণগুলি খুঁজে পাচ্ছি। আসলে, যেখানে এই পি-ভ্যাল বেশি (পরামিতি) প্যারামিটার সংমিশ্রণের সন্ধানও গুরুত্বপূর্ণ। আমি আমার পোস্টটি একটু পরে সম্পাদনা করার চেষ্টা করব।
গ্রুক্কাইন

উত্তর:


10

আপনি একটি আকর্ষণীয় প্রশ্ন উত্থাপন। প্রথমত, আপনার যদি 0.35 এর গড় পর্যালোচনা থাকে তবে 0.25 এর গড় গড় মান হয় এবং 1/10 ^ 7 এর একটি স্ট্যান্ডার্ড বিচ্যুতি হয় (এটি আমি আপনার ই ^ -7 বিটকে কীভাবে ব্যাখ্যা করি) আপনার কোনও অনুমানের মধ্যে যাওয়ার দরকার নেই really পরীক্ষা অনুশীলন। আপনার 0.35 পর্যবেক্ষণ 0.25 এর গড় গড়ের তুলনায় একেবারেই পৃথক যে এটি কয়েক হাজার স্ট্যান্ডার্ড বিচ্যুতি থেকে দূরে থাকবে এবং সম্ভবত এটি গড় থেকে কয়েক মিলিয়ন স্ট্যান্ডার্ড ত্রুটি হবে।

জেড-টেস্ট এবং টি-টেস্টের মধ্যে পার্থক্যটি মূলত নমুনার আকারকে বোঝায়। 120 এর চেয়ে কম নমুনাগুলি সহ, পি মানগুলি গণনা করার জন্য আপনার টি-টেস্ট ব্যবহার করা উচিত। যখন নমুনার আকারগুলি এর চেয়ে বেশি হয় তবে আপনি যে কোনওটি ব্যবহার করেন তা যদি খুব বেশি পার্থক্য করে না। নমুনার আকার নির্বিশেষে উভয় উপায়ে এটি গণনা করা মজাদার এবং দুটি পরীক্ষার মধ্যে কতটা পার্থক্য রয়েছে তা পর্যবেক্ষণ করুন।

যতদূর নিজেকে জিনিস গণনা করা যায়, আপনি আপনার পর্যবেক্ষণ এবং গড়ের মধ্যে পার্থক্যকে ভাগ করে t স্ট্যাটাকে গণনা করতে পারেন এবং মান ত্রুটির দ্বারা ভাগ করতে পারেন। স্ট্যান্ডার্ড ত্রুটি হ'ল নমুনা আকারের বর্গমূল দিয়ে বিভক্ত স্ট্যান্ডার্ড বিচ্যুতি। এখন, আপনার আপনার স্ট্যাটাস আছে। এপি মান গণনা করার জন্য আমি মনে করি পরীক্ষার টেবিলে আপনার টি মানটি অনুসন্ধান করা ছাড়া কোনও বিকল্প নেই। আপনি যদি কোনও সাধারণ এক্সেল বিকল্প TDIST (টি স্ট্যাট মান, ডিএফ, 1 বা 2 1 বা 2 টেল পি মানের জন্য 1) গ্রহণ করেন তবে কৌতুক করে। জেড ব্যবহার করে এপি মান গণনা করতে, 1 টি পুচ্ছ পরীক্ষার জন্য এক্সেল সূত্রটি হ'ল: (1 - NORMSDIST (জেড মান) Z

ঠিক যেমন একটি সতর্কতামূলক হিসাবে, অনুমান পরীক্ষার সেই পদ্ধতিগুলি নমুনার আকার দ্বারা বিকৃত হতে পারে। অন্য কথায়, আপনার নমুনার আকারটি যত বড় আপনার মান ত্রুটি তত বেশি, আপনার ফলাফলের জেড মান বা টি স্ট্যাটাস তত বেশি, পি মানটি কম এবং আপনার পরিসংখ্যানের তাত্পর্য তত বেশি। এই যুক্তিটিতে একটি শর্ট কাট হিসাবে, বড় আকারের নমুনা আকারগুলি উচ্চ পরিসংখ্যানগত তাত্পর্য তৈরি করবে। তবে, বৃহত নমুনা আকারের সাথে সমন্বিত উচ্চ পরিসংখ্যানগত তাত্পর্য সম্পূর্ণ অনিবার্য হতে পারে। অন্য কথায়, পরিসংখ্যানগতভাবে তাৎপর্য একটি গাণিতিক বাক্য। এটি অগত্যা তাৎপর্যপূর্ণ অর্থ দেয় না (প্রতি ওয়েবস্টার অভিধানে)।

এই বৃহত নমুনা আকারের জাল থেকে দূরে সরে যাওয়ার জন্য পরিসংখ্যানবিদরা কার্যকর আকারের পদ্ধতিতে চলে গিয়েছেন। দ্বিতীয়টি পর্যবেক্ষণের মধ্যে স্ট্যান্ডার্ড ত্রুটির পরিবর্তে স্ট্যান্ডার্ড বিচ্যুতিগুলির মধ্যে পরিসংখ্যানগত দূরত্বের একক হিসাবে পরবর্তী ব্যবহার। যেমন একটি কাঠামোর সাথে নমুনা আকার আপনার পরিসংখ্যানগত তাত্পর্য উপর কোন প্রভাব ফেলবে না। ইফেক্ট সাইজ ব্যবহার করা আপনাকে পি মানগুলি থেকে এবং কনফিডেন্স ইন্টারভালগুলির দিকেও সরিয়ে নিয়ে যায় যা সাধারণ ইংরেজীতে আরও অর্থবহ হতে পারে।


উত্তরের জন্য ধন্যবাদ, আমি নমুনা হিসাবে কী বিবেচনা করব সে সম্পর্কে আমি কিছুটা বিভ্রান্ত: আমার একটির নমুনা (পর্যবেক্ষণ) এবং জনসংখ্যা হিসাবে পটভূমি তালিকা রয়েছে বা আমার নমুনাটি পটভূমির তালিকা এবং আমি তার সাথে তুলনা করছি নাল হাইপোথিসিস অনুসারে সম্পূর্ণ (নিরস্ত্র) জনসংখ্যার একই অর্থ হওয়া উচিত। একবার এটি সিদ্ধান্ত নেওয়া হয়ে গেলে, পরীক্ষাটি অনুমান করে বিভিন্ন দিকে চলে যায়।
গ্রুককাইন

নমুনা হিসাবে আপনার সমস্ত পর্যবেক্ষণগুলি ব্যবহার করুন (আপনি যা কিছু বলুন)। এবং, আপনার এক পর্যবেক্ষণ এবং সংজ্ঞায়িত নমুনার গড়ের মধ্যে পরিসংখ্যানের দূরত্ব গণনা করুন। আপনার নমুনার মানক বিচ্যুতি এবং স্ট্যান্ডার্ড ত্রুটি গণনা করুন। এবং, আপনার পর্যবেক্ষণের গড় থেকে পরিসংখ্যানের দূরত্বটি হ'ল: (পর্যবেক্ষণ - গড়) / স্ট্যান্ডার্ড ত্রুটি = টি স্ট্যাটাস। এক্সেল টিডিআইএসটি ফাংশন (ডিএফ, টি স্ট্যাট, 1 (একটি লেজের জন্য)) ব্যবহার করুন এবং আপনি আপনার পি মান পাবেন।
সিম্পা

5

হাইপোথিসিস পরীক্ষা সর্বদা জনসংখ্যাকে বোঝায়। আপনি যদি নমুনা সম্পর্কে কোনও বিবৃতি দিতে চান তবে আপনাকে পরীক্ষা করার দরকার নেই (কেবল যা দেখছেন তা তুলনা করুন)। ঘন ঘন বিশেষজ্ঞরা অ্যাসিম্পটিকগুলিতে বিশ্বাস করেন, তাই যতক্ষণ না আপনার নমুনার আকার বড় হয়, আপনার ডেটা বিতরণের বিষয়ে চিন্তা করবেন না। জেড-টেস্ট এবং টি-পরীক্ষা মূলত পরীক্ষার পরিসংখ্যান গণনা করার ক্ষেত্রে একই রকম হয়, কেবল সমালোচনামূলক মানগুলি বিভিন্ন বিতরণ (সাধারণ বনাম ছাত্র-টি) থেকে প্রাপ্ত হয়। যদি আপনার নমুনার আকার বড় হয় তবে পার্থক্যটি প্রান্তিক।

প্রশ্নোত্তর সম্পর্কিত 1: টি-ডিস্ট্রিবিউশনটি কেবল এন -1 ডিগ্রি স্বাধীনতার সাথে সন্ধান করুন, যেখানে নমুনা আকার n

প্রশ্নোত্তর সম্পর্কে: আপনি জেড-পরীক্ষার জন্য আপনার পছন্দসই তাত্পর্য স্তরের উপর ভিত্তি করে টি-টেস্টের ক্ষেত্রে নমুনা আকারের তাত্পর্যপূর্ণ স্তরের উপর ভিত্তি করে প্রান্তিকটি গণনা করুন।

তবে গুরুত্ব সহকারে আপনার কিছু বুনিয়াদি পর্যালোচনা করা উচিত।


উত্তর করার জন্য ধন্যবাদ. এটি আসলে যে টি-ডিস্ট আমি ব্যবহার করছিলাম তা ছিল তবে আমি এটি "কেন" ব্যবহার করব তাও বুঝতে চেয়েছিলাম। আপনি কীভাবে একটি "বৃহত" নমুনাকে সংজ্ঞায়িত করেন এবং পি-মানটি কীভাবে আলাদা। আরও গুরুত্বপূর্ণ বিষয়, আমরা কীভাবে জানব যখন কোনও বিতরণ স্বাভাবিক হয় বা শিক্ষার্থী-টি? এটির জন্য কোনও পরিসংখ্যান পরীক্ষা আছে? সম্ভবত কোলমোগোরভ-স্মারনভ পরীক্ষা দ্বিতীয় এবং এইচএম এর জন্য ব্যবহার করুন .. প্রথমটির জন্য কী ব্যবহার করবেন?
গ্রুকাইনে

2
বৃহত্তর ... ভাল জেড এবং টি রূপান্তর এন = 60 দিয়ে শুরু হবে। আপনি উভয় পরীক্ষা থেকে প্রাপ্ত পি-মানগুলি কেবল তুলনা করুন। টি / সাধারণ বিতরণ অনুমান অন্তর্নিহিত ডেটা বিতরণের উপর নির্ভর করে না। এটি অনুমানের উপর ভিত্তি করে তৈরি করা হয়েছে যে গড়ের নমুনা বিতরণটি স্বাভাবিক। এমনকি আপনি যে ভেরিয়েবলটি পরীক্ষা করছেন তা গামা বিতরণ করা হয়েছে, যা এখনও রয়েছে। এন = 200 এর সাথে এটি ঠিকঠাক কাজ করা উচিত। আবার এই সমস্ত জিনিস ঘন ঘনবাদী পরিসংখ্যানের উপর ভিত্তি করে।
যৌথ_পি

হাইপোথিসিস টেস্টিং সম্পর্কে মন্তব্যটির জন্য +1 সর্বদা জনসংখ্যার প্রতি উল্লেখ করে তবে -1 প্রশ্নটি 1 এর নমুনা রয়েছে এমন বিন্দুটি মিস করতে পারে বলে মনে করেন
পিটার এলিস

1
আমি সত্যিই নিশ্চিত ছিলাম না যে "আমার কাছে একটি গণিত মান এবং এলোমেলোভাবে উত্পন্ন মানগুলির একটি ব্যাকগ্রাউন্ড সেট রয়েছে The গণিত মান 0.35" এর অর্থ হবার কথা ছিল ... আমি মনে করেছি এটি একরকম বোঝায় যে সেখানে 1 টিরও বেশি পর্যবেক্ষণ রয়েছে।
যৌথ_পি

অন্যান্য অনুচ্ছেদ থেকে আমার মন্তব্যগুলি পুনরায় পোস্ট করা: নমুনা হিসাবে কী বিবেচনা করা উচিত তা সম্পর্কে আমি কিছুটা বিভ্রান্ত: আমার একটির নমুনা (পর্যবেক্ষণ) এবং জনসংখ্যা হিসাবে পটভূমি তালিকা বা আমার নমুনাটি পটভূমি তালিকা এবং আমি এটিকে সম্পূর্ণ (নিদর্শনহীন) জনসংখ্যার সাথে তুলনা করছি যা নাল অনুমান অনুসারে একই অর্থ হওয়া উচিত। একবার এটি সিদ্ধান্ত নেওয়া হয়ে গেলে, পরীক্ষাটি অনুমান করে বিভিন্ন দিকে চলে যায়।
গ্রুককাইন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.