পরিসংখ্যান পরীক্ষা যা পরিমাপের অনিশ্চয়তা অন্তর্ভুক্ত করে


11

ধরুন আমাকে ভর পরিমাপের দুটি গ্রুপ দেওয়া হয়েছে (মিলিগ্রামে), যাকে y1 এবং y2 হিসাবে উল্লেখ করা হয়েছে। দুটি মাধ্যম বিভিন্ন উপায়ে জনসংখ্যা থেকে আঁকা কিনা তা নির্ধারণ করতে আমি একটি পরীক্ষা করতে চাই। উদাহরণস্বরূপ (আরে) এর মতো কিছু:

y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6)
y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9)
t.test(y1,y2)

আমি 0.3234 এর একটি পি-ভ্যালু পেয়েছি এবং 0.05 এর একটি তাত্পর্যপূর্ণ স্তরে এমন দুটি নকল অনুমানকে প্রত্যাখ্যান করবেন না যে দুটি গ্রুপ একই উপায়ে জনসংখ্যা থেকে আঁকছে। এখন প্রতিটি পরিমাপের জন্য আমাকে অনিশ্চয়তা দেওয়া হয়েছে:

u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2)
u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3)

যেখানে u1 [1] হ'ল পরিমাপের সম্মিলিত মান অনিশ্চয়তা y1 [1] (এবং আরও)। আমি কীভাবে এই অনিশ্চয়তা পরিসংখ্যান পরীক্ষায় অন্তর্ভুক্ত করব?


এই যুক্ত করা পরিমাপ বা না? (আমি অনুমান করি না) অনিশ্চয়তাগুলি ওজনযুক্ত ওজন ব্যবহার করা যেতে পারে যা আপনার অনুক্রমের উন্নতি করতে পারে, তবে অনিশ্চয়তার মধ্যে পার্থক্যটি খুব কম, সুতরাং অনিশ্চয়তাও সঠিক much
গ্লেন_বি -রিনস্টেট মনিকা

এগুলি বাস্তব অ-সংযুক্ত ডেটার একটি উপসেট। উদাহরণটি মূলত প্রশ্নটি পরিষ্কার করার উদ্দেশ্যে করা হয়েছিল। আমি সত্যিই যা খুঁজছি তা হ'ল হাইপোথিসিস টেস্টে পরীক্ষার মতো পরিমাপের অনিশ্চয়তা কীভাবে সর্বোত্তমভাবে অন্তর্ভুক্ত করা যায় সে সম্পর্কে সাধারণ দিকনির্দেশনা। আমার কাছে মনে হচ্ছে আমরা যদি পরিমাপের অনিশ্চয়তা না ব্যবহার করি তবে আমরা প্রচুর মূল্যবান তথ্য নষ্ট করছি, তবে আমি সাহিত্যে এই বিষয়ে সুস্পষ্ট দিকনির্দেশনা পেতে অক্ষম হয়েছি।
টম

এগুলির পূর্ণ ব্যবহার করার জন্য আপনাকে এগুলি পর্যবেক্ষণের জন্য একটি সম্ভাব্য মডেল হিসাবে অন্তর্ভুক্ত করতে হবে; পরিমাপের অনিশ্চয়তা আসলে কী উপস্থাপন করে? (আপনি এটি হ্যান্ডওয়েভ করতে পারবেন না, তাই সাবধান হন))
গ্লেন_বি -রেইনস্টেট মনিকা

উত্তর:


1

মনে হচ্ছে আপনি ভারী বিশ্লেষণ পরিচালনা করতে চান। এসএএস ডকুমেন্টেশনের "ধারণা" বিভাগে "ওজনযুক্ত পরিসংখ্যান উদাহরণ" দেখুন ।


সুতরাং আমরা কেবল ওজনযুক্ত উপায় এবং ওজনযুক্ত মানক বিচ্যুতির সাথে টি-টেস্ট করি, যেখানে u1 এবং u1 ওজন হয়?
টম

হ্যাঁ. আপনি ধরে নিবেন যে i_ তম পর্যবেক্ষণের বৈকল্পিকতা হ'ল ভার / ডাব্লু_আই, যেখানে ডাব্লু_আই i_ তম পর্যবেক্ষণ এবং ভার> 0 এর ওজন।
রিক

1

কেন তা অনুকরণ করবেন না? এটি হ'ল প্রতিটি পর্যবেক্ষণে শোরগোলের উপলব্ধি হিসাবে আপনার অনিশ্চয়তা যুক্ত করুন। তারপরে অনুমানের পরীক্ষাটি পুনরাবৃত্তি করুন। এটি প্রায় 1000 বার করুন এবং দেখুন নালটি কতবার প্রত্যাখ্যাত হয়েছিল। গোলমালের জন্য আপনাকে একটি বিতরণ বাছাই করতে হবে। স্বাভাবিকটি এক বিকল্প হিসাবে মনে হয় তবে এটি নেতিবাচক পর্যবেক্ষণ তৈরি করতে পারে যা বাস্তবসম্মত নয়।


1

আপনি এটিকে কোনও রিগ্রেশন সমস্যায় পরিণত করতে এবং ওজন হিসাবে অনিশ্চয়তা ব্যবহার করতে পারেন। এটি, কোনও রিগ্রেশন পরিমাপ থেকে গ্রুপ (1 বা 2?) পূর্বাভাস দিন

কিন্তু

অনিশ্চয়তা প্রায় ধ্রুবক, তাই সম্ভবত এটি ব্যবহার করে খুব বেশি কিছু পরিবর্তিত হবে না বলে মনে হয়।

আপনার 10.5 এ একটি হালকা আউটলেট রয়েছে, যা মাধ্যমের মধ্যে পার্থক্য হ্রাস করে বিষয়গুলিকে জটিল করছে। তবে আপনি যদি অনিশ্চয়তা বিশ্বাস করতে পারেন তবে সেই মানটি অন্য কোনওের চেয়ে সন্দেহজনক নয়।

টি-টেস্টটি আপনার বিকল্প অনুমানটি জানে না যে দুটি জন নমুনা বিভিন্ন জনবসতি থেকে আঁকা drawn এটি সম্পর্কে যা কিছু জানা যায় তা কিছু অনুমানের অধীনে মানে তুলনা করা। র‌্যাঙ্ক-ভিত্তিক পরীক্ষাগুলি একটি বিকল্প, তবে আপনি যদি পরিমাপ হিসাবে এই ডেটাগুলিতে আগ্রহী হন তবে সেগুলি আপনার লক্ষ্যগুলির পক্ষে ভাল বলে মনে হয় না।


পয়েন্ট নেওয়া হয়েছে। আমি উপায়টির দিক দিয়ে প্রকাশ করতে প্রশ্নটি পরিবর্তন করেছি।
টম

0

সাধারণ সর্বনিম্ন স্কোয়ারে (যেমন, lm (y ~ x)) আপনি x মান প্রদত্ত y মানগুলির চারপাশে পরিবর্তনশীলতা (অনিশ্চয়তা) মঞ্জুরি দিচ্ছেন। আপনি যদি (lm (x ~)) চারপাশে রিগ্রেশনটি ফ্লিপ করেন তবে আপনি x এর চারপাশে ত্রুটিগুলি হ্রাস করুন। উভয় ক্ষেত্রেই ত্রুটিগুলি মোটামুটি একজাতীয় বলে ধরে নেওয়া হয়।

যদি আপনি নিজের প্রতিক্রিয়া পরিবর্তনশীলের প্রতিটি পর্যবেক্ষণের চারপাশের বৈচিত্র্যের পরিমাণটি জানেন এবং এক্স দ্বারা আদেশ করা যখন সেই বৈকল্পিক স্থির নয়, তবে আপনি ওজনযুক্ত সর্বনিম্ন স্কোয়ারগুলি ব্যবহার করতে চাইবেন। আপনি 1 / (বৈকল্পিক) এর গুণাবলী দ্বারা y মানগুলিকে ওজন করতে পারেন।

আপনি যে ক্ষেত্রে উদ্বেগ প্রকাশ করেছেন যে এক্স এবং y উভয়ের উভয়েরই অনিশ্চয়তা রয়েছে এবং যে অনিশ্চয়তা দুজনের মধ্যে একই নয়, তারপরে আপনি নিজের অক্ষগুলির একটিতে লম্ব করে কেবল অবশিষ্টাংশগুলি (অ্যাড্রেস অনিশ্চিয়তা) হ্রাস করতে চান না। আদর্শভাবে, আপনি অনিশ্চয়তা হ্রাস করতে পারবেন যা লাগানো ট্রেন্ড লাইনের লম্ব। এই কাজের জন্য, আপনি পিসিএ রিগ্রেশন ব্যবহার করতে পারে (এছাড়াও লম্ব রিগ্রেশন, বা মোট লিস্ট স্কোয়ার হিসাবে পরিচিত। আছে পিসিএ রিগ্রেশন জন্য R প্যাকেজ , এবং আছে আগে এই ওয়েব সাইটে এই বিষয়ে পোস্ট হয়েছে , যা পরে আরো অন্যত্র আলোচনা করা হয়েছে তদ্ব্যতীত, আমি মনে করি (অর্থাত্ আমি ভুল হতে পারি ...) আপনি এখনও এই নিপীড়নের ভারী সংস্করণটি করতে পারেন, আপনার বৈকল্পগুলির জ্ঞানটি ব্যবহার করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.