কীভাবে গড়ের আত্মবিশ্বাসের ব্যবধান গণনা করবেন?


19

কল্পনা করুন যে আপনি একটি পরীক্ষা তিনবার পুনরাবৃত্তি। প্রতিটি পরীক্ষায়, আপনি তিনটি পরিমাপ সংগ্রহ করেন। তিনটি পরীক্ষামূলক পদ্ধতির মধ্যে পার্থক্যের তুলনায় ত্রিভুজগুলি একসাথে খুব কাছাকাছি থাকে। গ্র্যান্ড মানে গণনা করা বেশ সহজ। তবে কীভাবে কোনও গ্র্যান্ডের জন্য আস্থা অন্তর গণনা করতে পারে?

নমুনা তথ্য:

পরীক্ষা 1: 34, 41, 39

পরীক্ষা 2: 45, 51, 52

পরীক্ষা 3: 29, 31, 35

ধরে নিন যে কোনও পরীক্ষার মধ্যে প্রতিলিপি মানগুলি প্রতিটি পরীক্ষার গড় মানগুলি যেমন একটি গাউসীয় বিতরণ অনুসরণ করে। একটি পরীক্ষার মধ্যে পরিবর্তনের এসডি পরীক্ষামূলক উপায়গুলির মধ্যে এসডি থেকে ছোট। এটিও ধরে নিন যে প্রতিটি পরীক্ষায় তিনটি মানের কোনও অর্ডার নেই। প্রতিটি সারিতে তিনটি মানের বাম থেকে ডান ক্রম সম্পূর্ণ স্বেচ্ছাচারিত।

সহজ পদ্ধতির হ'ল প্রথমে প্রতিটি পরীক্ষার গড় গণনা করা হয়: 38.0, 49.3, এবং 31.7 এবং তারপরে এই তিনটি মানের মধ্যে গড় এবং তার 95% আত্মবিশ্বাসের ব্যবধান গণনা করা। এই পদ্ধতিটি ব্যবহার করে, গ্র্যান্ড গড়টি 39.4 হয় 95% আস্থা অন্তর 17.4 থেকে 61.9 পর্যন্ত .9

এই পদ্ধতির সমস্যাটি হ'ল এটি ত্রিভুজের মধ্যে পার্থক্যটিকে সম্পূর্ণ উপেক্ষা করে। আমি ভাবছি যদি সেই ভিন্নতার জন্য অ্যাকাউন্ট করার কোনও ভাল উপায় না থাকে।


1
কোনও উত্তর নয়, কেবল একটি স্বজ্ঞাত পর্যবেক্ষণ। পুলযুক্ত ডেটার জন্য সিআই মানে (সমস্ত নয় টি ওবস) হয় , সিআই এর অর্থের ভিত্তিতে কেবল । সম্পর্কে নিশ্চিত নই আপনার সি আই করছে (টাইপো? 17 27, এবং 51 না 61?), আমি পেতে তিনটি উপায়ে এসটিডি মাত্রই ভুল করে, এবং যেমন 2 df প্রয়োগ সঙ্গে টি Dist এর সমাংশক। আমি ভাবব যে আপনি যে সিআই খুঁজছেন তা এই দুজনের মধ্যে কোথাও কোথাও শুয়ে থাকবে - যেমন আপনার আংশিক পুলিং রয়েছে। ভেরিয়েন্স সূত্র , প্রতিটি সিআই সূত্রের অর্ধেকটি ব্যবহার করে( 39.7 ± 12.83 ) 2.98 4.30 0.975 V ( Y ) = E [ V ( Y | Y g ) ] + V [ E ( Y | Y g ) ](39.7±2.13)(39.7±12,83)2.984.300,975ভী(ওয়াই)=[ভী(ওয়াই|ওয়াই)]+ +ভী[(ওয়াই|ওয়াই)]
সম্ভাব্যতাবিহীন

2
@ প্রোব্যাবিলিটিস্লোগিক: তিনটি পরীক্ষার অর্থের এসইএম 5.168 (আপনি লিখেছেন তেমন 2.98 নয়), এবং আমি মূল পোস্টে (17.4 থেকে 61.9) দেওয়া আত্মবিশ্বাসের ব্যবধানটি সঠিক। এসইএম এসডি থেকে গণনা করা হয় (8.95) এন এর বর্গমূল (3 এর বর্গমূল) দ্বারা ভাগ করে। পরিবর্তে আপনি n (3) দ্বারা ভাগ করেছেন।
হার্ভে মোটুলস্কি

আমার , পুলের বিরতিতে (একই ভুল) দ্বারা প্রতিস্থাপিত করা উচিত6.402.136.40
সম্ভাব্যতা

নিম্নলিখিত লিঙ্কটি এই উত্তর দেয়? টকস্ট্যাটস.সোথথ্রিড.এফপি

@ টিএসটি, পুলযুক্ত বৈকল্পিকের উইকিপিডিয়ায় একটি লিঙ্ক ছাড়া আর কিছুই নেই বলে মনে হয় । বিশদ যত্ন?
chl

উত্তর:


6

ভারসাম্যপূর্ণ ভারসাম্যের জন্য ভারসাম্যপূর্ণ বিরতি রয়েছে ভারসাম্যহীন এলোমেলো মডেল বস্তুত, এটা সহজ চেক করার জন্য যে পর্যবেক্ষিত উপায়ে বন্টন হয় হয় সাথে , এবং এটি সুবিদিত যে বর্গের মধ্যে এর যোগফলের এবং সামগ্রিক পর্যবেক্ষণের গড় থেকে পৃথকˉ Y আমি ˉ Y আমি ~ IID এন ( μ , τ 2 ) τ 2 = σ 2 + + σ 2 W

(Yআমি|μআমি)~IIDএন(μআমি,σW2),=1,...,জে,μআমি~IIDএন(μ,σ2),আমি=1,...,আমি
y¯iy¯i~IIDএন(μ,τ2) এসএসবিএসএসবি বিজেτ2χ 2 আই - 1 ˉ ওয়াইএন(μ,τ2τ2=σ2+ +σW2জেএসএস
এসএস~জেτ2χআমি-12
ˉ y -μ
Y¯~এন(μ,τ2আমি)
। সুতরাং এর একটি রয়েছে শিক্ষার্থীর দিয়ে বন্টন স্বাধীন ডিগ্রীগুলির, কোথা এটা সহজ সম্পর্কে একটি সঠিক আস্থা ব্যবধান পেতে । টিআই-1μ
Y¯-μ1আমিএসএসজে(আমি-1)
টিআমি-1μ

মনে রাখবেন যে এই আত্মবিশ্বাসের ব্যবধানটি কেবলমাত্র গোষ্ঠী হিসাবে the considering হিসাবে পর্যবেক্ষণ হিসাবে বিবেচনা করে কোনও গাউসীয় শ্রেণীর জন্য শাস্ত্রীয় বিরতি ছাড়া কিছুই নয়Y¯আমি । সুতরাং আপনি যে সহজ পদ্ধতির উল্লেখ করেছেন:

সহজ পদ্ধতির হ'ল প্রথমে প্রতিটি পরীক্ষার গড় গণনা করা হয়: 38.0, 49.3, এবং 31.7 এবং তারপরে এই তিনটি মানের মধ্যে গড় এবং তার 95% আত্মবিশ্বাসের ব্যবধান গণনা করা। এই পদ্ধতিটি ব্যবহার করে, গ্র্যান্ড গড়টি 39.4 হয় 95% আস্থা অন্তর 17.4 থেকে 61.9 পর্যন্ত .9

সঠিক. এবং উপেক্ষা করা প্রকরণ সম্পর্কে আপনার স্বজ্ঞাত:

এই পদ্ধতির সমস্যাটি হ'ল এটি ত্রিভুজের মধ্যে পার্থক্যটিকে সম্পূর্ণ উপেক্ষা করে। আমি ভাবছি যদি সেই ভিন্নতার জন্য অ্যাকাউন্ট করার কোনও ভাল উপায় না থাকে।

ভূল. আমি /stats//a/72578/8402 এ এ জাতীয় সরলকরণের নির্ভুলতার কথাও উল্লেখ করেছি

আপডেট 12/04/2014

আমার ব্লগে এখন কিছু বিশদ লেখা রয়েছে: আত্মবিশ্বাসের ব্যবধানগুলি পেতে মডেল হ্রাস করা


অজগর এই সমাধান বাস্তবায়নে কোন সহায়তা? stackoverflow.com/questions/45682437/...
blehman

7

এটি লিনিয়ার মিশ্র প্রভাবগুলির মডেলটির মধ্যে অনুমানের প্রশ্ন। সমস্যাটি হ'ল গ্র্যান্ড অর্থের ভিন্নতা হ'ল দুটি ভেরিয়েন্স উপাদানগুলির একটি ভারযুক্ত যোগফল যা আলাদাভাবে অনুমান করতে হবে (ডেটাগুলির একটি এনওওএর মাধ্যমে)। অনুমানের স্বাধীনতার বিভিন্ন ডিগ্রি রয়েছে। সুতরাং, যদিও কেউ সাধারণ ছোট-নমুনা (শিক্ষার্থী টি) সূত্রগুলি ব্যবহার করে গড়ার জন্য একটি আত্মবিশ্বাসের ব্যবধান তৈরির চেষ্টা করতে পারে, তবে এর নামমাত্র কভারেজ অর্জনের সম্ভাবনা নেই কারণ গড় থেকে বিচ্যুতিগুলি অবশ্যই শিক্ষার্থীদের টি বিতরণ অনুসরণ করবে না।

ইভা জারোসোয়া একটি সাম্প্রতিক (২০১০) নিবন্ধ, লিনিয়ার মিশ্রিত প্রভাবগুলির মডেলটির সাথে অনুমান , এই বিষয়টি নিয়ে আলোচনা করেছে। (২০১৫ সালের পরে এটি আর ওয়েবে উপলব্ধ বলে মনে হয় না)) "ছোট" ডেটাসেটের প্রসঙ্গে (তবুও এটির তুলনায় প্রায় তিনগুণ বড়) দুটি আনুমানিক সিআই গণনা মূল্যায়নের জন্য সিমুলেশন ব্যবহার করে (ভাল -স্যাটার্থওয়েটের আনুমানিকতা এবং "কেনওয়ার্ড-রজারের পদ্ধতি") known তার সিদ্ধান্তে অন্তর্ভুক্ত রয়েছে

সিমুলেশন অধ্যয়নটি প্রকাশিত হয়েছিল যে কোভেরিয়েন্স প্যারামিটারগুলির অনুমানের গুণমান এবং ফলস্বরূপ ছোট নমুনাগুলিতে আত্মবিশ্বাসের ব্যবস্থাগুলির সামঞ্জস্য করা যথেষ্ট দুর্বল হতে পারে .... একটি দুর্বল অনুমান কেবলমাত্র প্রচলিত বিরতিগুলির সত্যিকারের আত্মবিশ্বাসের মাত্রাকেই প্রভাবিত করতে পারে তবে এটি সামঞ্জস্যকেও অসম্ভব করে তুলতে পারে। এটা সুস্পষ্ট যে এমনকি ভারসাম্যপূর্ণ তথ্যের জন্যও তিন ধরণের অন্তর [প্রচলিত, স্যাটার্থওয়েট, কেআর] যথেষ্ট পরিমাণে পৃথক হতে পারে। যখন প্রচলিত এবং সামঞ্জস্য ব্যবধানগুলির মধ্যে একটি উল্লেখযোগ্য পার্থক্য পরিলক্ষিত হয়, তখন কোভারিয়েন্স প্যারামিটার অনুমানের স্ট্যান্ডার্ড ত্রুটিগুলি পরীক্ষা করা উচিত। অন্যদিকে, যখন [তিনটি] ধরণের বিরতিগুলির মধ্যে পার্থক্য ছোট হয়, তখন সামঞ্জস্যটি অপ্রয়োজনীয় বলে মনে হয়।

সংক্ষেপে, একটি ভাল পদ্ধতির বলে মনে হচ্ছে

  1. বৈকল্পিক উপাদানগুলির অনুমান ব্যবহার করে একটি টি-বিতরণ প্রযোজ্য বলে প্রচলিত সিআই গুন করুন।

  2. সমন্বিত সিআই এর মধ্যে কমপক্ষে একটি গণনা করুন।

  3. যদি গণনাগুলি "কাছাকাছি থাকে" তবে প্রচলিত সিআই গ্রহণ করুন। অন্যথায়, বিশ্বস্ত সিআই উত্পাদন করার জন্য পর্যাপ্ত তথ্য নেই বলে প্রতিবেদন করুন।


ভেরিয়েন্স উপাদানগুলি ব্যবহার করে আমি একই পোস্টে মূল পোস্টে গণনা করি সেই একই আত্মবিশ্বাসের অন্তরকে নিয়ে যায়। আনোভা টেবিলটিতে 2 ডিএফ সহ 480.7 কলামগুলির মধ্যে এসএস রয়েছে, যার অর্থ এমএস 240.3। এসডিটি স্কয়ার্ট (এমএসবিটুইন / এন) = স্কয়ার্ট (240.3 / 3) = 8.95, যা মূলত আমি পোস্ট করা একই সিআইয়ের দিকে নিয়ে যায় (17.4 থেকে 61.9)। আপনার উদ্ধৃত জারাসোয়া কাগজটি অনুসরণ করা আমার পক্ষে খুব কঠিন বলে মনে হয়েছে এবং এটি এখানে প্রাসঙ্গিকভাবে নিশ্চিত নয় (এটি বারবার ব্যবস্থা করার নকশাগুলির ক্ষেত্রে বলে মনে হয়)। ???
হার্ভি মোটুলস্কি

@ হার্ভে আপনার বর্ণনাটি আমার কাছে বারবার ব্যবস্থা হওয়ার মতো মনে হচ্ছে! আমি বিশ্বাস করি যে জারাসোয়া কাগজটি স্পট রয়েছে।
whuber

1
আমি ল্যাবগুলিতে সাধারণ পরিস্থিতি সম্পর্কে ভাবছি যেখানে ট্রিপলিকেটগুলি কেবল তিনটি পৃথক টেস্ট টিব (বা ওয়েল) হয়। সারণীতে উপস্থাপিত তিনটির ক্রমটি নির্বিচারে। দ্বিতীয় বা তৃতীয় পরীক্ষায় প্রতিলিপি # 2 নিয়ে প্রথম পরীক্ষায় প্রতিলিপি # 2 এর মধ্যে কোনও সংযোগ বা সম্পর্ক নেই। প্রতিটি পরীক্ষার মাত্র তিনটি পরিমাপ থাকে। সুতরাং সত্যিই পুনরাবৃত্তি ব্যবস্থা নয়। রাইট?
হার্ভে মোটুলস্কি

হুঁশিয়ারি, এখানে একটি সঠিক ছাত্র বিতরণ আছে। আমার উত্তর দেখুন।
স্টাফেন লরেন্ট

@ আপনি ইভা জারাসোয়া নিবন্ধটি সরবরাহের জন্য যে লিঙ্কটি সরবরাহ করেছেন তা মারা গেছে এবং একটি গুগল অনুসন্ধানে কোনও ফল পাওয়া যায় নি। আপনি রেফারেন্স সংশোধন করতে পারেন?
প্ল্যাসিডিয়া

0

আপনার একটি আত্মবিশ্বাসের বিরতি থাকতে পারে যা আপনার উভয় সমস্যার সমাধান করে। আপনাকে একটি বাছাই করতে হবে। আপনি পরীক্ষার বৈকল্পিকের মধ্যবর্তী বর্গক্ষেত্রের ত্রুটি শব্দটি থেকে একটি আবিষ্কার করতে পারেন যা আপনাকে পরীক্ষার মধ্যে থাকা মানগুলি কতটা নির্ভুলভাবে নির্ধারণ করতে পারে বা আপনি এটির মধ্যে এটি করতে পারেন এবং এটি পরীক্ষাগুলির মধ্যে হতে পারে সে সম্পর্কে কিছু বলতে পারবেন। যদি আমি কেবল প্রাক্তন হয়ে থাকি তবে আমি এটি গ্র্যান্ড অর্থের আশেপাশের চেয়ে 0 এর আশেপাশে প্লট করতে চাইতাম কারণ এটি আপনাকে প্রকৃত গড় মূল্য সম্পর্কে কিছুই বলে না, কেবলমাত্র একটি প্রভাব সম্পর্কে (এই ক্ষেত্রে 0)। অথবা আপনি উভয়ই চক্রান্ত করতে পারেন এবং তারা যা করেন তা বর্ণনা করতে পারেন।

একটির মধ্যে একটি হ্যান্ডেল পেয়েছেন। এটির ভিতরে এটির জন্য এমওএসইর সাথে কাজ করার জন্য একটি আনোভাতে ত্রুটি শব্দটি গণনার মতো এবং সেখান থেকে সিআইয়ের জন্য এসই কেবল স্কয়ার্ট (এমএসই / এন) (এই ক্ষেত্রে এন = 3)।


প্রকৃতপক্ষে আপনি প্রতিটি গড় জন্য এবং গ্র্যান্ড গড় জন্য একটি বিশ্বাসযোগ্য ব্যবধান থাকতে পারে। কেবলমাত্র একটি বায়সিয়ান মাল্টিলেভেল মডেল ব্যবহার করুন। কখনও কখনও এই ধরণের অনুমানকে আংশিক পুলিং বলা হয়। সমস্যাটি ছোট ছোট নমুনা, আমার মনে হয়।
মনোয়েল গ্যাল্ডিনো

আপনি প্রতিটি গড় এবং দুর্দান্ত অর্থের জন্য একটি আত্মবিশ্বাসের ব্যবধান থাকতে পারেন ... তবে এগুলি ভিন্ন জিনিস ... ঠিক যেমন বিশ্বাসযোগ্য অন্তরগুলি। গবেষণার অভ্যন্তরের বৈকল্পিকতা এবং সমষ্টি হিসাবে মধ্যবর্তী উভয়টির বিষয়ে আমি সিআই সম্পর্কে প্রশ্নটিকে ব্যাখ্যা করেছি। এটি এখনও আপনাকে সিআই এর অর্থ ভিন্ন ভিন্ন জিনিস দিয়ে যায়। (আমিও আক্ষরিক অর্থে নি নি)
জন

1
তদ্ব্যতীত, আমি যেভাবে বোঝাতে চাইছি তা সত্যই "পারে না" না। আপনি একরকম একক সমীকরণ নিয়ে আসতে পারেন যা প্রতিটি কিছুর জন্য একটি আত্মবিশ্বাসের ব্যবধান গণনা করে। এটি কেবল বোধগম্য কিছু বোঝাতে চাইবে না। এটাই আমি বোঝাতে পারছিলাম না।
জন

আমি আমার মন্তব্য লেখার কয়েক মিনিট পরে আমি বুঝতে পারি যে আমাদের আক্ষরিক অর্থে নেওয়ার কথা ছিল না। তবে এটি সম্পাদনা করতে দেরি হয়েছিল =)।
মানোয়েল গাল্ডিনো

0

আমি মনে করি গ্র্যান্ড মাইন্ডের জন্য সিআইটি মূল ডেটার পরিসরের জন্যও খুব প্রশস্ত [17,62]।

এই পরীক্ষাগুলি রসায়নের ক্ষেত্রে খুব সাধারণ। উদাহরণস্বরূপ, রেফারেন্স উপকরণগুলির শংসাপত্রের জন্য আপনাকে এলোমেলো উপায়ে পুরো লট থেকে কিছু বোতল তুলতে হবে এবং আপনাকে প্রতিটি বোতলটিতে প্রতিলিপি বিশ্লেষণ করতে হবে। আপনি কীভাবে রেফারেন্স মান এবং এর অনিশ্চয়তা গণনা করবেন? এটি করার অনেকগুলি উপায় রয়েছে তবে সর্বাধিক সফটাস্টিকযুক্ত (এবং সঠিক বলে আমি মনে করি) মেটা-বিশ্লেষণ বা এমএল প্রয়োগ করছে (ডারসিমোনিয়ান-লেয়ার্ড, ভ্যাঞ্জেল-রুখিন, ইত্যাদি) is

বুটস্ট্র্যাপ অনুমান সম্পর্কে কি?


1
সিমুলেশন (সাধারণত বিতরণের প্রধান প্রভাব এবং ত্রুটি সহ 10,000 ট্রায়াল) ইঙ্গিত দেয় [21, 58] এর জন্য প্রতিসাম্য দ্বিমুখী 95% সিআই।
হোবার

হুঁশিয়ার: আপনি কীভাবে এই সিমুলেশনগুলি করেছিলেন তা জানতে আগ্রহী হব ious মূল ডেটা থেকে বুটস্ট্র্যাপিং? বা সত্যই সিমুলেশন? যদি পরবর্তীটি হয় তবে ডেটা সিমুলেট করতে আপনি কী অর্থ এবং এসডি ব্যবহার করেন ??
হার্ভে মোটুলস্কি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.