ভবিষ্যদ্বাণী ও সহনশীলতা অন্তর


11

পূর্বাভাস এবং সহনশীলতার ব্যবধানগুলির জন্য আমার কাছে বেশ কয়েকটি প্রশ্ন রয়েছে।

আসুন প্রথমে সহনশীলতার ব্যবধানগুলির সংজ্ঞাটির সাথে একমত হন: আমাদের একটি আত্মবিশ্বাসের স্তর দেওয়া হয়, 90% বলে, জনসংখ্যার শতকরা হার ধরতে, 99% বলে, এবং একটি নমুনা আকার বলে, 20 বলে। সম্ভাবনা বন্টন জানা যায়, স্বাভাবিক বলে সুবিধার জন্য. এখন, তিন নম্বর (90%, 99% এবং 20) এবং এটা সত্য যে অন্তর্নিহিত বন্টন স্বাভাবিক দেওয়া উপরোক্ত, আমরা সহনশীলতা সংখ্যা গণনা করতে । একটি নমুনা দেওয়া গড় সঙ্গে এবং মানক চ্যুতির , সহনশীলতা ব্যবধান হয় । যদি এই সহনশীলতার ব্যবধানটি জনসংখ্যার 99% কে ক্যাপচার করে, তবে নমুনা কে সাফল্য বলা হয়( এক্স 1 , x 2 , ... , x 20 ) ˉ এক্স গুলি ˉ এক্স ± গুলি ( এক্স 1 , x এর 2 , ... , x 20 )k(x1,x2,,x20)x¯sx¯±ks(x1,x2,,x20)এবং প্রয়োজনীয়তা হল যে নমুনাগুলির 90% সাফল্য

মন্তব্য: 90% অবরোহমার্গী একটি নমুনা হতে পারাটাও সাফল্য জন্য সম্ভাব্যতা। 99% হ'ল শর্তাধীন সম্ভাবনা যা ভবিষ্যতের পর্যবেক্ষণ সহনশীলতার বিরতিতে হবে, প্রদত্ত নমুনাটি সাফল্য given

আমার প্রশ্নগুলি: আমরা কী ভবিষ্যদ্বাণী অন্তরকে সহনশীলতা অন্তর হিসাবে দেখতে পারি? ওয়েবে তাকিয়ে আমি এ সম্পর্কে বিরোধী উত্তর পেয়েছি, কেউই সত্যিই সাবধানতার সাথে ভবিষ্যদ্বাণী ব্যবস্থার সংজ্ঞা দেয় তা উল্লেখ করার জন্য নয়। সুতরাং, আপনার যদি ভবিষ্যদ্বাণী ব্যবধানের (বা কোনও রেফারেন্স) একটি সুনির্দিষ্ট সংজ্ঞা থাকে তবে আমি এটির প্রশংসা করব।

আমি যা বুঝতে পেরেছি তা হল 99% পূর্বাভাস অন্তর, উদাহরণস্বরূপ, সমস্ত নমুনার জন্য ভবিষ্যতের মানগুলির 99% ক্যাপচার করে না । এটি সহনশীলতার ব্যবধানের সমান হবে যা 100% সম্ভাব্যতার সাথে জনসংখ্যার 99% কে ধারণ করে।

আমি ৯০% পূর্বাভাস ব্যবধানের জন্য যে সংজ্ঞাগুলি পেয়েছি , 90% হ'ল একটি নমুনা দেওয়া অগ্রাধিকারের সম্ভাবনা, বলুন (আকার স্থির) এবং একক ভবিষ্যতের পর্যবেক্ষণ , যে ভবিষ্যদ্বাণী ব্যবধানে থাকবে। সুতরাং, দেখে মনে হয় যে নমুনা এবং ভবিষ্যতের মান উভয়ই একই সময়ে সহনশীলতার ব্যবধানের বিপরীতে দেওয়া হয়, যেখানে নমুনা দেওয়া হয় এবং একটি নির্দিষ্ট সম্ভাবনার সাথে এটি একটি সাফল্য , এবং শর্তে যে নমুনাটি একটি সাফল্যy y(x1,x2,,x20)yy, একটি ভবিষ্যতের মান দেওয়া হয় এবং একটি নির্দিষ্ট সম্ভাবনা সহনশীলতার বিরতিতে পড়ে। ভবিষ্যদ্বাণী ব্যবধানের উপরের সংজ্ঞাটি সঠিক কিনা সে সম্পর্কে আমি নিশ্চিত নই, তবে এটিকে প্রতিদ্বন্দ্বী বলে মনে হচ্ছে (কমপক্ষে)।

কোন সাহায্য?


4
একটি সাধারণ স্যাম্পলিংয়ের জন্য একতরফা সহনশীলতা অন্তর এই ধারণাটি বোঝার জন্য সহায়তা করতে পারে। একটি উপরের সহনশীলতা সীমাবদ্ধতা মডেলটির ধরে নেওয়া বিতরণের কোয়ান্টাইলের একটি উচ্চ আত্মবিশ্বাসের গণ্ডি ছাড়া কিছুই নয় । অতএব একটি সাধারণ বন্টনের ক্ষেত্রে এই একটি ঊর্ধ্ব আস্থা প্যারামিটারের আবদ্ধ হয় যেখানে হয় মান গসিয়ান বিতরণের। 99 % μ + কে σ কে = জেড 99 % 99 %99%99%μ+kσk=z99%99%
স্টাফেন লরেন্ট

এটি একটি ভাল reformulation, Stéphane, কারণ তা অবিলম্বে শো সেখানে সহনশীলতা সীমা বিভিন্ন ধরণের: এক একটি জন্য অনুরোধ করতে পারেন উপরের উপর আস্থা সীমা একটি জন্য, নিচের আস্থা সীমা উপর μ + + z- র 0.99 σ , অথবা ( বলুন) সেই পরামিতিটির একটি নিরপেক্ষ অনুমান । তিনটিকেই সাহিত্যে "সহনশীলতা সীমা" বলা হয়। μ+z0.99σμ+z0.99σ
whuber

আমি তোমাদের বরং উপর একটি নিম্ন আস্থার সীমা বলতে চেয়েছিলেন মনে ? μz0.99σ
স্টাফেন লরেন্ট

2
আসলে, না, স্টাফেন (যে কারণে আমি প্যারামিটারের সূত্রটি পুনরাবৃত্তি করতে যত্ন নিয়েছিলাম)। নিম্ন সহনশীলতার সীমাটির জন্য একই সাথে তিনটি সংজ্ঞা রয়েছে । যেমন, আমরা করতে চাইবেন অধীনে জনসংখ্যার শতকরা -estimate উপরের 99th, কিন্তু অবমূল্যায়ন পরিমাণ আমরা সেখানে (বলুন) একটি 5% সুযোগ আমাদের অবমূল্যায়ন এখনও খুব বেশী হতে হবে জিদ নিয়ন্ত্রন করতে পারেন। এটি আমাদের "95% আত্মবিশ্বাসের সাথে উপাত্ত দেখায় যে জনসংখ্যার 99 তম পার্সেন্টাইল এই জাতীয় এবং এরূপ মানের চেয়ে বেশি" "
whuber

উত্তর:


14

আপনার সংজ্ঞাগুলি সঠিক বলে মনে হচ্ছে।

বই এই বিষয়ে পরামর্শ করা হয় পরিসংখ্যানগত বিরতি (জেরাল্ড হান ও উইলিয়াম Meeker,), 1991 আমি উদ্ধৃতি:

একক ভবিষ্যতের পর্যবেক্ষণের জন্য পূর্বাভাস ব্যবধানটি একটি বিরতি যা একটি নির্দিষ্ট মাত্রার আত্মবিশ্বাসের সাথে একটি জনসংখ্যার থেকে পরবর্তী (বা অন্য কিছু পূর্বনির্ধারিত) এলোমেলোভাবে নির্বাচিত পর্যবেক্ষণ ধারণ করে।

[এ] সহনশীলতা অন্তর অন্তর অন্তর যা কোনও ব্যক্তির কমপক্ষে একটি নির্দিষ্ট অনুপাত, পি , একটি নির্দিষ্ট মাত্রার আত্মবিশ্বাসের 100(1α)%

মানক গাণিতিক পরিভাষায় পুনরুদ্ধারগুলি এখানে রয়েছে। যাক ডেটা স্বাধীন র্যান্ডম ভেরিয়েবল একটি আদায় বিবেচনা করা যেতে এক্স = ( এক্স 1 , ... , এক্স এন ) সাধারণ ক্রমবর্ধমান বণ্টনের ফাংশন এফ θ । ( Θ একটি অনুস্মারক হিসেবে দেখা যাচ্ছে যে এফ অজানা হতে পারে কিন্তু ডিস্ট্রিবিউশন একটি প্রদত্ত সেটে মিথ্যা বলে ধরা হয় এফ θ | θ Θ )। যাক এক্স 0x=(x1,,xn)X=(X1,,Xn)FθθFFθ|θΘX0একই ডিস্ট্রিবিউশন এবং প্রথম এন ভেরিয়েবলগুলির থেকে পৃথক সহ অন্য একটি এলোমেলো পরিবর্তনশীল হোনFθn

  1. প্রম্পটস [ এল ( এক্স ) , ইউ ( এক্স ) ] দ্বারা প্রদত্ত একটি ভবিষ্যদ্বাণী ব্যবধান (একক ভবিষ্যতের পর্যবেক্ষণের জন্য) এর নির্ধারিত সম্পত্তি রয়েছে যা[l(x),u(x)]

    infθ{Prθ(X0[l(X),u(X)])}=100(1α)%.

    বিশেষ করে, বোঝায় এন + + 1 এর variate বন্টন ( এক্স 0 , এক্স 1 , ... , এক্স এন ) আইনের দ্বারা নির্ধারিত এফ θ । কোনও শর্তাধীন সম্ভাবনার অনুপস্থিতি নোট করুন: এটি একটি সম্পূর্ণ যৌথ সম্ভাবনা। নোট, এছাড়াও, একটি অস্থায়ী ক্রমের কোনও রেফারেন্সের অনুপস্থিতি: অন্যান্য মানগুলির আগে X 0 খুব ভালভাবে পর্যবেক্ষণ করা যেতে পারে । এটা কোনো ব্যপার না.Prθn+1(X0,X1,,Xn)FθX0

    আমি নিশ্চিত নই যে এর কোন দিকটি (গুলি) "বিরোধী" হতে পারে। যদি আমরা ডেটা সংগ্রহের আগে অনুসরণ করা একটি ক্রিয়াকলাপ হিসাবে একটি পরিসংখ্যান প্রক্রিয়া বাছাই করার ধারণা করি তবে এটি একটি পরিকল্পিত দ্বি-পদক্ষেপ প্রক্রিয়াটির একটি প্রাকৃতিক এবং যুক্তিসঙ্গত সূত্র, কারণ উভয় ডেটা ( ) এবং "ভবিষ্যতের মান" এক্স 0 এলোমেলো হিসাবে মডেল করা প্রয়োজন।Xi,i=1,,nX0

  2. একটি সহনশীলতার ব্যবধান, শেষ পয়েন্ট দ্বারা প্রদত্ত , সংজ্ঞায়িত সম্পত্তি রয়েছে যা(L(x),U(x)]

    infθ{Prθ(Fθ(U(X))Fθ(L(X))p)}=100(1α)%.

    এর কোনও উল্লেখের অনুপস্থিতিতে নোট করুন : এতে কোনও ভূমিকা নেই।X0

যখন সাধারন ডিস্ট্রিবিউশন সেট না থাকে, তখন ফর্মের ভবিষ্যদ্বাণী অন্তর অস্তিত্ব{Fθ}

l(x)=x¯k(α,n)s,u(x)=x¯+k(α,n)s

( হল নমুনা গড় এবং এর নমুনা স্ট্যান্ডার্ড বিচ্যুতি)। K এবং ফাংশনটির মানগুলি , যা হান এবং মীকার ট্যাবলেট করে, তা ডেটা এক্স এর উপর নির্ভর করে না । অন্যান্য পূর্বাভাস অন্তর্বর্তী প্রক্রিয়াগুলি রয়েছে, এমনকি সাধারণ ক্ষেত্রেও: এগুলি কেবল একমাত্র নয়।x¯skx

একইভাবে, ফর্মের সহনশীলতা অন্তর রয়েছে

L(x)=x¯K(α,n,p)s,U(x)=x¯+K(α,n,p)s.

অন্যান্য সহনশীলতার ব্যবধান পদ্ধতি রয়েছে : কেবলমাত্র এগুলিই নয়।

সূত্রগুলির এই জোড়াগুলির মধ্যে সাদৃশ্যটি উল্লেখ করে আমরা সমীকরণটি সমাধান করতে পারি

k(α,n)=K(α,n,p).

αpααp


2
এই অন্তরগুলির মধ্যে বিভ্রান্তি আসল। এক দশক আগে আমার সাথে সরকারী পরিসংখ্যানবিদদের সাথে বেশ কয়েকটি কঠিন কথোপকথন হয়েছিল যিনি এই পার্থক্য সম্পর্কে অজ্ঞ ছিলেন এবং (ভাইরালভাবে) সেখানে একটির বিষয়টি স্বীকৃতি দিতে অক্ষম ছিলেন। দিকনির্দেশনা তৈরি, প্রতিবেদন পর্যালোচনা, কেস কর্মীদের পরামর্শ দেওয়া, সফ্টওয়্যার বিতরণ এবং এমনকি সমকক্ষ পর্যালোচনা প্রকাশনার ক্ষেত্রে তার বিশিষ্ট ভূমিকা এই ভুল ধারণাগুলির ধারাবাহিকতা প্রচার করেছে। তাই সাবধান!
হোয়বার

p=50%k(α,n)=K(α,n,0.5)

3
np=50%X0

k(α,n)K(50%,n,1α)nK50%z1α/n

@whuber। উত্তরের জন্য ধন্যবাদ. আমি এটি সঠিক হিসাবে চিহ্নিত করার আগে, আমি এটি বুঝতে পেরেছি তা নিশ্চিত করতে হবে। এটি "হজম" করার জন্য আমাকে কিছু সময় দিন।
আইওনিস সোলডাটোস

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.