বড় আলফা এবং বিটা সহ বিটা বিতরণের জন্য আমি কীভাবে (সংখ্যাগতভাবে) আনুমানিক মানগুলি পারি values


12

বড় পূর্ণসংখ্যার আলফা, বিটা (উদাঃ আলফা, বিটা> 1000000) এর জন্য বিটা বিতরণের মান গণনা করার জন্য একটি সংখ্যাগতভাবে স্থিতিশীল উপায় কি ?

আসলে, আমার কেবল মোডের চারপাশে একটি 99% আত্মবিশ্বাসের ব্যবধান দরকার, যদি এটি কোনওরকম সমস্যাটিকে আরও সহজ করে তোলে।

যোগ করুন : আমি দুঃখিত, আমার প্রশ্নটি যেমনটি ভেবেছিল তেমন পরিষ্কারভাবে বলা হয়নি। আমি যা করতে চাই তা হ'ল: আমার কাছে একটি মেশিন রয়েছে যা একটি পরিবাহী বেল্টে পণ্যগুলি পরীক্ষা করে। এই পণ্যগুলির কিছু অংশ মেশিন দ্বারা প্রত্যাখ্যান করা হয়। এখন যদি মেশিন অপারেটর কিছু পরিদর্শন সেটিং পরিবর্তন করে, আমি তাকে / তার আনুমানিক প্রত্যাখ্যান হার এবং বর্তমান অনুমানটি কতটা নির্ভরযোগ্য তা সম্পর্কে কিছু ইঙ্গিতটি দেখাতে চাই।

সুতরাং আমি ভেবেছিলাম যে আমি প্রকৃত প্রত্যাখ্যান হারকে এলোমেলো পরিবর্তনশীল এক্স হিসাবে গণ্য করব এবং প্রত্যাখাত অবজেক্ট N এবং স্বীকৃত বস্তুর সংখ্যাগুলির উপর ভিত্তি করে সেই এলোমেলো ভেরিয়েবলের সম্ভাবনা বন্টন গণনা করি যদি আমি এক্স এর জন্য অভিন্ন পূর্ববর্তী বিতরণ ধরে নিই তবে এটি একটি বি এবং বিতরণ এন এবং এম এর উপর নির্ভর করে আমি হয় সরাসরি এই বিতরণটি ব্যবহারকারীর কাছে প্রদর্শন করতে পারি বা একটি অন্তর [l, r] পেতে পারি যাতে প্রকৃত প্রত্যাখ্যানের হার p> = 0.99 (শ্যাবিচেফের পরিভাষা ব্যবহার করে) এর সাথে এই ব্যবধানে থাকে এবং এটি প্রদর্শিত হয় অন্তর. ছোট এম, এন (অর্থাত্ প্যারামিটার পরিবর্তনের অবিলম্বে) এর জন্য, আমি সরাসরি বিতরণ গণনা করতে পারি এবং অন্তর প্রায় [l, r] অনুমান করতে পারি। তবে বৃহত্তর এম, এন এর জন্য এই নিখুঁত পদ্ধতির ফলে তল ত্রুটির দিকে পরিচালিত হয়, কারণ এক্স ^ এন * (1-এক্স) ^ এম ডাবল স্পষ্টতা ভাসমান হিসাবে প্রতিনিধিত্ব করা ছোট।

আমার অনুমান যে আমার সেরা বেটটি হ'ল এম, এন এর জন্য আমার নিষ্পাপ বিটা-বিতরণ ব্যবহার করা এবং এম, এন কিছুটা প্রান্তিকের অতিক্রম করার সাথে সাথে একই গড় এবং বৈচিত্রের সাথে একটি সাধারণ বিতরণে স্যুইচ করা। যে জানার জন্য?


1
আপনি কি গণিতে বা কেবল একটি সমাধান সমাধানে আর বা এরকম কোনও কিছু জানতে চান?
জন

আমার এটি # # তে প্রয়োগ করা দরকার, সুতরাং গণিতটি ভাল হবে। একটি কোড নমুনাও খুব ভাল হবে, যদি এটি কিছু বিল্টিন আর / মতলব / ম্যাথমেটিকা ​​ফাংশনের উপর নির্ভর না করে আমি সি # তে অনুবাদ করতে পারি না।
নিকি

পিডিএফ, সিডিএফ নাকি বিপরীত সিডিএফ?
জেএম

আপনি যদি বিটার প্রতি জেদ না করেন তবে আপনি কুমারস্বামী বিতরণ ব্যবহার করতে পারেন যা খুব অনুরূপ এবং অনেক সরল বীজগণিত ফর্ম রয়েছে: en.wikedia.org/wiki/
টিম

উত্তর:


13

একটি সাধারণ আনুমানিকতা খুব ভাল কাজ করে , বিশেষ করে লেজগুলিতে। এর একটি গড় ব্যবহার করুন এবং একটি ভ্যারিয়েন্স । উদাহরণস্বরূপ, একটি শক্ত পরিস্থিতিতে (যেখানে skewness উদ্বেগের কারণ হতে পারে) হিসাবে লেজের সম্ভাবনায় নিখুঁত আপেক্ষিক ত্রুটি যেমন শিখর প্রায় এবং আপনি যখন চেয়ে কম হন গড় থেকে 1 এসডি এর বেশি। (এটি বিটা এত বড় হওয়ার কারণে নয় : এর সাথে পরম আপেক্ষিক ত্রুটিগুলি দ্বারা আবদ্ধ হয়α βα/(α+β) α=106,β=1080.000260.00006α=β=1060.0000001αβ(α+β)2(1+α+β)α=106,β=1080.000260.00006α=β=1060.0000001।) সুতরাং, 99% অন্তর অন্তর্ভুক্ত মূলত যে কোনও উদ্দেশ্যেই এই আনুমানিকতাটি দুর্দান্ত is

প্রশ্নের সম্পাদনাগুলির আলোকে নোট করুন যে কোনওটি বিটা সংহতগুলি প্রকৃতপক্ষে সংহত করার মাধ্যমে গণনা করে না: অবশ্যই আপনি পাতালগুলি পেয়ে যাবেন (যদিও এগুলি সত্যই গুরুত্বপূর্ণ নয়, কারণ তারা অবিচ্ছেদে প্রশংসনীয়ভাবে অবদান রাখে না) । জনসন অ্যান্ড কোটজ (পরিসংখ্যানের বিতরণ) এ নথিভুক্ত হিসাবে অবিচ্ছেদ্য বা এটি আনুমানিক গণনা করার অনেকগুলি উপায় রয়েছে। একটি অনলাইন ক্যালকুলেটর http://www.danielsoper.com/statcalc/calc37.aspx এ পাওয়া যায় । আপনার প্রকৃতপক্ষে এই অবিচ্ছেদের বিপরীতমুখী হওয়া দরকার। বিপরীত গণনা করার জন্য কয়েকটি পদ্ধতি গণিতের সাইটে http://funitions.wolfram.com/GammaBetaErf/InverseBetaRegularized/ এ নথিভুক্ত করা হয়েছে। কোড সংখ্যার রেসিপিগুলিতে সরবরাহ করা হয় (www.nr.com)। খুব ভাল একটি অনলাইন ক্যালকুলেটরটি হল ওল্ফ্রাম আলফা সাইট (www.wolframalpha.com): inverse beta regularized (.005, 1000000, 1000001)বাম প্রান্তে এবং inverse beta regularized (.995, 1000000, 1000001)ডান প্রান্তের জন্য প্রবেশ করুন ( , 99% অন্তর)।α=1000000,β=1000001


পারফেক্ট! আমার ডেস্কে সারাক্ষণ এনআর বই ছিল, তবে কখনও সেদিকে তাকানোর কথা ভাবি নি। অনেক ধন্যবাদ.
নিকি

3

একটি দ্রুত গ্রাফিকাল পরীক্ষা পরামর্শ দেয় যে আলফা এবং বিটা উভয়ই খুব বড় হলে বিটা বিতরণটি একটি সাধারণ বিতরণের মতো লাগে। "বিটা বিতরণ সীমা স্বাভাবিক" গুগল করে আমি http://nrich.maths.org/discus/messages/117730/143065.html?1200700623 পেয়েছি , যা একটি হাতের কাজ 'প্রমাণ' দেয়।

বিটা বিতরণের উইকিপিডিয়া পৃষ্ঠাটি তার গড়, মোড (v বড় বড় আলফা এবং বিটার অর্থের নিকটে) এবং বৈকল্পিকতা দেয়, সুতরাং আপনি প্রায় একই গড় এবং বৈকল্পিক সহ একটি সাধারণ বিতরণ ব্যবহার করতে পারেন। এটি আপনার উদ্দেশ্যগুলির জন্য যথেষ্ট পরিমাণে অনুমানযোগ্য কিনা তা আপনার উদ্দেশ্যগুলি নির্ভর করে।


বোকা প্রশ্ন: আপনি কীভাবে এই গ্রাফিকাল পরীক্ষাটি করেছেন? আমি প্রায় 100 টি আলফা / বিটার জন্য বিতরণের প্লট করার চেষ্টা করেছি, তবে পাতাল ত্রুটির কারণে আমি কিছুই দেখতে পেলাম না।
নিকি

আপনি সংহতটি প্লট করতে চান না: আপনি ইন্টিগ্রাল প্লট করতে চান। তবে আপনি বিভিন্ন উপায়ে ইন্টিগ্রেন্ড পেতে পারেন। একটি হ'ল ওলফ্রাম আলফা সাইটে "প্লট ডি (বিটা (x, 1000000, 2000000), এক্স) / বিটা (1, 1000000, 2000000)" 0.3325 থেকে 0.334 এ প্রবেশ করতে হবে। অবিচ্ছেদ্য নিজেই "প্লট বিটা (x, 1000000, 2000000) / বিটা (1, 1000000, 2000000) 0.3325 থেকে 0.334 পর্যন্ত দেখা যায়"।
whuber

আমি একীকরণের পরিকল্পনা করেছি, যেমন বিটা বিতরণের পিডিএফ, স্টাটাতে - এটি পিডিএফের একটি বিল্টিন ফাংশন রয়েছে। বৃহত্তর আলফা এবং বিটার জন্য আপনাকে প্লটের স্বাভাবিকের সীমাবদ্ধতা দেখতে সীমাবদ্ধ করতে হবে। আমি যদি এটি নিজেই প্রোগ্রামিং করতাম তবে আমি এর লোগারিদম গণনা করতাম তবে শেষে ক্ষতিকারক। এটি ডুবে যাওয়া সমস্যার সাথে সহায়তা করা উচিত। ডিনোমিনেটরে বিটা ফাংশনটি গামা ফাংশনগুলির সাথে সংজ্ঞায়িত করা হয়, পূর্ণসংখ্যা আলফা এবং বিটার জন্য ফ্যাকটোরিয়াল সমতুল্য এবং অনেকগুলি প্যাকেজ / লাইব্রেরিতে lngamma () বা lnfactorial () পরিবর্তে / পাশাপাশি গামা () এবং ফ্যাকটোরিয়াল () ফাংশন অন্তর্ভুক্ত থাকে।
onestop

2

আমি আপনাকে একটি অন্তরবৃত্ত চান এমনটি নির্ধারণ করতে যাচ্ছি যে বিটা আরভি থেকে একটি এলোমেলো অঙ্কনের সম্ভাবনা ০.৯৯ সহ বিরতিতে রয়েছে, এবং জন্য বোনাস পয়েন্টগুলি মোডের চারপাশে প্রতিসাম্যযুক্ত। দ্বারা গাউস 'বৈষম্য বা Vysochanskii-Petunin বৈষম্য, আপনি অন্তর যে ব্যবধান থাকতে গঠন করা যেতে পারে , এবং মোটামুটি শালীন অনুমান হবে। যথেষ্ট পরিমাণে বড় আপনার কাছে এবং আলাদা আলাদা সংখ্যা হিসাবে উপস্থাপন করার ক্ষেত্রে সংখ্যাগত আন্ডারফ্লো সমস্যা থাকবে , সুতরাং এই রুটটি যথেষ্ট ভাল হতে পারে।l r [ l , r ] α , β l r[l,r]lr[l,r]α,β lr


যখন আলফা এবং বিটা খুব বেশি দূরে থাকে না (অর্থাত্ আলফা / বিটা উপরে এবং নীচে আবদ্ধ থাকে), বিটার এসডি [আলফা, বিটা] 1 / স্কয়ার্ট (আলফা) এর সাথে সমানুপাতিক। উদাহরণস্বরূপ, আলফা = বিটা = 10 ^ 6 এর জন্য, এসডি 1 / স্কয়ার্ট (8) / 1000 এর খুব কাছে রয়েছে I আমি মনে করি যে এল এবং আর এর উপস্থাপনে কোনও সমস্যা হবে না এমনকি আপনি যদি কেবলমাত্র একক নির্ভুলতা ব্যবহার করেন তবে ।
whuber

যা বলতে হয় যে 'যথেষ্ট পরিমাণে বড় নয়';)106
শাব্বিচেফ

1
হ্যাঁ, এটি একটি বিটা অ্যাপ্লিকেশনটির জন্য একটি ক্রেজি নম্বর। বিটিডাব্লু, এই অসমতাগুলি মোটেও ভাল বিরতি তৈরি করতে পারে না, কারণ তারা সমস্ত বিতরণের উপর চূড়ান্ত হয় (নির্দিষ্ট বাধাগুলি সন্তুষ্ট করে)।
whuber

@ শুভ: আপনি ঠিক বলেছেন, তারা পাগল সংখ্যা। আমার নিষ্পাপ অ্যালগরিদম দিয়ে, "বুদ্ধিমান" সংখ্যাগুলি সহজ ছিল এবং ভালভাবে কাজ করেছিল, তবে "পাগল" পরামিতিগুলির জন্য এটি কীভাবে গণনা করা যায় তা কল্পনা করতে পারি না। সুতরাং প্রশ্ন।
নিকি

2
ঠিক আছে, আপনি ঠিক বলেছেন: একবার আলফা + বিটা 10 ^ 30 বা তার বেশি হয়ে গেলে আপনার দ্বিগুণ :-) নিয়ে সমস্যা হবে। (তবে আপনি যদি ঠ এবং আলফা / (আলফা + + বিটা) এর গড় থেকে পার্থক্য যেমন দ প্রতিনিধিত্ব, তুমি ভাল না হওয়া পর্যন্ত আলফা বা বিটা 10 ^ 303 সম্পর্কে অতিক্রম হবেন।)
whuber

1

যদি একটি বিটা বিতরণযোগ্য পরিবর্তনশীল হয় তবে এটি এর লগ-প্রতিক্রিয়া (যেমন: প্রায় সাধারণত বিতরণ করা হয় উচ্চ স্কু বিটা বিতরণের ক্ষেত্রেওp l o g ( p / ( 1 - p ) ) m i n ( α , β ) > 100pplog(p/(1p))min(α,β)>100

উদাহরণ স্বরূপ

f <- function(n, a, b) {
    p <- rbeta(n, a, b)
    lor <- log(p/(1-p))
    ks.test(lor, 'pnorm', mean(lor), sd(lor))$p.value
}
summary(replicate(50, f(10000, 100, 1000000)))

সাধারণত একটি আউটপুট উত্পাদন করে

সারাংশ (প্রতিলিপি (50, চ (10000, 100, 1000000))) ন্যূনতম। 1 ম Qu। মিডিয়ান মানে তৃতীয় কো। সর্বোচ্চ। 0.01205 0.10870 0.18680 0.24810 0.36170 0.68730

অর্থাত্ আদর্শ পি-মানগুলি 0.2 এর কাছাকাছি।

এমনকি 10000 নমুনা সহও কোলমোগোরভ-স্মারনভ পরীক্ষায় সহ একটি উচ্চ স্কিউ বিটা বিতরণযোগ্য ভেরিয়েবলের লগ প্রতিক্রিয়া অনুপাতের রূপান্তরকে আলাদা করার ক্ষমতা নেই ।α=100,β=100000

তবে বিতরণের উপর একটি অনুরূপ পরীক্ষা নিজেইp

f2 <- function(n, a, b) {
    p <- rbeta(n, a, b)
    ks.test(p, 'pnorm', mean(p), sd(p))$p.value
}
summary(replicate(50, f2(10000, 100, 1000000)))

যেমন কিছু উত্পাদন

summary(replicate(50, f2(10000, 100, 1000000)))
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
2.462e-05 3.156e-03 7.614e-03 1.780e-02 1.699e-02 2.280e-01 

সাধারণ পি-মানগুলির সাথে প্রায় 0.01

আর qqnormফাংশনটি একটি সহায়ক ভিজ্যুয়ালাইজেশন দেয়, লগ-প্রতিক্রিয়া বিতরণের জন্য খুব সোজা লাগার প্লট তৈরি করে যা বিটা ডিজিট্রিবিউট ভেরিয়েবলের বিতরণের আনুমানিক স্বাভাবিকতা নির্দেশ করে যা অ-স্বাভাবিকতা নির্দেশ করে একটি স্বতন্ত্র বাঁক উত্পাদন করে

অতএব উভয়ই 100 এর বেশি হওয়া সত্ত্বেও উচ্চ স্কিঙ্কযুক্ত মানগুলির জন্য লগ-প্রতিকূল স্থানে গাউসীয় অনুমান ব্যবহার করা যুক্তিসঙ্গত ।α,β

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.