অন্যান্য বিশ্লেষণের চেয়ে আগে বৈধ অধিকার বিশ্লেষণের বৈধতা কী?


26

পটভূমি এবং অভিজ্ঞতা অভিজ্ঞতা

আমার দুটি গবেষণা আছে; আমি একটি পরীক্ষা চালিয়েছি (স্টাডি 1) এবং তারপরে এটি প্রতিলিপি করেছি (স্টাডি 2)। অধ্যয়ন 1 এ, আমি দুটি ভেরিয়েবলের মধ্যে একটি মিথস্ক্রিয়া পেয়েছি; অধ্যয়ন 2-এ, এই মিথস্ক্রিয়াটি একই দিকে ছিল কিন্তু তাৎপর্যপূর্ণ নয়। স্টাডি 1 এর মডেলের সংক্ষিপ্তসার এখানে:

Coefficients:
                        Estimate Std. Error t value Pr(>|t|)    
(Intercept)              5.75882    0.26368  21.840  < 2e-16 ***
condSuppression         -1.69598    0.34549  -4.909 1.94e-06 ***
prej                    -0.01981    0.08474  -0.234  0.81542    
condSuppression:prej     0.36342    0.11513   3.157  0.00185 ** 

এবং স্টাডি 2 এর মডেল:

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)           5.24493    0.24459  21.444   <2e-16 ***
prej                  0.13817    0.07984   1.731   0.0851 .  
condSuppression      -0.59510    0.34168  -1.742   0.0831 .  
prej:condSuppression  0.13588    0.11889   1.143   0.2545  

"আমি অনুমান করি যে আমার কাছে কিছুই নেই," বলার পরিবর্তে, আমি অনুলিপি করতে ব্যর্থ হয়েছি, "" আমি যা করেছি তা দুটি তথ্য সেটকে একত্রিত করে, অধ্যয়ন থেকে প্রাপ্ত গবেষণার জন্য একটি ডামি ভেরিয়েবল তৈরি করেছিল এবং তারপরে ইন্টারঅ্যাকশন চালিয়েছে আবার অধ্যয়নের জন্য ডামি ভেরিয়েবল নিয়ন্ত্রণ করার পরে। এটি নিয়ন্ত্রণ করার পরেও এই মিথস্ক্রিয়াটি তাৎপর্যপূর্ণ ছিল এবং আমি দেখতে পেলাম যে অবস্থা এবং অপছন্দ / প্রেজের মধ্যে এই দ্বি-মুখী মিথস্ক্রিয়াটি অধ্যয়নের ডামি ভেরিয়েবলের সাথে ত্রি-মুখী মিথস্ক্রিয়া দ্বারা যোগ্য নয়।

বায়েশিয়ান বিশ্লেষণ উপস্থাপন করছি

আমার কারও কাছে পরামর্শ ছিল যে এটি বেয়েশিয়ার বিশ্লেষণ ব্যবহার করার একটি দুর্দান্ত সুযোগ: অধ্যয়ন 2 এ আমার কাছে অধ্যয়ন 1 থেকে তথ্য রয়েছে যা আমি পূর্বের তথ্য হিসাবে ব্যবহার করতে পারি! এইভাবে, স্টাডি 2 একটি ঘন ঘন বিশেষজ্ঞের কাছ থেকে আপডেট করা একটি বয়েশিয়ান আপডেট করছে, স্টাডি 1-এ সাধারণ ন্যূনতম স্কোয়ারের ফলাফল হয় So সাধারণ আগে যেখানে অধ্যয়ন 1 এ গড় অনুমান করা হয়েছিল এবং স্টাড 1-এ স্ট্যান্ডার্ড বিচ্যুতি ছিল স্ট্যান্ডার্ড ত্রুটি।

এটি ফলাফলের সংক্ষিপ্তসার:

Estimates:
                       mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)             5.63    0.17    5.30    5.52    5.63    5.74    5.96
condSuppression        -1.20    0.20   -1.60   -1.34   -1.21   -1.07   -0.80
prej                    0.02    0.05   -0.08   -0.01    0.02    0.05    0.11
condSuppression:prej    0.34    0.06    0.21    0.30    0.34    0.38    0.46
sigma                   1.14    0.06    1.03    1.10    1.13    1.17    1.26
mean_PPD                5.49    0.11    5.27    5.41    5.49    5.56    5.72
log-posterior        -316.40    1.63 -320.25 -317.25 -316.03 -315.23 -314.29

দেখে মনে হচ্ছে এখন অধ্যয়ন 2 বিশ্লেষণ থেকে ইন্টারঅ্যাক্ট করার জন্য আমাদের কাছে বেশ শক্ত প্রমাণ রয়েছে। এটি আমি যা করেছি তার সাথে একমত যখন আমি কেবল একে অপরের উপরে ডেটা স্ট্যাক করে এবং একটি ডামি-ভেরিয়েবল হিসাবে অধ্যয়ন সংখ্যা সহ মডেলটি চালিত করি।

পাল্টা: আমি যদি স্টাডি 2 রান করতাম তবে কী হবে?

এটি আমাকে ভাবতে পেরেছিল: আমি যদি প্রথমে স্টাডি 2 চালাতাম এবং তারপরে অধ্যয়ন 2 এর উপর আমার বিশ্বাস আপডেট করার জন্য অধ্যয়ন 1 এর ডেটা ব্যবহার করতাম? আমি উপরের মতো একই জিনিসটি করেছি, তবে বিপরীতে: আমি অধ্যয়ন 1 এর ডেটা বিশ্লেষণের পূর্ববর্তী উপায় এবং স্ট্যান্ডার্ড বিচ্যুতি হিসাবে ঘন ঘন বিশেষজ্ঞ, সাধারণ ন্যূনতম স্কোয়ার সহগ অনুমান এবং স্টাডি 2 এর স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করে স্টাডি 1 ডেটা পুনরায় বিশ্লেষণ করেছি। সংক্ষিপ্ত ফলাফলগুলি ছিল:

Estimates:
                          mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)                5.35    0.17    5.01    5.23    5.35    5.46    5.69
condSuppression           -1.09    0.20   -1.47   -1.22   -1.09   -0.96   -0.69
prej                       0.11    0.05    0.01    0.08    0.11    0.14    0.21
condSuppression:prej       0.17    0.06    0.05    0.13    0.17    0.21    0.28
sigma                      1.10    0.06    0.99    1.06    1.09    1.13    1.21
mean_PPD                   5.33    0.11    5.11    5.25    5.33    5.40    5.54
log-posterior           -303.89    1.61 -307.96 -304.67 -303.53 -302.74 -301.83

আবার, আমরা একটি মিথস্ক্রিয়া জন্য প্রমাণ দেখতে, যাইহোক এটি সম্ভবত প্রয়োজন হয় না। মনে রাখবেন যে উভয় বেইসিয়ান বিশ্লেষণের জন্য পয়েন্টের প্রাক্কলন এমনকি একে অপরের 95% বিশ্বাসযোগ্য ব্যবধানেও নয়; বায়েশিয়ান বিশ্লেষণের দুটি বিশ্বাসযোগ্য ব্যবধান ওভারল্যাপের চেয়ে বেশি অ-ওভারল্যাপ করে।

সময়ের নজির জন্য বায়েশিয়ান ন্যায়সঙ্গত কি?

আমার প্রশ্ন এইভাবে: বায়েসীয়রা কীভাবে তথ্য সংগ্রহ এবং বিশ্লেষণ করা হয়েছিল তার কালানুক্রমিক সম্মানের পক্ষে যুক্তিযুক্ত কি? আমি অধ্যয়ন 1 থেকে ফলাফল পেয়েছি এবং তাদের অধ্যয়ন 2-তে তথ্যমূলক প্রিয়ার হিসাবে ব্যবহার করি যাতে আমি আমার বিশ্বাসকে "আপডেট" করতে স্টাডি 2 ব্যবহার করি। তবে যদি আমরা ধরে নিই যে আমি প্রাপ্ত ফলাফলগুলি এলোমেলোভাবে একটি সত্য জনসংখ্যার প্রভাব সহ একটি বিতরণ থেকে নেওয়া হয়েছে ... তবে আমি কেন স্টাডি 1 এর ফলাফলগুলিকে বিশেষাধিকার দেব? অধ্যয়ন 1 এর ফলাফলকে প্রাইয়ার হিসাবে স্টাডি 2 ফলাফলের পরিবর্তে অধ্যয়ন 2 এর প্রিয়ার হিসাবে স্টাডি 1 ফলাফল ব্যবহার করার যৌক্তিকতা কী? বিশ্লেষণগুলি যেভাবে আমি সংগ্রহ করেছি এবং গণনা করেছি তা কি সত্যই গুরুত্বপূর্ণ? আমার মনে হয় না should এটার জন্য বায়েশীয় ন্যায়সঙ্গত কি? আমি কেন বিশ্বাস করব যে বিন্দুটি অনুমান করা .34 এর চেয়ে বেশি .34 এর কাছাকাছি যেহেতু আমি প্রথম স্টাডিটি প্রথম চালিয়েছি?


কোডিওলজিস্টের উত্তরে সাড়া দেওয়া

কোডিওলজিস্ট মন্তব্য করেছেন:

বায়েসীয় সম্মেলন থেকে আপনি যে গুরুত্বপূর্ণ প্রস্থান করেছেন তার দ্বিতীয়টির উল্লেখ points আপনি প্রথমে কোনও সেট সেট করেন নি এবং তারপরে বায়েশিয়ান ফ্যাশনে দুটি মডেলই ফিট করে। আপনি একটি মডেল বেইশিয়ান ফ্যাশনে ফিট করেছেন এবং তারপরে অন্য মডেলের প্রিয়ারদের জন্য এটি ব্যবহার করেছেন। আপনি যদি প্রচলিত পদ্ধতির ব্যবহার করেন তবে আপনি এখানে যে আদেশটি দেখেছেন তার উপর নির্ভরতা দেখতে পাবেন না।

N(0,5)condprej

এই অনুমানগুলির গড় অনুমান এবং স্ট্যান্ডার্ড বিচ্যুতি ওএলএস রিগ্রেশন-এর মতোই। অধ্যয়ন 1:

Estimates:
                       mean     sd       2.5%     25%      50%      75%      97.5% 
(Intercept)             5.756    0.270    5.236    5.573    5.751    5.940    6.289
condSuppression        -1.694    0.357   -2.403   -1.925   -1.688   -1.452   -0.986
prej                   -0.019    0.087   -0.191   -0.079   -0.017    0.040    0.150
condSuppression:prej    0.363    0.119    0.132    0.282    0.360    0.442    0.601
sigma                   1.091    0.057    0.987    1.054    1.088    1.126    1.213
mean_PPD                5.332    0.108    5.121    5.259    5.332    5.406    5.542
log-posterior        -304.764    1.589 -308.532 -305.551 -304.463 -303.595 -302.625

এবং অধ্যয়ন 2:

Estimates:
                       mean     sd       2.5%     25%      50%      75%      97.5% 
(Intercept)             5.249    0.243    4.783    5.082    5.246    5.417    5.715
condSuppression        -0.599    0.342   -1.272   -0.823   -0.599   -0.374    0.098
prej                    0.137    0.079   -0.021    0.084    0.138    0.192    0.287
condSuppression:prej    0.135    0.120   -0.099    0.055    0.136    0.214    0.366
sigma                   1.132    0.056    1.034    1.092    1.128    1.169    1.253
mean_PPD                5.470    0.114    5.248    5.392    5.471    5.548    5.687
log-posterior        -316.699    1.583 -320.626 -317.454 -316.342 -315.561 -314.651

যেহেতু এই মাধ্যমগুলি এবং মানক বিচ্যুতিগুলি ওএলএসের অনুমানের হিসাবে কম বা কম একই, তাই উপরের ক্রমের প্রভাব এখনও ঘটে। অধ্যয়ন 2 বিশ্লেষণ করার সময় আমি যদি স্টাডি 1 থেকে প্রিরিয়ারগুলিতে উত্তরোত্তর সংক্ষিপ্ত পরিসংখ্যানগুলি প্লাগ-ইন করি তবে আমি অধ্যয়ন 2 টি বিশ্লেষণ করার আগে এবং তারপরে অধ্যয়ন 1 বিশ্লেষণের জন্য প্রিয়ার হিসাবে সেই উত্তরবর্তী সংক্ষিপ্ত পরিসংখ্যানগুলি ব্যবহার করার চেয়ে আলাদা চূড়ান্ত উত্তরোত্তর পর্যবেক্ষণ করি।

এমনকি আমি যখন ঘন ঘন ঘনতান্ত্রিক অনুমানের পরিবর্তে বায়িশিয়ান উপায় এবং প্রবণতা সহগের জন্য প্রমিত হিসাবে মানক বিচ্যুতি ব্যবহার করি, তখনও আমি একই আদেশের প্রভাবটি পর্যবেক্ষণ করব। সুতরাং প্রশ্নটি রয়ে গেছে: প্রথম যে অধ্যয়নটি সুযোগ পেয়েছে বায়েশীয়দের যৌক্তিকতা কী?


2
"আমি এখনও একই পরিস্থিতিতে থাকব। সুতরাং প্রশ্নটি রয়ে গেছে: প্রথম যে গবেষণাটি হয়েছে তার সুযোগ পাওয়ার জন্য বায়সিয়ান যুক্তি কী?" - হাহ? কোন অর্থে আপনি এখনও অধ্যয়ন 1 এর সুযোগ পাচ্ছেন? আপনি এখানে বা বিপরীত ক্রমে বর্ণিত হিসাবে দুটি মডেল ফিট করতে পারেন এবং যেমন আপনার চূড়ান্ত প্রাক্কলন হিসাবে প্রকৃত জনসংখ্যার সহগ prejএকইভাবে হওয়া উচিত, যদি না আমি আপনার পদ্ধতিটি ভুল বুঝছি।
কোডিওলজিস্ট

প্রক্রিয়া সম্পর্কে আরও কিছু সহ আমি স্পষ্টতার জন্য কোডিওলজিস্ট সম্পাদনা করেছি।
মার্ক হোয়াইট

1
কোভেরিয়েন্স ম্যাট্রিক্স এবং ত্রুটি সম্পর্কে কী? আপনি সম্পূর্ণ নতুন যৌথ উত্তরোত্তর আপনার নতুন পূর্ব হিসাবে ব্যবহার করতে হবে।
Scortchi - পুনর্বহাল মনিকা

আমি মনে করি @ স্কোর্টচি বিঙ্গো — এটাই সঠিক উত্তর, এবং উন্টবু এর উত্তর আমাকে বিশ্বাস করতে পরিচালিত করেছিল। আমি যা করেছি তা হ'ল আপডেটের সত্যিকারের অশোধিত সংস্করণ: আমি সংক্ষিপ্ত পরিসংখ্যান নিয়েছি, পুরো যৌথ উত্তরের নয়। এটি প্রশ্নটির ইঙ্গিত দেয়: পুরো যৌথ পশ্চাতকে পূর্বের rstanarmবা স্ট্যান হিসাবে অন্তর্ভুক্ত করার কোনও উপায় আছে কি ? দেখে মনে হচ্ছে এমন প্রশ্ন এখানে আগেই জিজ্ঞাসা করা হয়েছে: stats.stackexchange.com/questions/241690/…
মার্ক হোয়াইট

1
যদি আপনি সহগের জন্য গাউসীয় প্রিরিয়ার্স (এবং স্বাধীনতা?) এবং বৈকল্পিকতার জন্য একটি বিপরীত গামা শুরু করছেন, তবে আপনি আগে একটি স্বাভাবিক বিপরীত গামা পেয়ে যাবেন এবং এটি সংযোগযুক্ত। আপডেট সমীকরণ সন্ধান করুন।
Scortchi - পুনর্বহাল মনিকা

উত্তর:


22

বেয়েসের উপপাদ্য বলেছে উদ্ধার posteriorকরার prior * likelihoodপরে এটি সমান (তাই সম্ভাবনাটি 1 এর সমান )। প্রতিটি পর্যবেক্ষণে একটি থাকে likelihoodযা আপডেট করে priorনতুন তৈরি করতে ব্যবহার করা যেতে পারে posterior:

posterior_1 = prior * likelihood_1
posterior_2 = posterior_1 * likelihood_2
...
posterior_n = posterior_{n-1} * likelihood_n

যাতে

posterior_n = prior * likelihood_1 * ... * likelihood_n

গুণটির পরিবর্তনশীলতা বোঝায় যে আপডেটগুলি কোনও ক্রমে করা যেতে পারে । সুতরাং আপনি যদি একক আগে থেকে শুরু করেন, আপনি অধ্যয়ন 1 এবং অধ্যয়ন 2 এর পর্যবেক্ষণগুলি কোনও ক্রমে মিশ্রিত করতে পারেন, বেয়েসের সূত্র প্রয়োগ করতে পারেন এবং একই ফাইনালে পৌঁছাতে পারেন posterior


1
নিখুঁত জ্ঞান তোলে। সুতরাং এই তাত্পর্য হওয়ার সম্ভাব্য কারণের দিকে এটি নির্দেশ করে: আমি যেভাবে আমার বিশ্লেষণ করেছি (পরবর্তী গবেষণার পূর্ববর্তী যুক্তিতে প্লাগ পোস্টেরিয়র সারসংক্ষেপের পরিসংখ্যান) কীভাবে আপডেটিং কাজ করে না? তা হ'ল: পরবর্তী বিশ্লেষণের প্রিয়ারগুলিতে কেবল এর থেকে সংক্ষিপ্ত পরিসংখ্যানকে প্লাগইন করে নয়, আমার উত্তরোত্তর সম্পূর্ণতা বিবেচনা করা উচিত। সঠিক?
মার্ক হোয়াইট

4
নিবন্ধন করুন আপনার প্রথম বিশ্লেষণের উত্তর পোস্টগুলি দ্বিতীয়টির জন্য আপনার প্রিয়ার হওয়া উচিত।
কোডিওলজিস্ট

4
উত্তরোত্তর সম্পর্কে @ কোডিওলজিস্ট এবং সারাংশের পরিসংখ্যান! = উত্তরোত্তর
মার্ক হোয়াইট

নিবন্ধন করুন
কোডিওলজিস্ট

22

প্রথমে আমার এটি উল্লেখ করা উচিত:

  1. p
  2. আপনি অধ্যয়ন 1 এর ফলাফলগুলিতে সেই নমুনা থেকে নিজের অনুসন্ধানগুলি সরাসরি কারাগারে অনুবাদ করে অনেক বিশ্বাস স্থাপন করছেন। মনে রাখবেন, পূর্ববর্তী কেবল অতীত অনুসন্ধানের প্রতিচ্ছবি নয়। পূর্ববর্তী আবিষ্কারের পূর্বে আপনার বিশ্বাসগুলি সহ এটি আপনার পূর্ববর্তী বিশ্বাসের সম্পূর্ণতা এনকোড করা দরকার। যদি আপনি স্বীকার করেন যে স্টাডি 1 তে নমুনা ত্রুটির পাশাপাশি মডেল অনিশ্চয়তার মতো অন্যান্য ধরণের স্বল্প পরিমাণে অনিশ্চয়তা জড়িত, আপনি আরও রক্ষণশীল পূর্বে ব্যবহার করা উচিত।

বায়েসীয় সম্মেলন থেকে আপনি যে গুরুত্বপূর্ণ প্রস্থান করেছেন তার দ্বিতীয়টির উল্লেখ points আপনি প্রথমে কোনও সেট সেট করেন নি এবং তারপরে বায়েশিয়ান ফ্যাশনে দুটি মডেলই ফিট করে। আপনি একটি মডেল বেইশিয়ান ফ্যাশনে ফিট করেছেন এবং তারপরে অন্য মডেলের প্রিয়ারদের জন্য এটি ব্যবহার করেছেন। আপনি যদি প্রচলিত পদ্ধতির ব্যবহার করেন তবে আপনি এখানে যে আদেশটি দেখেছেন তার উপর নির্ভরতা দেখতে পাবেন না।


1. আমি কীভাবে একটি ভিন্ন মডেলের সাথে নেতিবাচক ফলাফল অনুসরণ করতে পারি? "নেতিবাচক ফলাফল" বলতে কী বোঝ? যতক্ষণ অধ্যয়ন-প্রকারের টাইপ আই ত্রুটির হার, এটি দুটি পৃথক অধ্যয়ন যা একে অপরের থেকে পৃথক সপ্তাহে পরিচালিত হয়। যেভাবেই হোক, আমি অনুসন্ধানের ডেটা বিশ্লেষণ করতে বিশ্বাস করি, তাই আমি কখনই অনুভব করি না যে অনুশীলনে পি-মানগুলি "সঠিক" বা আমাদের এগুলি "সম্পূর্ণ সঠিক" হওয়া উচিত বলে আশা করা উচিত। লোকেরা যদি কেবল তাদের আগে যা পরীক্ষা করে দেখেছিল, সেগুলি করত তবে আমরা দুর্ঘটনার দ্বারা ঘটে যাওয়া প্রচুর দুর্দান্ত ফলাফলগুলি মিস করব — এবং আমরা প্রচুর ডেটা নষ্ট করব।
মার্ক হোয়াইট

2
p

1
২. হ্যাঁ, তবে আপনি স্টাডি ২-এর বিভিন্ন কারাগারের সাথে সমাপ্ত হবেন, যা স্টাডি 1 সঠিক ছিল এই ধারণার মধ্যে এত বেশি বিশ্বাস স্থাপনের সাথে শেষ হয়নি।
কোডিওলজিস্ট 18

1
১. সমস্যাটি নয় যে আপনি আরও ডেটা সংগ্রহ করেছেন এবং এটি বিশ্লেষণ করেছেন না, তবে আপনি উভয় স্টাডির (নতুন প্রেডিকটারের সাথে একীভূত মডেল সহ) ডেটাটিকে পুনঃসংশ্লেষিত করেছেন কারণ আপনি দ্বিতীয় ডেটাसेटটি প্রথমবার বিশ্লেষণ করলে নেতিবাচক ফলাফল পেয়েছিলেন। তাত্পর্য নিরীক্ষা আসলে দরকারী বলে বিশ্বাস করার কারণ আমি কখনও দেখিনি, তবে যারা বিশ্বাস করেন তাদের বেশিরভাগই মনে করেন যে তাৎপর্য-পরীক্ষার সম্পর্কে সমস্ত তত্ত্বগুলিই এর কার্যকারিতা সমর্থন করে এবং সমস্ত উপপাদীর মতো উপপাদ্যও এর প্রয়োজনীয়তা সমর্থন করে তাদের সিদ্ধান্ত নেওয়ার জন্য নির্দিষ্ট প্রাঙ্গণ।
কোডিওলজিস্ট

1
@ কোডিওলজিস্ট - আপনি যদি ভাবেন না যে তাৎপর্য পরীক্ষা করা কখনই দরকারী, তবে আপনি কীসের ভিত্তিতে সন্দেহজনক (উদাহরণস্বরূপ) যে গবেষক এই সিদ্ধান্তে পৌঁছেছেন যে বেশিরভাগ লোকের নীল চোখ রয়েছে কারণ তাদের দু'জনের নমুনায় সবাই করেছেন?
ওবি 2.0

4

আমি ভেবেছিলাম যে ফ্রিকোয়েন্সিস্ট থেকে বায়েশিয়ান পদ্ধতিতে যাওয়া কেন বিপজ্জনক হতে পারে এবং সংক্ষিপ্ত পরিসংখ্যান ব্যবহার কেন সমস্যা তৈরি করতে পারে তা আপনাকে দেখানোর জন্য আমি একটি ভিন্ন, তবে স্টাইলাইজড সমস্যা সহ কয়েকটি গ্রাফ তৈরি করতে পারি।

আপনার উদাহরণটি, যা বহুমাত্রিক, ব্যবহার করার পরিবর্তে আমি এটিকে দুটি মাত্রার সাথে অধ্যয়ন করতে যাচ্ছি যার আকার তিনটি পর্যবেক্ষণ এবং তিনটি পর্যবেক্ষণ।

1π11+(xθ)2.

আমি এটি ব্যবহার করছি কারণ কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রযোজ্য নয়, এতে পর্যাপ্ত পরিসংখ্যানের অভাব রয়েছে, চূড়ান্ত পর্যবেক্ষণগুলি সাধারণ, চেবিচেভের বৈষম্য ধরে নেই এবং পুরোপুরি কার্যকরভাবে কার্যকর সমাধানগুলি সম্পূর্ণ পৃথক হয়ে যায়। আমি এটি ব্যবহার করছি কারণ সমস্যাটিতে খুব বেশি কাজ না করে এটি দুর্দান্ত উদাহরণ তৈরি করে।

{5,1,4}{1.5,1,.5}±669σ±3σ

দুটি পৃথক স্টাডির উত্তর ঘনত্ব হয় বায়েশিয়ান পৃথক পোস্টারিয়র

দৃশ্যত সুস্পষ্ট হিসাবে, নমুনা এক থেকে সংক্ষিপ্ত পরিসংখ্যান নেওয়া অবিশ্বাস্যভাবে বিভ্রান্তিকর হতে পারে। আপনি যদি সুন্দর, অবিমোহিত, সু-সংজ্ঞায়িত এবং নামযুক্ত ঘনত্বগুলি দেখতে অভ্যস্ত হন তবে তা দ্রুত বয়েশিয়ান সরঞ্জামগুলির সাহায্যে দরজাটি বাইরে যেতে পারে। এটির মতো কোনও নামকরণের বিতরণ নেই, তবে আপনি অবশ্যই এটি সংক্ষিপ্ত পরিসংখ্যান সহ বর্ণনা করতে পারতেন যদি আপনি দৃষ্টিভঙ্গি না দেখে থাকেন। সংক্ষিপ্তসার পরিসংখ্যান ব্যবহার করা যদি সমস্যা হয় তবে আপনি যদি এটি ব্যবহার করতে যাচ্ছেন একটি নতুন পূর্ব তৈরি করতে।

উভয় নমুনার জন্য ফ্রিকোয়েন্সিস্ট আত্মবিশ্বাস বিতরণ একই। কারণ স্কেলটি জানা যায়, একমাত্র অজানা প্যারামিটারটি হ'ল মিডিয়ান। তিনটির একটি নমুনা আকারের জন্য, মাঝারিটি হ'ল এমভিইউ। যখন কচী বিতরণের কোনও উপায় বা তাত্পর্য নেই, তবে মধ্যস্থদের নমুনা বিতরণটি করে। এটি সর্বাধিক সম্ভাবনা অনুমানের চেয়ে কম দক্ষ তবে এটি গণনা করতে আমার কোনও প্রচেষ্টা লাগে না। বড় নমুনা আকারের জন্য রথেনবার্গের পদ্ধতিটি এমভিইউ এবং মাঝারি নমুনা আকারের সমাধানও রয়েছে।

ফ্রিকোয়েন্সিস্ট বিতরণের জন্য, আপনি পান ঘন ঘন আত্মবিশ্বাস বিতরণ।

Pr(x|θ)Pr(θ|x)

x

যৌথ পোস্টেরিয়র হ'ল উভয় পোস্টারিয়রের পণ্য এবং গুণনের সাহচর্য দ্বারা, আপনি কোন আদেশটি ব্যবহার করেন তা বিবেচ্য নয়। দৃশ্যত, যৌথ পোস্টারিয়র হয় যৌথ এবং পৃথক পোস্টারিয়র

এটা স্পষ্ট যে আপনি পোস্টারিয়রগুলিতে কিছু সরল বিতরণ চাপিয়ে দিয়েছিলেন এবং তাদের সংক্ষিপ্ত পরিসংখ্যান ব্যবহার করেছেন, সম্ভবত আপনি অন্যরকম উত্তর পেয়ে যাবেন। আসলে, এটি একটি খুব আলাদা উত্তর হতে পারে। যদি 70% বিশ্বাসযোগ্য অঞ্চলটি একের জন্য অধ্যয়নের জন্য ব্যবহৃত হয়, তবে এটি একটি সংযোগ বিচ্ছিন্ন বিশ্বাসযোগ্য অঞ্চলে পরিণত হত। বিচ্ছিন্ন বিরতিগুলির অস্তিত্ব কখনও কখনও বায়েশিয়ান পদ্ধতিতে ঘটে। সবচেয়ে বেশি ঘনত্বের ব্যবধানের গ্রাফিক এবং এক অধ্যয়নের জন্য সর্বনিম্ন ঘনত্বের বিরতিএইচডিআর বনাম এলডিআর

আপনি লক্ষ্য করবেন যে এইচডিআর কোনও অঞ্চলের স্লাইভ দ্বারা ভেঙে গেছে যা বিশ্বাসযোগ্য সেটের বাইরে।

যদিও এই সমস্যাগুলির অনেকগুলি সাধারণত রিগ্রেশন সহ বড় সেটগুলিতে অদৃশ্য হয়ে যায়, তবে আমি আপনাকে একটি প্রাকৃতিক পার্থক্যের একটি উদাহরণ দিচ্ছি যে কীভাবে বায়েশিয়ান এবং ফ্রিকোয়ালিস্ট পদ্ধতিগুলি নিপীড়নের ক্ষেত্রে অনুপস্থিত ভেরিয়েবলগুলি পরিচালনা করবে।

একটি অনুপস্থিত ভেরিয়েবল, আবহাওয়া সহ একটি ভাল নির্মিত রিগ্রেশন বিবেচনা করুন। আসুন আমরা ধরে নিই যে গ্রাহকরা বর্ষার দিন এবং রোদগ্রস্ত দিনগুলিতে আলাদা আচরণ করে। যদি এই পার্থক্যটি যথেষ্ট হয় তবে খুব সহজেই দুটি বায়সীয় উত্তরোত্তর মোড থাকতে পারে। একটি মোড রৌদ্রের আচরণকে প্রতিফলিত করে, অন্যটি বৃষ্টিপাত। আপনি জানেন না কেন আপনার দুটি মোড রয়েছে। এটি একটি পরিসংখ্যানগত রান হতে পারে বা এটি কোনও অনুপস্থিত ডেটা পয়েন্ট হতে পারে, তবে হয় আপনার নমুনাটি অস্বাভাবিক বা আপনার মডেলটির একটি বাদ দেওয়া পরিবর্তনশীল রয়েছে has

ফ্রিকোয়েনসিস্ট সমাধানটি দুটি রাজ্যের গড় হিসাবে বিবেচিত হবে এবং এমন একটি অঞ্চলে রিগ্রেশন লাইন স্থাপন করতে পারে যেখানে কোনও গ্রাহক আচরণ প্রকৃতপক্ষে ঘটে না, তবে এটি দুটি ধরণের আচরণকে গড়ে তোলে। এটি নিম্নমুখীও থাকবে। সমস্যাগুলি অবশিষ্টাংশগুলির বিশ্লেষণে ধরা পড়তে পারে, বিশেষত যদি সত্য বৈকল্পিকগুলির মধ্যে একটি বড় পার্থক্য রয়েছে, তবে তা নাও পারে। এটি অবশিষ্টাংশগুলির মধ্যে এমন অদ্ভুত ছবিগুলির মধ্যে একটি হতে পারে যা সময়ে সময়ে ক্রস-যাচাই করা হবে।

একই তথ্য থেকে আপনার দুটি পৃথক পোস্টারিয়র রয়েছে তার থেকে বোঝা যায় যে আপনি দুজনকে সরাসরি একসাথে গুন করেননি। হয় আপনি একটি ফ্রিকোয়েন্সিস্ট সমাধান থেকে একটি পশ্চাত তৈরি করেছেন যা বাইয়েশিয়ার উত্তরোত্তর দিয়ে একের পর এক মানচিত্র তৈরি করেনি বা আপনি সংক্ষিপ্তসার পরিসংখ্যান থেকে একটি পূর্ব তৈরি করেছেন এবং সম্ভাবনা কার্যটি পুরোপুরি প্রতিসাম্য ছিল না, যা সাধারণ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.