সত্য কি বেইসিয়ানদের টেস্ট সেটের দরকার নেই?

আমি সম্প্রতি এরিক জে মা এর এই আলোচনাটি দেখেছি এবং তার ব্লগের এন্ট্রি পরীক্ষা করেছি , যেখানে তিনি র‌্যাডফোর্ড নীলের উদ্ধৃতি দিয়েছিলেন যে বায়েশিয়ান মডেলগুলি বেশি মানায় না (তবে তারা তুলনামূলকভাবে পারে ) এবং সেগুলি ব্যবহার করার সময় আমাদের সেগুলি বৈধ করার জন্য পরীক্ষার সেটগুলির প্রয়োজন হয় না (কারণ আমার উদ্ধৃতিগুলি প্যারামিটারগুলি সামঞ্জস্য করার জন্য বৈধতা সেট ব্যবহার করার পরিবর্তে কথা বলে মনে হচ্ছে)। সত্যই, যুক্তিগুলি আমাকে বোঝায় না এবং আমার কাছে বইটিতে অ্যাক্সেস নেই, সুতরাং আপনি কি আরও বিবৃত বা কঠোর যুক্তি দিতে পারেন, বা এই জাতীয় বক্তব্যের বিরুদ্ধে?

যাইহোক, এরই মধ্যে, এরিক মা একই আলোচনায় আমাকে এই আলোচনাটি নির্দেশ করেছেন ।

— টিম
সূত্র

এই কথার প্রসঙ্গে এই যুক্তিটির একটি প্রধান গর্ত: আপনি যদি এমসিসিএম করছেন, আপনি যদি পুরোপুরি উত্তরোত্তরটি ঘুরে দেখেন না, তবে আপনার অনুমান সম্পূর্ণ অবৈধ। আপনি যদি কোনও বয়েসিয়ান নিউরাল নেটওয়ার্কের উপর অনুমান করছেন, তবে আপনি অবশ্যই অবশ্যই এমসিসিএম ব্যবহার করে উত্তরের অনেক বড় অংশ অনুসন্ধান করেন নি। অতএব, আপনার অনুমানকে দ্বিগুণ করার জন্য আপনি নিজের ডেটা আরও ভালভাবে বিভক্ত করতে চান!

— ক্লিফ এবি

একটি বিষয় বিবেচনা করতে হবে আমরা মূল্যায়ন বা বৈধতা যা দিচ্ছি? এটি হতে পারে যে আমরা আমাদের সমস্ত তথ্য ব্যবহার করি না (হয় পূর্ব বা সম্ভাবনায়)। মডেল ফিট পরীক্ষা করা এই প্রশ্নের উত্তর দিতে সহায়তা করতে পারে।

— সম্ভাব্যতাব্লোগিক

যদি আমরা কিছু সঠিকভাবে ধরা পড়া পূর্বের তথ্যকে প্রতিফলিত করে "এক প্রকৃত মডেল" এবং "সত্যিকারের প্রিয়ারস" ব্যবহার করি, তবে যতদূর আমি অবগত আছি যে কোনও বায়েশিয়ান সত্যই কোনও উচ্চতর সমস্যা না করে এবং খুব অল্প ডেটা দেওয়া উত্তরোত্তর ভবিষ্যদ্বাণীমূলক বিতরণ যথাযথ অনিশ্চিত হবে will । তবে, যদি আমরা কিছু ধরণের ব্যবহারিকভাবে নির্বাচিত মডেল ব্যবহার করি (যেমন আমরা স্থির করেছি যে বিপদের হার সময়ের সাথে ধ্রুবক এবং তাত্পর্যপূর্ণ মডেল যথাযথ বা উদাহরণস্বরূপ যে কিছু কোভারিয়েট গুণমান শূন্যের মডেল = বিন্দুতে নেই) কিছু সহ ডিফল্ট অননুমোদিত বা নিয়মিত নিয়ন্ত্রিত, তবে এটি এখনও প্রযোজ্য কিনা তা আমরা সত্যিই জানি না। সেক্ষেত্রে (হাইপার-) প্রিরিয়ারদের নির্বাচনের ক্ষেত্রে কিছুটা স্বেচ্ছাচারিতা রয়েছে যা নমুনা পূর্বাভাসগুলির থেকে ভাল ফলাফল করতে পারে বা নাও পারে।

সুতরাং, নির্বাচিত সম্ভাবনার সাথে সম্মিলিতভাবে হাইপারপ্যারমিটার পছন্দ (হাইপারপ্রায়ারগুলির = = পরামিতি) ভাল সম্পাদন করবে কিনা তা প্রশ্ন করা খুব যুক্তিসঙ্গত। আসলে, আপনি সহজেই সিদ্ধান্ত নিতে পারেন যে কিছু পছন্দসই পূর্বাভাস কর্মক্ষমতা অর্জন করতে আপনার হাইপারপ্যারামিটারগুলি টিউন করা ভাল ধারণা। সেই দৃষ্টিকোণ থেকে হাইপারপ্যারামিটারের টিউন করার জন্য একটি বৈধতা সেট (বা ক্রস-বৈধকরণ) এবং পারফরম্যান্সটি নিশ্চিত করার জন্য পরীক্ষার সেটটি নির্ভুল ধারণা তৈরি করে।

আমি মনে করি এটি তার ব্লগে অ্যান্ড্রু গেলম্যানের বেশ কয়েকটি আলোচনার সাথে নিবিড়ভাবে সম্পর্কিত (যেমন ব্লগ এন্ট্রি 1 , ব্লগ এন্ট্রি 2 , স্ট্যানের জন্য এলইউতে ব্লগ এন্ট্রি 3 এবং উত্তরোত্তর ভবিষ্যদ্বাণীমূলক চেকগুলিতে আলোচনা) দেখুন, যেখানে তিনি তার উদ্বেগগুলির চারপাশে আলোচনা করেছেন (কিছুটা সঠিকভাবে) দাবি করেছে যে কোনও বায়েশিয়ান তাদের মডেলটি বুদ্ধিমান করে এবং ব্যবহারিক বায়েশিয়ান মডেল মূল্যায়ন সম্পর্কে পরীক্ষা করা উচিত নয়।

অবশ্যই, আমরা খুব প্রায়ই সেটিংগুলিতে বায়েশিয়ান পদ্ধতি ব্যবহারে সর্বাধিক আগ্রহী থাকি, যেখানে পূর্বের তথ্য খুব অল্প থাকে এবং আমরা কিছুটা তথ্যমূলক প্রিরিয়ার ব্যবহার করতে চাই। এই মুহুর্তে পরীক্ষার সেটটিতে বৈধতা এবং মূল্যায়নের সাথে কোথাও পর্যাপ্ত তথ্য পাওয়া কিছুটা জটিল হয়ে উঠতে পারে।

— Björn
সূত্র

সুতরাং আমি আপনার উত্সাহের বিষয়ে অতিরিক্ত প্রশ্নের উত্তর দিয়েছি এবং আমি ভিডিওটি দেখেছি এবং ব্লগ পোস্টটি পড়েছি। র‌্যাডফোর্ড নীল বলছেন না যে বায়েশিয়ান মডেলগুলি বেশি মানায় না। আসুন আমরা মনে রাখি যে ওভারফিটিং হ'ল শব্দকে সিগন্যাল হিসাবে বিবেচনা করা হয় এবং প্যারামিটারের প্রাক্কলনকে বোঝানো হয়। এটি মডেল নির্বাচন ত্রুটির একমাত্র উত্স নয়। নীলের আলোচনা আরও বেশি বিস্তৃত যদিও তিনি একটি ছোট্ট নমুনা আকারের ধারণাটি উত্সাহিত করার মাধ্যমে ওভারফিটিংয়ের আলোচনায় উত্সাহিত করেছিলেন।

আমি আমার পূর্ববর্তী পোস্টটিকে আংশিকভাবে সংশোধন করি যে বায়েশিয়ান মডেলগুলি সমস্ত বায়েশিয়ান মডেলগুলির তুলনায় অত্যধিক মানিয়ে নিতে পারে, তবে ভবিষ্যদ্বাণীকে উন্নত করার উপায়ে এমনটি করুন। আবার শব্দের সাথে বিভ্রান্ত সংকেতের সংজ্ঞায় ফিরে যাওয়া, বায়েশিয়ান পদ্ধতিগুলির অনিশ্চয়তা, উত্তরোত্তর বিতরণ, সংকেত কী এবং গোলমাল কী তা সম্পর্কে সেই অনিশ্চয়তার পরিমাপ। এটি করার ক্ষেত্রে, বায়েশিয়ান পদ্ধতিগুলি সিগন্যালের অনুমানগুলিতে শব্দকে আরও বাড়িয়ে দিচ্ছে যেহেতু পুরো পশ্চাতটি অনুমান এবং পূর্বাভাসে ব্যবহৃত হয়। ওভারফিটিং এবং মডেল শ্রেণিবদ্ধকরণ ত্রুটির অন্যান্য উত্সগুলি বায়েসিয়ান পদ্ধতিগুলিতে একটি ভিন্ন ধরণের সমস্যা।

সরলকরণের জন্য আসুন আমরা মা-আলাপের কাঠামো গ্রহণ করি এবং লিনিয়ার প্রতিরোধের দিকে মনোনিবেশ করি এবং গভীর শিক্ষণ আলোচনা এড়িয়ে চলি কারণ তিনি উল্লেখ করেছেন যে বিকল্প পদ্ধতিগুলি তিনি উল্লেখ করেছেন কেবল ফাংশনের রচনা এবং লিনিয়ার যুক্তির মধ্যে একটি সরাসরি যোগসূত্র রয়েছে রিগ্রেশন এবং গভীর শিক্ষা।

নিম্নলিখিত সম্ভাব্য মডেলটি আকারের একটি বিস্তৃত নমুনা তৈরি করতে দেয় দুই subsamples, গঠিত , যেখানে প্রশিক্ষণ সেট করা হয় এবং বৈধতা সেট। আমরা দেখব কেন, কয়েকটি সাবধানের সাপেক্ষে, বয়েশিয়ান পদ্ধতিগুলির জন্য আলাদা প্রশিক্ষণ এবং বৈধতা সেটের প্রয়োজন নেই।

Y = β_{0} + + β_{1} {এক্স}_{1} + + β_{2} {এক্স}_{2} + + β_{3} {এক্স}_{3} ।

$y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3.$

N

$N$

n_{1}, n_{2}

$n_1,n_2$

n_{1}

$n_1$

n_{2}

$n_2$

এই আলোচনার জন্য, আমাদের আরও আটটি পরামিতি তৈরি করতে হবে, প্রতিটি মডেলের জন্য একটি। এইগুলি হল । তারা বহুজাতিক বিতরণ অনুসরণ করে এবং যথাযথ প্রিয়ারগুলি যেমন রিগ্রেশন সহগগুলি হয়। আটটি মডেল এবং $m_1\dots{_8}$

Y = β_{0} + + β_{1} {এক্স}_{1} + + β_{2} {এক্স}_{2} + + β_{3} {এক্স}_{3},

$y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3,$

Y = β_{0},

$y=\beta_0,$

Y = β_{0} + + β_{1} {এক্স}_{1},

$y=\beta_0+\beta_1x_1,$

Y = β_{0} + + β_{2} {এক্স}_{2},

$y=\beta_0+\beta_2x_2,$

Y = β_{0} + + β_{3} {এক্স}_{3},

$y=\beta_0+\beta_3x_3,$

Y = β_{0} + + β_{1} {এক্স}_{1} + + β_{2} {এক্স}_{2},

$y=\beta_0+\beta_1x_1+\beta_2x_2,$

Y = β_{0} + + β_{1} {এক্স}_{1} + + β_{3} {এক্স}_{3},

$y=\beta_0+\beta_1x_1+\beta_3x_3,$

Y = β_{0} + + β_{2} {এক্স}_{2} + + β_{3} {এক্স}_{3},

$y=\beta_0+\beta_2x_2+\beta_3x_3,$

Y = β_{0} + + β_{1} {এক্স}_{1},

$y=\beta_0+\beta_1x_1,$

Y = β_{0} + + β_{2} {এক্স}_{2},

$y=\beta_0+\beta_2x_2,$

Y = β_{0} + + β_{3} {এক্স}_{3} ।

$y=\beta_0+\beta_3x_3.$

এখন আমাদের বায়েশিয়ান এবং ফ্রিকোয়ালিস্ট পদ্ধতিগুলির মধ্যে পার্থক্যের আগাছা নেওয়ার দরকার। প্রশিক্ষণ সংকলনে, ফ্রুসিডুভিস্ট পদ্ধতিগুলি ব্যবহার করে মডেলার কেবল একটি মডেল চয়ন করেন। বায়সিয়ান পদ্ধতি ব্যবহার করে মডেলার এতটা সীমাবদ্ধ নয়। যদিও বায়েশিয়ান মডেলার কেবল একটি মাত্র মডেল সন্ধানের জন্য একটি মডেল নির্বাচনের মানদণ্ড ব্যবহার করতে পারেন, তারাও গড় গড় মডেল ব্যবহার করতে পারেন। বায়েশিয়ান মডেলার বৈধতা বিভাগে মিডিয়াম স্ট্রিমে নির্বাচিত মডেলগুলি পরিবর্তন করতেও নির্দ্বিধায়। মোরেসো, বায়েশিয়ান পদ্ধতি ব্যবহার করে মডেলর নির্বাচন এবং গড়ের মধ্যে মেশা এবং মিল করতে পারেন। $n_1,$

একটি বাস্তব-বিশ্বের উদাহরণ দেওয়ার জন্য, আমি দেউলিয়ার 78 models টি মডেল পরীক্ষা করেছি। Models 78 টি মডেলের মধ্যে them 76 টির সম্মিলিত উত্তরোত্তর সম্ভাবনা ছিল এক শতাংশের প্রায় দশ হাজার th অন্য দুটি মডেল যথাক্রমে প্রায় 54 শতাংশ এবং 46 শতাংশ ছিল। ভাগ্যক্রমে, তারাও কোনও ভেরিয়েবল ভাগ করে নি। এটি আমাকে উভয় মডেল নির্বাচন করতে এবং অন্যান্য ignore 76 টি উপেক্ষা করার অনুমতি দেয়। যখন আমি উভয়ের জন্য সমস্ত ডেটা পয়েন্ট পেয়েছিলাম তখন আমি দুটি মডেলের উত্তরোত্তর সম্ভাবনার উপর ভিত্তি করে তাদের ভবিষ্যদ্বাণীগুলি গড় গড়েছিলাম, যখন আমার কাছে ডেটা পয়েন্টগুলি ছিল না তখন কেবলমাত্র একটি মডেল ব্যবহার করেছি অন্যান্য। আমার কাছে একটি প্রশিক্ষণ সেট এবং বৈধকরণের সেট থাকলেও কোনও ফ্রিকোয়েন্সিস্ট তাদের সাথে একই কারণে তা করেন নি। তদুপরি, দুটি ব্যবসায়ের চক্রের উপরে প্রতিদিন শেষে আমি আমার পোস্টেরিয়রগুলিকে প্রতিটি দিনের ডেটা দিয়ে আপডেট করি। এর অর্থ হ'ল বৈধতা সেটটির শেষে আমার মডেলটি প্রশিক্ষণ সেটটির শেষে মডেল ছিল না। ফ্রিভেনসিস্ট মডেলগুলি করার সময় বায়েশিয়ান মডেলগুলি শেখা বন্ধ করে না।

আরও গভীরে যেতে আমাদের মডেলগুলির সাথে কংক্রিট করা যাক। আসুন আমরা ধরে নিই যে প্রশিক্ষণের নমুনা চলাকালীন সেরা ফিট ফ্রেভেনসিস্ট মডেল এবং বায়েসিয়ান মডেলটি মডেল নির্বাচনের সাথে মিলছে বা, বিকল্পভাবে, মডেল গড়ের মডেল ওজন এতটাই দুর্দান্ত ছিল যে এটি ফ্রিকোয়েন্সিস্ট মডেলের সাথে প্রায় পৃথক পৃথক ছিল। আমরা এই মডেলটিকে আসুন কল্পনাও করুন যে প্রকৃতির প্রকৃত মডেল হ'ল

Y = β_{0} + + β_{1} {এক্স}_{1} + + β_{2} {এক্স}_{2} + + β_{3} {এক্স}_{3} ।

$y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3.$

Y = β_{0} + + β_{1} {এক্স}_{1} + + β_{3} {এক্স}_{3} ।

$y=\beta_0+\beta_1x_1+\beta_3x_3.$

এখন আসুন বৈধতা সেট মধ্যে পার্থক্য বিবেচনা করুন। ফ্রিকোয়েন্সিস্ট মডেলটি ডেটাগুলিতে সজ্জিত। আসুন ধরে নেওয়া যাক যে কোনও কোনও মুহুর্তে যে মডেল নির্বাচন বা বৈধকরণ পদ্ধতিটি প্রকৃতির প্রকৃত মডেলটিতে নির্বাচনটি পরিবর্তিত করেছিল। তদ্ব্যতীত, যদি গড় গড় মডেল ব্যবহার করা হত, তবে প্রকৃতির প্রকৃত মডেলটি মডেলগুলির পছন্দটি পরিষ্কার-কাট হওয়ার অনেক আগেই পূর্বাভাসে ওজন বহন করে। সম্ভাব্যতা তত্ত্ব সম্পর্কে টমিতে ইটি জেনেস এই সমস্যাটি নিয়ে কিছুটা সময় ব্যয় করে। আমার কাজটি বইটি আছে তাই আমি আপনাকে একটি ভাল প্রশংসা পেতে পারি না, তবে আপনার এটি পড়া উচিত। এটির আইএসবিএন 978-0521592710। $n_2^i$

মডেলগুলি বয়েশিয়ান চিন্তার পরামিতি এবং এগুলি এলোমেলো, বা আপনি যদি পছন্দ করেন তবে অনিশ্চিত। বৈধতা প্রক্রিয়া চলাকালীন সেই অনিশ্চয়তা শেষ হয় না। এটি নিয়মিত আপডেট করা হয়।

বায়েশিয়ান এবং ফ্রিকোয়ালিস্ট পদ্ধতিগুলির মধ্যে পার্থক্যের কারণে, অন্যান্য ধরণের কেসগুলিও বিবেচনা করা উচিত। প্রথমটি প্যারামিটার অনুমান থেকে আসে, দ্বিতীয়টি আনুষ্ঠানিক পূর্বাভাস থেকে। বায়েশিয়ান পদ্ধতিতে এগুলি একই জিনিস নয়। বায়েশিয়ান পদ্ধতিগুলি আনুষ্ঠানিকভাবে অনুমান এবং সিদ্ধান্ত গ্রহণের বাইরে আলাদা করে দেয়। তারা পরামিতি অনুমান এবং পূর্বাভাস পৃথক।

আসুন ভাবা যাক, সাধারণতার ক্ষতি ছাড়াই, মডেল সফল হবে যদি এবং অন্যথায় ব্যর্থ হয়। আমরা অন্যান্য পরামিতিগুলি উপেক্ষা করতে চলেছি কারণ একটি সহজ ধারণা পাওয়া অনেক অতিরিক্ত কাজ হবে। বয়েসিয়ান পদ্ধতি ব্যবহার করে মডেলারের পক্ষে, ফ্রিকোয়েন্সিবাদী পদ্ধতিগুলি ব্যবহারকারীর চেয়ে এটি একেবারেই আলাদা ধরণের প্রশ্ন। $\hat{\sigma^2}<k$

ফ্রিকোয়েন্সিস্টের জন্য প্রশিক্ষণের সেটটির ভিত্তিতে একটি হাইপোথিসিস টেস্ট গঠিত হয়। Modeler Frequentist পদ্ধতি ব্যবহার করে পরীক্ষা হবে কিনা আনুমানিক ভ্যারিয়েন্স এর চেয়ে বড় বা সমান এবং নমুনা যার আকার উপর নাল প্রত্যাখ্যান করার প্রচেষ্টা আবিষ্কৃত যারা পরামিতি ফিক্সিং দ্বারা । $k$ $n_2$ $n_1$

Modeler Bayesian পদ্ধতি ব্যবহার করে জন্য, তারা নমুনা থেকে সময় প্যারামিটার অনুমান গঠন করবে এবং অবর ঘনত্ব নমুনা জন্য পূর্বে হয়ে । এক্সচেঞ্জিবিলিটি সম্পত্তি ধরে , তবে এটি নিশ্চিত করা হবে যে যৌথ নমুনা থেকে গঠিত সম্ভাবনার অনুমানের শব্দের সমস্ত ইন্দ্রিয়তে অনুমান সমান। এগুলিকে দুটি নমুনায় বিভক্ত করা গণিতের বল দ্বারা মোটেও বিভক্ত না হওয়া সমান। $n_1$ $n_1$ $n_2$ $n_2$

ভবিষ্যদ্বাণীগুলির জন্য, একটি অনুরূপ ইস্যু ধারণ করে। বায়েশিয়ান পদ্ধতিগুলির একটি অনুমানমূলক বিতরণ রয়েছে যা প্রতিটি পর্যবেক্ষণের সাথে আপডেটও হয়, অন্যদিকে নমুনা শেষে ফ্রিকোয়ালিস্ট একটিকে হিমায়িত করা হয় । ভবিষ্যদ্বাণীপূর্ণ ঘনত্বটি হিসাবে লেখা যেতে পারে । যদি পূর্বাভাস হয় এবং the নমুনা হয়, তবে প্যারামিটারগুলি কোথায় থাকবে, আমরা বোঝাতে পারি $n_1$ $\Pr(\tilde{x}=k|\mathbf{X})$ $\tilde{x}$ $\mathbf{X}$ $\theta?$ যদিও ফ্রিকোয়েন্সিস্ট পূর্বাভাস সিস্টেমগুলি বিদ্যমান, তবে বেশিরভাগ লোকেরা কেবলমাত্র বিন্দুর অনুমানকে সত্য পরামিতি হিসাবে বিবেচনা করে এবং অবশিষ্টাংশ গণনা করে। বায়েসিয়ান পদ্ধতিগুলি কেবলমাত্র একক পয়েন্টের পরিবর্তে প্রতিটি পূর্বাভাস ঘনত্বের বিরুদ্ধে স্কোর করে। এই পূর্বাভাসগুলি পরামিতিগুলির উপর নির্ভর করে না যা ফ্রিকোয়েন্সিবাদী সমাধানগুলিতে ব্যবহৃত পয়েন্ট পদ্ধতির চেয়ে আলাদা।

পার্শ্ব নোট হিসাবে, আনুষ্ঠানিক ফ্রিকোয়েনসিস্ট ভবিষ্যদ্বাণীপূর্ণ ঘনত্বগুলি স্ট্যান্ডার্ড ত্রুটিগুলি ব্যবহার করে উপস্থিত হয় এবং তাদের উপর স্কোরিংও করা যেতে পারে তবে বাস্তবে এটি বিরল। যদি কোনও নির্দিষ্ট পূর্ববর্তী জ্ঞান না থাকে, তবে ডেটা পয়েন্টগুলির একই সেটের জন্য পূর্বাভাসের দুটি সেট একই হওয়া উচিত। তারা পৃথক হয়ে উঠবে কারণ এবং তাই বায়সিয়ান সমাধান আরও তথ্য উত্সর্গ করবে। $n_1+n_2>n_1$

যদি কোনও উপাদান পূর্বের তথ্য না থাকে এবং যদি ফ্রিকোয়ালিস্ট ভবিষ্যদ্বাণীযুক্ত ঘনত্বগুলি বিন্দু অনুমানের পরিবর্তে ব্যবহার করা হয় তবে একটি নির্দিষ্ট নমুনার জন্য বায়েসিয়ান এবং ফ্রুসিডনিস্ট পদ্ধতির ফলাফলগুলি যদি একক মডেল চয়ন করা হয় তবে অভিন্ন হবে। যদি পূর্বের তথ্য থাকে তবে বায়েশিয়ান পদ্ধতিটি আরও সঠিক ভবিষ্যদ্বাণী তৈরি করবে। অনুশীলনে এই পার্থক্যটি অনেক বড় হতে পারে। তদুপরি, যদি গড় গড় মডেল হয় তবে সম্ভবত সম্ভাবনা আছে যে বায়সিয়ান পদ্ধতিটি আরও দৃ rob় হবে। আপনি যদি মডেল নির্বাচন ব্যবহার করেন এবং বায়েশিয়ান পূর্বাভাসগুলি হিমশীতল করেন, তবে ফ্রিকোয়েন্সিস্ট পূর্বাভাসগুলি ব্যবহার করে একটি ফ্রিকোয়ালিস্ট মডেল ব্যবহার করার কোনও তফাত নেই।

আমি একটি পরীক্ষা এবং বৈধতা সেট ব্যবহার করেছি কারণ আমার ডেটা বিনিময়যোগ্য ছিল না। ফলস্বরূপ, আমার দুটি সমস্যা সমাধান করা দরকার। প্রথমটি এমসিএমসি পদ্ধতিতে বার্ন-ইন এর অনুরূপ। আমার পরীক্ষার ক্রমটি শুরু করার জন্য আমার প্যারামিটারের প্রাক্কলনের একটি ভাল সেট দরকার ছিল এবং তাই আমার বৈধতা পরীক্ষা শুরু করার জন্য আমি পঞ্চাশ বছর আগের ডেটা ব্যবহার করে একটি ভাল পূর্বের ঘনত্ব পেতে পারি। দ্বিতীয় সমস্যাটি ছিল যে পরীক্ষার জন্য আমার কিছু প্রমিত মানক সময়ের প্রয়োজন ছিল যাতে পরীক্ষাটি প্রশ্নবিদ্ধ না হয়। আমি দুটি পূর্ব ব্যবসায়িক চক্র এনবিইআর দ্বারা নির্ধারিত হিসাবে ব্যবহার করেছি।

— ডেভ হ্যারিস
সূত্র

তবে, বলুন যে আপনি "অজানা" প্রবীণদের সাথে লিনিয়ার রিগ্রেশন মডেলটির জন্য একটি এমএপি অনুমান করেছেন। এটি মডেলের সর্বাধিক সম্ভাবনার প্রাক্কলন অর্জনের সমতুল্য, সুতরাং বিনিময়যোগ্যতা ধরে ধরে এমএল-তে কোনও পরীক্ষার সেট প্রয়োজন হয় না?

— টিম

"ওভারফিটিং হ'ল আওয়াজটিকে সংকেত হিসাবে বিবেচনা করা হয় এবং প্যারামিটারের প্রাক্কলনকে অনুমান করা হয়" আমি বিশ্বাস করি এই সংজ্ঞাটি অ্যাডিটিভ শব্দের মডেলগুলির পক্ষে সুনির্দিষ্ট। অন্যথায় ওভারফিটিং বনাম আন্ডারফিটিং এত ভাল সংজ্ঞাযুক্ত নয়।

— ক্যাগডাস ওজজেনেক

@ ক্যাগডাস ওজেনেক ধন্যবাদ আপনার কি কোনও প্রস্তাবিত সম্পাদনা আছে?

— ডেভ হ্যারিস

@ টিম আমি কখনই এমএপি অনুমানের কথা উল্লেখ করি নি। আপনি যদি এমএপি অনুমানের ক্ষেত্রে সমস্যাটি হ্রাস করেন তবে আপনি দৃust়তার আত্মসমর্পণ করুন। এমএপি অনুমানকারী এমন একটি বিন্দু যা ঘনত্বের তুলনায় ব্যয় ফাংশনকে হ্রাস করে। যদি ঘনত্বের পর্যাপ্ত পরিসংখ্যানের অভাব থাকে তবে এটি অনুমানগুলির জন্য সমস্যাযুক্ত হতে পারে। এমএপি অনুমানকারী, অন্তর্গতভাবে তথ্য হারাবে। আপনি যদি এমএপি অনুমানকারী ব্যবহার করছিলেন যা মূল প্রশ্নে নেই এবং স্পষ্টতই মা'র উপস্থাপনার অংশ নয়, তবে আপনি নিজের সমস্যার জন্য একটি আলাদা সেট তৈরি করেন।

— ডেভ হ্যারিস

@ টিম এমএপি অনুমানকারীটি বেয়েশিয়ার সিদ্ধান্ত তত্ত্ব থেকে আসে এবং এটি বায়েশিয়ান অনুমান এবং অনুমানের শীর্ষে একটি ওভারলে। এমএপি সুবিধাজনক। সুবিধার্থে বাছাই করার জন্য মূল্য দিতে হবে। অল-অ-বা-কিছুই ব্যয় না করা যদি না আপনার আসল ব্যয় ফাংশন হয়, আপনি তথ্য এবং যথার্থতা উভয়ই সমর্পণ করছেন। আপনি মা এর উপস্থাপনায় প্রস্তাবিত চেয়ে বিভিন্ন পদ্ধতিগত সমস্যা শেষ।

— ডেভ হ্যারিস