সুতরাং আমি আপনার উত্সাহের বিষয়ে অতিরিক্ত প্রশ্নের উত্তর দিয়েছি এবং আমি ভিডিওটি দেখেছি এবং ব্লগ পোস্টটি পড়েছি। র্যাডফোর্ড নীল বলছেন না যে বায়েশিয়ান মডেলগুলি বেশি মানায় না। আসুন আমরা মনে রাখি যে ওভারফিটিং হ'ল শব্দকে সিগন্যাল হিসাবে বিবেচনা করা হয় এবং প্যারামিটারের প্রাক্কলনকে বোঝানো হয়। এটি মডেল নির্বাচন ত্রুটির একমাত্র উত্স নয়। নীলের আলোচনা আরও বেশি বিস্তৃত যদিও তিনি একটি ছোট্ট নমুনা আকারের ধারণাটি উত্সাহিত করার মাধ্যমে ওভারফিটিংয়ের আলোচনায় উত্সাহিত করেছিলেন।
আমি আমার পূর্ববর্তী পোস্টটিকে আংশিকভাবে সংশোধন করি যে বায়েশিয়ান মডেলগুলি সমস্ত বায়েশিয়ান মডেলগুলির তুলনায় অত্যধিক মানিয়ে নিতে পারে, তবে ভবিষ্যদ্বাণীকে উন্নত করার উপায়ে এমনটি করুন। আবার শব্দের সাথে বিভ্রান্ত সংকেতের সংজ্ঞায় ফিরে যাওয়া, বায়েশিয়ান পদ্ধতিগুলির অনিশ্চয়তা, উত্তরোত্তর বিতরণ, সংকেত কী এবং গোলমাল কী তা সম্পর্কে সেই অনিশ্চয়তার পরিমাপ। এটি করার ক্ষেত্রে, বায়েশিয়ান পদ্ধতিগুলি সিগন্যালের অনুমানগুলিতে শব্দকে আরও বাড়িয়ে দিচ্ছে যেহেতু পুরো পশ্চাতটি অনুমান এবং পূর্বাভাসে ব্যবহৃত হয়। ওভারফিটিং এবং মডেল শ্রেণিবদ্ধকরণ ত্রুটির অন্যান্য উত্সগুলি বায়েসিয়ান পদ্ধতিগুলিতে একটি ভিন্ন ধরণের সমস্যা।
সরলকরণের জন্য আসুন আমরা মা-আলাপের কাঠামো গ্রহণ করি এবং লিনিয়ার প্রতিরোধের দিকে মনোনিবেশ করি এবং গভীর শিক্ষণ আলোচনা এড়িয়ে চলি কারণ তিনি উল্লেখ করেছেন যে বিকল্প পদ্ধতিগুলি তিনি উল্লেখ করেছেন কেবল ফাংশনের রচনা এবং লিনিয়ার যুক্তির মধ্যে একটি সরাসরি যোগসূত্র রয়েছে রিগ্রেশন এবং গভীর শিক্ষা।
নিম্নলিখিত সম্ভাব্য মডেলটি আকারের একটি বিস্তৃত নমুনা তৈরি করতে দেয় দুই subsamples, গঠিত , যেখানে প্রশিক্ষণ সেট করা হয় এবং বৈধতা সেট। আমরা দেখব কেন, কয়েকটি সাবধানের সাপেক্ষে, বয়েশিয়ান পদ্ধতিগুলির জন্য আলাদা প্রশিক্ষণ এবং বৈধতা সেটের প্রয়োজন নেই।
Y=β0+ +β1এক্স1+ +β2এক্স2+ +β3এক্স3।
এনএন1,এন2এন1এন2
এই আলোচনার জন্য, আমাদের আরও আটটি পরামিতি তৈরি করতে হবে, প্রতিটি মডেলের জন্য একটি। এইগুলি হল । তারা বহুজাতিক বিতরণ অনুসরণ করে এবং যথাযথ প্রিয়ারগুলি যেমন রিগ্রেশন সহগগুলি হয়। আটটি মডেল এবং মি1...8
Y=β0+ +β1এক্স1+ +β2এক্স2+ +β3এক্স3,
Y=β0,
Y=β0+ +β1এক্স1,
Y=β0+ +β2এক্স2,
Y=β0+ +β3এক্স3,
Y=β0+ +β1এক্স1+ +β2এক্স2,
Y=β0+ +β1এক্স1+ +β3এক্স3,
Y=β0+ +β2এক্স2+ +β3এক্স3,
Y=β0+ +β1এক্স1,
Y=β0+ +β2এক্স2,
Y=β0+ +β3এক্স3।
এখন আমাদের বায়েশিয়ান এবং ফ্রিকোয়ালিস্ট পদ্ধতিগুলির মধ্যে পার্থক্যের আগাছা নেওয়ার দরকার। প্রশিক্ষণ সংকলনে, ফ্রুসিডুভিস্ট পদ্ধতিগুলি ব্যবহার করে মডেলার কেবল একটি মডেল চয়ন করেন। বায়সিয়ান পদ্ধতি ব্যবহার করে মডেলার এতটা সীমাবদ্ধ নয়। যদিও বায়েশিয়ান মডেলার কেবল একটি মাত্র মডেল সন্ধানের জন্য একটি মডেল নির্বাচনের মানদণ্ড ব্যবহার করতে পারেন, তারাও গড় গড় মডেল ব্যবহার করতে পারেন। বায়েশিয়ান মডেলার বৈধতা বিভাগে মিডিয়াম স্ট্রিমে নির্বাচিত মডেলগুলি পরিবর্তন করতেও নির্দ্বিধায়। মোরেসো, বায়েশিয়ান পদ্ধতি ব্যবহার করে মডেলর নির্বাচন এবং গড়ের মধ্যে মেশা এবং মিল করতে পারেন।এন1,
একটি বাস্তব-বিশ্বের উদাহরণ দেওয়ার জন্য, আমি দেউলিয়ার 78 models টি মডেল পরীক্ষা করেছি। Models 78 টি মডেলের মধ্যে them 76 টির সম্মিলিত উত্তরোত্তর সম্ভাবনা ছিল এক শতাংশের প্রায় দশ হাজার th অন্য দুটি মডেল যথাক্রমে প্রায় 54 শতাংশ এবং 46 শতাংশ ছিল। ভাগ্যক্রমে, তারাও কোনও ভেরিয়েবল ভাগ করে নি। এটি আমাকে উভয় মডেল নির্বাচন করতে এবং অন্যান্য ignore 76 টি উপেক্ষা করার অনুমতি দেয়। যখন আমি উভয়ের জন্য সমস্ত ডেটা পয়েন্ট পেয়েছিলাম তখন আমি দুটি মডেলের উত্তরোত্তর সম্ভাবনার উপর ভিত্তি করে তাদের ভবিষ্যদ্বাণীগুলি গড় গড়েছিলাম, যখন আমার কাছে ডেটা পয়েন্টগুলি ছিল না তখন কেবলমাত্র একটি মডেল ব্যবহার করেছি অন্যান্য। আমার কাছে একটি প্রশিক্ষণ সেট এবং বৈধকরণের সেট থাকলেও কোনও ফ্রিকোয়েন্সিস্ট তাদের সাথে একই কারণে তা করেন নি। তদুপরি, দুটি ব্যবসায়ের চক্রের উপরে প্রতিদিন শেষে আমি আমার পোস্টেরিয়রগুলিকে প্রতিটি দিনের ডেটা দিয়ে আপডেট করি। এর অর্থ হ'ল বৈধতা সেটটির শেষে আমার মডেলটি প্রশিক্ষণ সেটটির শেষে মডেল ছিল না। ফ্রিভেনসিস্ট মডেলগুলি করার সময় বায়েশিয়ান মডেলগুলি শেখা বন্ধ করে না।
আরও গভীরে যেতে আমাদের মডেলগুলির সাথে কংক্রিট করা যাক। আসুন আমরা ধরে নিই যে প্রশিক্ষণের নমুনা চলাকালীন সেরা ফিট ফ্রেভেনসিস্ট মডেল এবং বায়েসিয়ান মডেলটি মডেল নির্বাচনের সাথে মিলছে বা, বিকল্পভাবে, মডেল গড়ের মডেল ওজন এতটাই দুর্দান্ত ছিল যে এটি ফ্রিকোয়েন্সিস্ট মডেলের সাথে প্রায় পৃথক পৃথক ছিল। আমরা এই মডেলটিকে আসুন কল্পনাও করুন যে প্রকৃতির প্রকৃত মডেল হ'ল
Y=β0+ +β1এক্স1+ +β2এক্স2+ +β3এক্স3।
Y=β0+ +β1এক্স1+ +β3এক্স3।
এখন আসুন বৈধতা সেট মধ্যে পার্থক্য বিবেচনা করুন। ফ্রিকোয়েন্সিস্ট মডেলটি ডেটাগুলিতে সজ্জিত। আসুন ধরে নেওয়া যাক যে কোনও কোনও মুহুর্তে যে মডেল নির্বাচন বা বৈধকরণ পদ্ধতিটি প্রকৃতির প্রকৃত মডেলটিতে নির্বাচনটি পরিবর্তিত করেছিল। তদ্ব্যতীত, যদি গড় গড় মডেল ব্যবহার করা হত, তবে প্রকৃতির প্রকৃত মডেলটি মডেলগুলির পছন্দটি পরিষ্কার-কাট হওয়ার অনেক আগেই পূর্বাভাসে ওজন বহন করে। সম্ভাব্যতা তত্ত্ব সম্পর্কে টমিতে ইটি জেনেস এই সমস্যাটি নিয়ে কিছুটা সময় ব্যয় করে। আমার কাজটি বইটি আছে তাই আমি আপনাকে একটি ভাল প্রশংসা পেতে পারি না, তবে আপনার এটি পড়া উচিত। এটির আইএসবিএন 978-0521592710।এনআমি2
মডেলগুলি বয়েশিয়ান চিন্তার পরামিতি এবং এগুলি এলোমেলো, বা আপনি যদি পছন্দ করেন তবে অনিশ্চিত। বৈধতা প্রক্রিয়া চলাকালীন সেই অনিশ্চয়তা শেষ হয় না। এটি নিয়মিত আপডেট করা হয়।
বায়েশিয়ান এবং ফ্রিকোয়ালিস্ট পদ্ধতিগুলির মধ্যে পার্থক্যের কারণে, অন্যান্য ধরণের কেসগুলিও বিবেচনা করা উচিত। প্রথমটি প্যারামিটার অনুমান থেকে আসে, দ্বিতীয়টি আনুষ্ঠানিক পূর্বাভাস থেকে। বায়েশিয়ান পদ্ধতিতে এগুলি একই জিনিস নয়। বায়েশিয়ান পদ্ধতিগুলি আনুষ্ঠানিকভাবে অনুমান এবং সিদ্ধান্ত গ্রহণের বাইরে আলাদা করে দেয়। তারা পরামিতি অনুমান এবং পূর্বাভাস পৃথক।
আসুন ভাবা যাক, সাধারণতার ক্ষতি ছাড়াই, মডেল সফল হবে যদি এবং অন্যথায় ব্যর্থ হয়। আমরা অন্যান্য পরামিতিগুলি উপেক্ষা করতে চলেছি কারণ একটি সহজ ধারণা পাওয়া অনেক অতিরিক্ত কাজ হবে। বয়েসিয়ান পদ্ধতি ব্যবহার করে মডেলারের পক্ষে, ফ্রিকোয়েন্সিবাদী পদ্ধতিগুলি ব্যবহারকারীর চেয়ে এটি একেবারেই আলাদা ধরণের প্রশ্ন।σ2^< কে
ফ্রিকোয়েন্সিস্টের জন্য প্রশিক্ষণের সেটটির ভিত্তিতে একটি হাইপোথিসিস টেস্ট গঠিত হয়। Modeler Frequentist পদ্ধতি ব্যবহার করে পরীক্ষা হবে কিনা আনুমানিক ভ্যারিয়েন্স এর চেয়ে বড় বা সমান এবং নমুনা যার আকার উপর নাল প্রত্যাখ্যান করার প্রচেষ্টা আবিষ্কৃত যারা পরামিতি ফিক্সিং দ্বারা ।টএন2এন1
Modeler Bayesian পদ্ধতি ব্যবহার করে জন্য, তারা নমুনা থেকে সময় প্যারামিটার অনুমান গঠন করবে এবং অবর ঘনত্ব নমুনা জন্য পূর্বে হয়ে । এক্সচেঞ্জিবিলিটি সম্পত্তি ধরে , তবে এটি নিশ্চিত করা হবে যে যৌথ নমুনা থেকে গঠিত সম্ভাবনার অনুমানের শব্দের সমস্ত ইন্দ্রিয়তে অনুমান সমান। এগুলিকে দুটি নমুনায় বিভক্ত করা গণিতের বল দ্বারা মোটেও বিভক্ত না হওয়া সমান।এন1এন1এন2এন2
ভবিষ্যদ্বাণীগুলির জন্য, একটি অনুরূপ ইস্যু ধারণ করে। বায়েশিয়ান পদ্ধতিগুলির একটি অনুমানমূলক বিতরণ রয়েছে যা প্রতিটি পর্যবেক্ষণের সাথে আপডেটও হয়, অন্যদিকে নমুনা শেষে ফ্রিকোয়ালিস্ট একটিকে হিমায়িত করা হয় । ভবিষ্যদ্বাণীপূর্ণ ঘনত্বটি হিসাবে লেখা যেতে পারে । যদি পূর্বাভাস হয় এবং the নমুনা হয়, তবে প্যারামিটারগুলি কোথায় থাকবে, আমরা বোঝাতে পারিএন1জনসংযোগ (এক্স~= কে | এক্স )এক্স~এক্সθ ? যদিও ফ্রিকোয়েন্সিস্ট পূর্বাভাস সিস্টেমগুলি বিদ্যমান, তবে বেশিরভাগ লোকেরা কেবলমাত্র বিন্দুর অনুমানকে সত্য পরামিতি হিসাবে বিবেচনা করে এবং অবশিষ্টাংশ গণনা করে। বায়েসিয়ান পদ্ধতিগুলি কেবলমাত্র একক পয়েন্টের পরিবর্তে প্রতিটি পূর্বাভাস ঘনত্বের বিরুদ্ধে স্কোর করে। এই পূর্বাভাসগুলি পরামিতিগুলির উপর নির্ভর করে না যা ফ্রিকোয়েন্সিবাদী সমাধানগুলিতে ব্যবহৃত পয়েন্ট পদ্ধতির চেয়ে আলাদা।
পার্শ্ব নোট হিসাবে, আনুষ্ঠানিক ফ্রিকোয়েনসিস্ট ভবিষ্যদ্বাণীপূর্ণ ঘনত্বগুলি স্ট্যান্ডার্ড ত্রুটিগুলি ব্যবহার করে উপস্থিত হয় এবং তাদের উপর স্কোরিংও করা যেতে পারে তবে বাস্তবে এটি বিরল। যদি কোনও নির্দিষ্ট পূর্ববর্তী জ্ঞান না থাকে, তবে ডেটা পয়েন্টগুলির একই সেটের জন্য পূর্বাভাসের দুটি সেট একই হওয়া উচিত। তারা পৃথক হয়ে উঠবে কারণ এবং তাই বায়সিয়ান সমাধান আরও তথ্য উত্সর্গ করবে।এন1+ +এন2>এন1
যদি কোনও উপাদান পূর্বের তথ্য না থাকে এবং যদি ফ্রিকোয়ালিস্ট ভবিষ্যদ্বাণীযুক্ত ঘনত্বগুলি বিন্দু অনুমানের পরিবর্তে ব্যবহার করা হয় তবে একটি নির্দিষ্ট নমুনার জন্য বায়েসিয়ান এবং ফ্রুসিডনিস্ট পদ্ধতির ফলাফলগুলি যদি একক মডেল চয়ন করা হয় তবে অভিন্ন হবে। যদি পূর্বের তথ্য থাকে তবে বায়েশিয়ান পদ্ধতিটি আরও সঠিক ভবিষ্যদ্বাণী তৈরি করবে। অনুশীলনে এই পার্থক্যটি অনেক বড় হতে পারে। তদুপরি, যদি গড় গড় মডেল হয় তবে সম্ভবত সম্ভাবনা আছে যে বায়সিয়ান পদ্ধতিটি আরও দৃ rob় হবে। আপনি যদি মডেল নির্বাচন ব্যবহার করেন এবং বায়েশিয়ান পূর্বাভাসগুলি হিমশীতল করেন, তবে ফ্রিকোয়েন্সিস্ট পূর্বাভাসগুলি ব্যবহার করে একটি ফ্রিকোয়ালিস্ট মডেল ব্যবহার করার কোনও তফাত নেই।
আমি একটি পরীক্ষা এবং বৈধতা সেট ব্যবহার করেছি কারণ আমার ডেটা বিনিময়যোগ্য ছিল না। ফলস্বরূপ, আমার দুটি সমস্যা সমাধান করা দরকার। প্রথমটি এমসিএমসি পদ্ধতিতে বার্ন-ইন এর অনুরূপ। আমার পরীক্ষার ক্রমটি শুরু করার জন্য আমার প্যারামিটারের প্রাক্কলনের একটি ভাল সেট দরকার ছিল এবং তাই আমার বৈধতা পরীক্ষা শুরু করার জন্য আমি পঞ্চাশ বছর আগের ডেটা ব্যবহার করে একটি ভাল পূর্বের ঘনত্ব পেতে পারি। দ্বিতীয় সমস্যাটি ছিল যে পরীক্ষার জন্য আমার কিছু প্রমিত মানক সময়ের প্রয়োজন ছিল যাতে পরীক্ষাটি প্রশ্নবিদ্ধ না হয়। আমি দুটি পূর্ব ব্যবসায়িক চক্র এনবিইআর দ্বারা নির্ধারিত হিসাবে ব্যবহার করেছি।