প্রথমে কোনও বায়েশিয়ান মডেল ফিট করা ঠিক আছে, তারপরে প্রবীণদের দুর্বল করা শুরু করবেন?


10

ঘনঘটিত পরিসংখ্যানগুলি করার সময়, আরও বেশি নম্বর সংগ্রহের সিদ্ধান্ত নেওয়ার আগে পরিসংখ্যান পরীক্ষার ফলাফলগুলি দেখার মতো বড় সংখ্যাগুলির একটি দীর্ঘ তালিকা রয়েছে is আমি সাধারণভাবে ভাবছি যে বায়েশিয়ান পরিসংখ্যানের সাথে জড়িত পদ্ধতিগুলির জন্য এবং না বিশেষত নিম্নলিখিতগুলির মধ্যে একটি কিনা সেই জন্য যদি অনুরূপ একটি তালিকা থাকে।

আমি সম্প্রতি উপলব্ধি করেছি যে আমি যে মডেলগুলিতে ফিট করছি তার জন্য আমার প্রক্রিয়াটি প্রথমে তথ্যবহুল প্রিয়ারদের সাথে মডেলটি ফিট করে কিনা তা পরীক্ষা করে দেখায় এবং তারপরে প্রিয়ারদের দুর্বোধ্য বা দুর্বলভাবে তথ্যমূলক করে তোলে এবং মডেল refit।

এর জন্য আমার প্রেরণাটি সত্যিকারের সাথে আমি জেএজেএস / স্ট্যানে এই মডেলগুলি লিখছি এবং আমার মনে এই বিষয়টিকে একটি পরিসংখ্যানের চেয়ে প্রোগ্রামিং টাস্কের মতো আচরণ করে চলেছি fact সুতরাং, আমি প্রথম রান করি, তথ্যমূলক প্রিয়ার ব্যবহার করে এটি দ্রুত রূপান্তরিত করার জন্য ধরণের ধরণের ঘটনা তৈরি করে, আমি যে মডেলটি লিখেছি তাতে ত্রুটিগুলি ধরা সহজ করে তোলে। তারপরে, মডেলটি ডিবাগ করার পরে, আমি এটি তথ্যহীন, বা দুর্বল তথ্যবহুল প্রিরিয়ারগুলির সাথে পুনরায় সংশোধন করি।

আমার প্রশ্ন আমি এই প্রক্রিয়াটি দিয়ে কিছু গুরুতর নিয়ম ভঙ্গ করছি কিনা। উদাহরণস্বরূপ, আমার সূত্রগুলি বৈধ হওয়ার জন্য এবং গবেষকদের স্বাধীনতার ডিগ্রিগুলি শোষণ এড়াতে, কোনও মডেল ফিট করার আগে আমার কি নির্দিষ্ট প্রিয়ার সাথে প্রতিশ্রুতিবদ্ধ হওয়া দরকার ?


4
হাস্যরসাত্মক একদিকে যেমন (আমি আশা করি) এখানে আমার লেখা একটি কবিতা রয়েছে । (হ্যাঁ, আমি জানি এটি কোনও ওড নয়)
পিটার ফ্লুম

@ পিটারফ্লম, ওহ, অশুভ
জোফ্রহল্ড

উত্তর:


9

বিষয়গত বায়েশিয়ানরা একমত হতে পারে না, তবে আমার দৃষ্টিকোণ থেকে পূর্বের সম্ভাবনার মতো মডেলটির একটি অংশ মাত্র। মডেল আচরণের প্রতিক্রিয়া হিসাবে পূর্বে পরিবর্তন আপনার সম্ভাবনা ফাংশন (উদাহরণস্বরূপ বিভিন্ন ত্রুটি বিতরণ বা বিভিন্ন মডেল সূত্র চেষ্টা করে) পরিবর্তন করার চেয়ে ভাল বা খারাপ কিছু না।

এটি বিপজ্জনক হতে পারে যদি এটি আপনাকে একটি মাছ ধরার অভিযানে যেতে দেয় তবে বিকল্পগুলি আরও খারাপ হতে পারে। উদাহরণস্বরূপ, আপনি যে ক্ষেত্রে উল্লেখ করেছেন, যেখানে আপনার মডেলটি ফুঁসে উঠেছে এবং আপনি অযৌক্তিক সহগগুলি পেয়েছেন, তারপরে আবার চেষ্টা করার পরিবর্তে আপনার কাছে বেশি পছন্দ নেই।

এছাড়াও, মাছ ধরার অভিযানের ঝুঁকি কিছুটা হ্রাস করতে আপনি নিতে পারেন এমন পদক্ষেপ রয়েছে:

  • আগে আপনি চূড়ান্ত বিশ্লেষণে ব্যবহার করবেন আগে সিদ্ধান্ত
  • আপনি যখন সম্পূর্ণ প্রক্রিয়া সম্পর্কে আপনার বিশ্লেষণ প্রকাশ করেন বা বর্ণনা করেন তখন সামনে উপস্থিত হন
  • চূড়ান্ত বিশ্লেষণের জন্য সিমুলেটেড ডেটা এবং / অথবা ডেটা রাখা দিয়ে যতটা সম্ভব সম্ভব করা। এইভাবে, আপনি আপনার বিশ্লেষণকে খুব বেশি দূষিত করবেন না।

4

যদি আপনি প্রিরিয়ারদের সাথে পরীক্ষা করেন এবং হাতের ডেটাতে এর পারফরম্যান্সের দিক থেকে একটি নির্বাচন করেন তবে এটি আর "পূর্ববর্তী" নয়। এটি কেবলমাত্র ডেটাগুলির উপর নির্ভর করে না (যেমন একটি বায়ু বিশ্লেষণে রয়েছে), তবে এটি আপনি কী দেখতে চান তার উপরও নির্ভর করে (যা আরও খারাপ)। শেষ পর্যন্ত, আপনি বায়েশিয়ান সরঞ্জামগুলি ব্যবহার করেন তবে এটিকে কোনও বায়েশীয় বিশ্লেষণ বলা যায় না।


1
আমি যেমন ওপি বুঝতে পেরেছি, সে একটির পূর্ব ব্যবহার করছে না এবং ফলাফলগুলি দেখছে এবং সিদ্ধান্ত নিচ্ছে যে অন্য কোনও পূর্ববর্তী তাকে আরও ভাল ফলাফল দেবে। তিনি তার মডেলটি যথাযথভাবে কোডিং করেছেন তা দেখার জন্য তিনি একটি কৃত্রিম ব্যবহার করছেন, তারপরে বিশ্লেষণের জন্য তার আসল পূর্বের দিকে স্যুইচ করছেন। সম্ভবত যদি তিনি প্রথম পদক্ষেপে সিনথেটিক ডেটা ব্যবহার করেন, তবে দ্বিতীয় ধাপে তার প্রকৃত পূর্বের এবং তার আসল ডেটা উভয়টিতে স্যুইচ করেছেন, এটি আরও গ্রহণযোগ্য হবে?
ওয়েইন

3

আমি মনে করি আপনি তিনটি কারণে এই ক্ষেত্রে ঠিক আছেন:

  1. আপনি আপনার ফলাফলের প্রতিক্রিয়ায় প্রকৃতপক্ষে আপনার প্রিয়ারদের সামঞ্জস্য করছেন না। আপনি যদি এমন কিছু বলে থাকেন, "আমি এক্সওয়াইজেড প্রিয়ারগুলি ব্যবহার করি এবং কনভার্জেন্সের হার এবং আমার ডিআইসির ফলাফলের উপর নির্ভর করে আমি তখন আমার পূর্ববর্তীকে এবিসি দ্বারা পরিবর্তন করব," তবে আমি বলব আপনি নোংরা করছেন, তবে এই ক্ষেত্রে এটি মনে হচ্ছে আপনি সত্যিই তা করছেন না।

  2. বায়েশিয়ান প্রসঙ্গে, প্রিরিয়াররা সুস্পষ্ট। সুতরাং আপনার পক্ষে আপনার কারাবন্দিকে ভুলভাবে চিহ্নিত করা সম্ভব, তবে ফলস্বরূপ প্রিয়াররা অন্যদের দ্বারা পরিদর্শন করার জন্য সর্বদা দৃশ্যমান থাকবে যারা আপনারা কেন এই বিশেষ বর্ষসেরা রয়েছেন তা প্রশ্ন করতে পারে। সম্ভবত আমি এখানে নির্বোধ, যেহেতু পূর্বের মতো কোনও কিছুকে ঝলকানো এবং "হুঁ, যুক্তিসঙ্গত দেখাচ্ছে" বলা সহজ কারণ কেউ এটিকে প্রস্তাব দিয়েছিল তবে ...

  3. আমি মনে করি আপনি যা করছেন তা জেলএসের (এবং অন্যদের) জেএজেএস মডেলকে টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো করে তৈরি করার জন্য, প্রথমে সিন্থেটিক ডেটা নিয়ে কাজ করা, তারপরে আসল ডেটা, আপনার স্পেসিফিকেশন ত্রুটি নেই তা নিশ্চিত করার সাথে সম্পর্কিত । এটি প্রকৃতপক্ষে ঘনত্ববাদী পদ্ধতিগুলির একটি কারণ নয় এবং এটি সত্যিকারের পরীক্ষামূলক পদ্ধতি নয়।

তারপরে আবার আমি নিজেও এই জিনিসগুলি শিখছি।

পিএস যখন আপনি বলেন যে আপনি প্রাথমিকভাবে "তথ্যমূলক প্রিয়ারস" এর সাথে দ্রুত রূপান্তরিত করার জন্য এটি ছদ্মবেশী করেন, তখন আপনার অর্থ কি আসলে তথ্যমূলক প্রিয়ারগুলি যা হাতের সমস্যার দ্বারা অনুপ্রাণিত হয়, বা কেবল প্রবক্তারা যে স্বেচ্ছাসেবী কারণে দৃter়ভাবে ধাক্কা দিয়ে / উত্তরণকে গতিবেগকে সীমাবদ্ধ করে দেয়? "কিছু নির্বিচারে বিন্দু? যদি এটি প্রথম ক্ষেত্রে হয় তবে আপনি কেন এই (প্রেরিত) প্রিয়ারদের থেকে দূরে সরে যাচ্ছেন?


1

আমি মনে করি এটি সম্ভবত বায়েশিয়ান বিদ্যালয়ের স্বাধীন নন। জেফ্রি নন-ইনফরমটিভ প্রিয়ারগুলি ব্যবহার করতে চান। লিন্ডলি আপনি তথ্যবহুল প্রিয়ার ব্যবহার করতে চান। ইমিরিকাল বায়েশিয়ানরা আপনাকে জিজ্ঞাসা করবে যে আপনি ডেটাটিকে আগে প্রভাবিত করতে দিন। তবে আমি মনে করি যদিও প্রতিটি স্কুল পূর্বের পছন্দ সম্পর্কে আলাদা পরামর্শ দিচ্ছে, তবুও তাদের সকলের একটি পদ্ধতির অর্থ এই নয় যে আপনি প্রিটারটি নিতে পারেন এবং আপনি চান ফলাফল না পাওয়া পর্যন্ত এটি টুইট করে চালিয়ে যেতে পারেন। এটি অবশ্যই ডেটার দিকে তাকানো এবং ডেটা সংগ্রহ এবং পরীক্ষার পক্ষে জবাবদিহি করার মতো হবে যতক্ষণ না আপনি উত্তরটি কী হওয়া উচিত তা সম্পর্কে আপনার পূর্ব ধারণাটি পৌঁছায়।

ফ্রিকোয়েনসিস্ট বা বায়েশিয়ান এটি বিবেচনা করে না আমি মনে করি না যে কেউ আপনাকে ডেটা (বা ম্যাসেজ) দিয়ে কৌশলগুলি খেলতে চাইবে। সম্ভবত এটি এমন কিছু যা আমরা সকলেই একমত হতে পারি এবং পিটারের মজার কবিতাটি সত্যই অ্যাপ্রোপো।


1

আমি বলব না, আপনাকে নির্দিষ্ট প্রিয়ারের কাছে প্রতিশ্রুতিবদ্ধ হতে হবে না। সাধারণত যে কোনও বায়েশিয়ান ডেটা বিশ্লেষণের সময় আপনার আগে মডেলের সংবেদনশীলতা বিশ্লেষণ করা উচিত। এর মধ্যে ফলাফলের কী ঘটে তা দেখার জন্য অন্যান্য বিভিন্ন প্রাক্তনকে চেষ্টা করা অন্তর্ভুক্ত থাকবে। এটি ব্যবহার করা উচিত তার আগে আরও ভাল বা আরও শক্তিশালী প্রকাশ করতে পারে।

দুটি সুস্পষ্ট "নো-না" হ'ল: আরও ভাল ফিট করার জন্য পূর্বের সাথে খুব বেশি খেলা করা, ফলস্বরূপ ওভার ফিট এবং মডেলটির অন্যান্য পরামিতিগুলি আরও ভাল ফিট করার জন্য পরিবর্তিত হয়। প্রথমটির উদাহরণ হিসাবে: গড়ের আগে একটি প্রাথমিক পূর্ববর্তী পরিবর্তন করা যাতে এটি নমুনা গড়ের কাছাকাছি থাকে। দ্বিতীয়টির জন্য: আরও ভাল ফিট পাওয়ার জন্য আপনার ব্যাখ্যামূলক ভেরিয়েবলগুলি / বৈশিষ্ট্যগুলিকে রিগ্রেশনে পরিবর্তন করা। এটি কোনও প্রতিরোধের সংস্করণে সমস্যা এবং মূলত আপনার স্বাধীনতার ডিগ্রিগুলিকে অবৈধ করে দেয়।


সংবেদনশীলতা বিশ্লেষণ উল্লেখ করার জন্য +1। আপনার ফলাফলগুলি ব্যবহার করা
প্রিরিয়ারদের
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.