কখন (যদি কখনও হয়) ঘন ঘনবাদী দৃষ্টিভঙ্গি কোনও বায়েশিয়ানের চেয়ে যথেষ্ট ভাল?


72

পটভূমি : আমার বায়েশিয়ান পরিসংখ্যান সম্পর্কে আনুষ্ঠানিক প্রশিক্ষণ নেই (যদিও আমি আরও শিখতে আগ্রহী), তবে আমি যথেষ্ট জানি - আমি মনে করি - কেন অনেকে মনে করেন যে তারা ফ্রিকোয়েন্সিস্ট পরিসংখ্যানের চেয়ে বেশি পছন্দ করে কেন তার সংক্ষিপ্তসার পেতে পারেন। এমনকি আমি প্রাথমিক শিক্ষার পরিসংখ্যান (সামাজিক বিজ্ঞান) শ্রেণীর স্নাতকদেরও বায়সিয়ান পদ্ধতির আবেদনকে খুঁজে পেয়েছি - "নাল দেওয়া হ'ল আমরা কীভাবে তথ্যের সম্ভাবনা গণনা করতে আগ্রহী? কেন আমরা কেবল সম্ভাবনার পরিমাণ নির্ধারণ করতে পারি না? নাল হাইপোথিসিস? না বিকল্প অনুমান? এবং আমি এগুলির মতো থ্রেডও পড়েছি , যা বায়েশিয়ান পরিসংখ্যানের বৌদ্ধিক সুবিধার পক্ষেও প্রমাণিত হয়েছে। তবে আমি ব্লাসকো এর এই উক্তিটি দেখতে পেলাম (2001) জোর দিয়েছি:

পশুর প্রজননকারী যদি অন্তর্ভুক্তির সাথে সম্পর্কিত দার্শনিক সমস্যাগুলিতে আগ্রহী না হন তবে সমস্যাগুলি সমাধান করার সরঞ্জামগুলিতে বায়েশিয়ান এবং ঘন ঘন ঘন মনোভাবের বিদ্যালয়গুলি সুপ্রতিষ্ঠিত হয় এবং কেন এক বা অন্য স্কুলটিকে প্রাধান্য দেওয়া হয় তা ন্যায়সঙ্গত করার প্রয়োজন হয় না। তাদের মধ্যে এখন কোনও জটিল সমস্যা ব্যতীত অপারেশনাল অসুবিধা নেই ... একটি স্কুল বা অন্য একটি স্কুল বেছে নেওয়া অন্য বিদ্যালয়ে যেগুলি সমাধান দেয় না যেগুলি অন্য বিদ্যালয়ের অফার দেয় না তার সাথে সম্পর্কিত হওয়া উচিত , সমস্যাগুলি সহজেই কীভাবে সমাধান করা যায় , এবং বিজ্ঞানের অভিব্যক্তি ফলাফলের নির্দিষ্ট পদ্ধতিতে কতটা স্বাচ্ছন্দ্য বোধ করে।

প্রশ্ন : ব্লাসকো উদ্ধৃতি থেকে মনে হয় যে এমন একটি সময় হতে পারে যখন একটি ফ্রেইসিডনিস্ট পদ্ধতি বাস্তবে কোনও বায়েশিয়ার চেয়ে বেশি পছন্দ করে। এবং তাই আমি কৌতূহলী: বায়সীয় পদ্ধতির তুলনায় ঘন ঘনবাদী পদ্ধতির পছন্দ কখন হবে? আমি এই প্রশ্নের উত্তর সম্পর্কে আগ্রহী যে ধারণা উভয়ভাবেই মোকাবেলা করুন (উদাহরণস্বরূপ, নাল হাইপোথিসিসের উপর ভিত্তি করে শর্তযুক্ত ডেটার সম্ভাব্যতাটি কখন বিশেষভাবে কার্যকর?) এবং বোধগম্যভাবে (যেমন, ফ্রিকোয়ালিস্ট পদ্ধতিগুলি কীভাবে বনাম বায়েশিয়ানকে উত্সাহ দেয়?)।

উত্তরগুলি যতটা সম্ভব অ্যাক্সেসযোগ্যভাবে পৌঁছে দেওয়া হয় সেটিকে পছন্দ করা ভাল - আমার শিক্ষার্থীদের সাথে ভাগ করে নেওয়ার জন্য আমার ক্লাসে কিছু প্রতিক্রিয়া নেওয়া ভাল লাগবে (যদিও আমি বুঝতে পারি যে কিছুটা প্রযুক্তিগত প্রয়োজন))

অবশেষে, ফ্রিকোয়েন্সিস্ট পরিসংখ্যানগুলির নিয়মিত ব্যবহারকারী হওয়া সত্ত্বেও, বাস্তবে বায়েশিয়ান কেবল বোর্ড জুড়েই জিততে পারে এই সম্ভাবনার জন্য আমি আসলেই উন্মুক্ত।


10
যখন আপনি উদ্দেশ্যীয় সম্ভাবনাগুলি, অর্থাৎ স্বাভাবিকভাবে স্টোকাস্টিক প্রক্রিয়াগুলি নিয়ে কাজ করেন। উদাহরণস্বরূপ, তেজস্ক্রিয় ক্ষয় আপনার ব্যক্তিগত বিশ্বাস বা অজানা তথ্য বা অন্য কোনও কিছুর সাথে কোনও সম্পর্ক নেই। এটি কেবল তার নিজস্ব গতিতে চলে যায় এবং পরমাণুগুলি এলোমেলোভাবে ভেঙে যায়।
আকসকল

6
এই সাম্প্রতিক প্রশ্নটি দেখুন যা দুর্ভাগ্যক্রমে খুব বেশি বিস্তৃত হিসাবে বন্ধ হয়ে গেছে (আমি আবার খুলতে ভোট দিয়েছি তবে এটি কখনই হয়নি): stats.stackexchange.com/questions/192572 । আপনি প্রায় একই জিনিস জিজ্ঞাসা করছেন। উত্তরটি সেখানে পরীক্ষা করে দেখুন।
অ্যামিবা

5
@ আকসাল: আমি এই আলোচনাটি করতে পছন্দ করব তবে এটি অফ-টপিক এবং আমাদের জানানো হবে তাই আমি চুপ করলাম (এবং গণনা করি)।
অ্যামিবা

12
"বেইসিয়ানরা যে প্রশ্নটি প্রত্যেকে প্রত্যেকে আগ্রহী বলে অনুমান করে যে কেউ বিশ্বাস করে না, তার সমাধান করেছেন, যখন ঘন
ঘনবাদীরা

4
@ জাসাকালুক, লক্ষ্য করুন কীভাবে বায়েশিয়ানদের দুর্গগুলি এমন অঞ্চল যেখানে পর্যাপ্ত তথ্য নেই বা যখন প্রক্রিয়াগুলি অস্থির থাকে, যেমন সামাজিক বিজ্ঞান, সোডো বিজ্ঞান, জীবন বিজ্ঞান ইত্যাদি। কোয়ান্টাম মেকানিক্স বা বেশিরভাগ পদার্থবিজ্ঞানে বায়েশিয়ান হওয়ার দরকার নেই। মঞ্জুর, আপনিও সেখানে বায়েশিয়ান হতে পারেন, কেবল আপনার
সূত্রগুলি ঘনত্ববাদী

উত্তর:


54

ঘন ঘন পদ্ধতিগুলি কেন পছন্দ করা যেতে পারে তার পাঁচটি কারণ এখানে:

  • দ্রুত। বায়সিয়ান পরিসংখ্যান প্রায়শই ঘন ঘনবাদী উত্তরের প্রায় একই রকম উত্তর দেয় (এবং যখন তারা তা করে না, তবে এটি 100% পরিষ্কার নয় যে বায়েশিয়ান সর্বদাই যাওয়ার উপায়) এই সত্য যে ঘন ঘনবাদী পরিসংখ্যান প্রায়শই বেশ কয়েকটি আদেশের মাত্রা দ্রুত অর্জন করা যেতে পারে fact একটি শক্ত যুক্তি। তেমনি, ঘন ঘন পদ্ধতিতে ফলাফলগুলি সংরক্ষণের জন্য তত স্মৃতি দরকার হয় না। এই জিনিসগুলি কিছুটা তুচ্ছ মনে হতে পারে, বিশেষত ছোট ডেটাসেটের সাথে, যদিও বায়েসিয়ান এবং ফ্রিকোয়ালিস্ট সাধারণত ফলাফলগুলিতে সম্মত হন (বিশেষত যদি আপনার কাছে প্রচুর তথ্যমূলক ডেটা থাকে) এর অর্থ হ'ল যদি আপনি যত্ন নিচ্ছেন তবে আপনি কম গুরুত্বপূর্ণ বিষয়ে যত্ন নেওয়া শুরু করতে পারেন জিনিস। এবং অবশ্যই আপনি যদি বড় ডেটা বিশ্বে বাস করেন তবে এগুলি মোটেই তুচ্ছ নয়।

  • অ-প্যারাম্যাট্রিক পরিসংখ্যান। আমি স্বীকার করেছি যে বায়েসীয় পরিসংখ্যানগুলিতে অ-প্যারাম্যাট্রিক পরিসংখ্যান রয়েছে, তবে আমি যুক্তি দিয়ে বলব যে ক্ষেত্রের ঘনতান্ত্রিক পক্ষের কিছু সত্যই অবিশ্বাস্যভাবে ব্যবহারিক সরঞ্জাম রয়েছে যেমন এমিরিকাল ডিস্ট্রিবিউশন ফাংশন। বিশ্বের কোনও পদ্ধতিই কখনও ইডিএফ এবং কাপলান মেয়ার কার্ভ ইত্যাদি প্রতিস্থাপন করতে পারে না (যদিও স্পষ্টভাবে এটি এই পদ্ধতিগুলি বিশ্লেষণের সমাপ্তি বলে বোঝা যায় না)।

  • কম ডায়াগনস্টিকস। এমসিএমসি পদ্ধতিগুলি, বায়েশিয়ান মডেলগুলির ফিট করার জন্য সর্বাধিক প্রচলিত পদ্ধতিতে সাধারণত ব্যবহারকারীরা তাদের ঘন ঘন ঘন কাউন্টার অংশের চেয়ে বেশি কাজ প্রয়োজন। সাধারণত, এমএলই অনুমানের জন্য ডায়াগনস্টিক এত সহজ যে কোনও ভাল অ্যালগরিদম বাস্তবায়ন এটি স্বয়ংক্রিয়ভাবে করবে (যদিও এটি উপলব্ধ না যে প্রতিটি প্রয়োগ বাস্তবায়ন ভাল ...)। যেমন, ঘন ঘন অ্যালগরিদমিক ডায়াগনস্টিক্স সাধারণত "নিশ্চিত হন যে মডেলটি ফিট করার সময় কোনও লাল পাঠ নেই" there's সমস্ত পরিসংখ্যানবিদদের সীমিত ব্যান্ডউইদথ রয়েছে এ কারণে, "আমার ডেটা কি প্রায় স্বাভাবিক?" বা "এই বিপদগুলি কি আসলেই আনুপাতিক?", ইত্যাদি etc.

  • মডেল অপব্যবহারের অধীনে বৈধ অনুমান। আমরা সকলেই শুনেছি যে "সমস্ত মডেলগুলি ভুল তবে কিছু কার্যকর" তবে গবেষণার বিভিন্ন ক্ষেত্র এটিকে কমবেশি গুরুত্ব সহকারে নেয়। মডেলটির ভুল ব্যাখ্যা করা হলে ফ্রিকোয়েনসিস্ট সাহিত্যে ইনফরমেশন ঠিক করার জন্য পদ্ধতিগুলি পূর্ণ: বুটস্ট্র্যাপ অনুমানক, ক্রস-বৈধকরণ, স্যান্ডউইচ অনুমানকারী (লিঙ্কটি মডেলের ভুল বান্ধবীর অধীনে জেনারেল এমএলই অনুকরণের বিষয়েও আলোচনা করে), সাধারণ অনুমানের সমীকরণগুলি (জিইই এর), আধাপূর্ণ সম্ভাবনার পদ্ধতিগুলি, ইত্যাদি যতদুর আমি জানি, মডেল অপব্যবহারের অধীনে অনুমান সম্পর্কে বায়েশিয়ান সাহিত্যে খুব কমই রয়েছে (যদিও মডেল চেকিং, অর্থাৎ উত্তরোত্তর ভবিষ্যদ্বাণীমূলক চেকগুলি নিয়ে প্রচুর আলোচনা রয়েছে)। আমি এটি কেবল সুযোগেই ভাবি না: বারবার বিচারের মধ্যে একজন অনুমানকারী কীভাবে আচরণ করে তা মূল্যায়নের জন্য অনুমানকারীকে "সত্য" মডেলের উপর ভিত্তি করে নেওয়া প্রয়োজন হয় না, তবে বেইস উপপাদ্যটি ব্যবহার করে!

  • পূর্ব থেকে স্বাধীনতা (কেন লোকেরা সমস্ত কিছুর জন্য বায়েশিয়ান পদ্ধতি ব্যবহার করে না তার এটি সম্ভবত সবচেয়ে সাধারণ কারণ)। বায়েশিয়ান অবস্থানের শক্তি প্রায়শই প্রিয়ারদের ব্যবহার হিসাবে চিহ্নিত করা হয়। তবে, আমি প্রয়োগ করা সমস্ত ক্ষেত্রেই কাজ করেছি, বিশ্লেষণের আগে একটি তথ্যবহুল ধারণা বিবেচনা করা হয় না the অ-পরিসংখ্যান বিশেষজ্ঞদের প্রিয়ারদের কীভাবে উপস্থাপন করা যায় সে সম্পর্কে সাহিত্য পাঠ করা এর পক্ষে যুক্তিযুক্ত যুক্তি দেয়; আমি এমন কাগজপত্র পড়েছি যা (আমার নিজের মতামত প্রকাশের মতো নিষ্ঠুর স্ট্র-ম্যান) "গবেষককে জিজ্ঞাসা করেছেন যে আপনাকে নিয়োগ করেছে কারণ তাদের পরিসংখ্যান বোঝার ক্ষেত্রে সমস্যা আছে যেগুলি তাদের কল্পনা করতে অসুবিধাগুলির প্রভাবের আকারের 90% নির্দিষ্ট করে দেয় ভিতরে থাকুন This এই ব্যাপ্তিটি খুব সংকীর্ণ হবে, তাই এলোমেলোভাবে তাদের এটিকে আরও প্রশস্ত করার চেষ্টা করুন their তাদের বিশ্বাস গামা বিতরণের মতো মনে হচ্ছে কিনা তাদের জিজ্ঞাসা করুন। আপনাকে সম্ভবত তাদের জন্য গামা বিতরণ আঁকতে হবে এবং আকৃতির প্যারামিটারটি ছোট হলে কীভাবে এটি ভারী লেজ থাকতে পারে তা দেখান। এটি পিডিএফ তাদের কাছে কী তা ব্যাখ্যা করার সাথেও জড়িত থাকবে "" (দ্রষ্টব্য: আমি মনে করি না যে পরিসংখ্যানবিদরাও সত্যই সঠিকভাবে বলতে সক্ষম হয়েছেন)অবরোহমার্গী কিনা তারা 90% অথবা 95% নির্দিষ্ট কিনা প্রভাব আকার একটি সীমার এই ব্যবস্থার সবচেয়ে গুরত্বপূর্ণ, এবং এই পার্থক্য বিশ্লেষণ সুত্রে প্রভাব ফেলতে পারে!)। সত্যই বলা যেতে পারে, আমি বেশ নির্দয় হয়ে পড়েছি এবং এমন পরিস্থিতিও থাকতে পারে যেখানে পূর্বের সন্ধান করা কিছুটা সহজবোধ্য হতে পারে। তবে আপনি দেখতে পাচ্ছেন এটি কীটপতঙ্গের ক্যান। এমনকি আপনি অ-তথ্যমূলক প্রিয়ারগুলিতে স্যুইচ করলেও এটি এখনও সমস্যা হতে পারে; প্যারামিটারগুলি রূপান্তর করার সময়, অ-তথ্যমূলক প্রিরিয়ারদের জন্য হঠাৎ ভুল হওয়া কী খুব হ'ল তথ্য হিসাবে দেখা যায়! এর আর একটি উদাহরণ হ'ল আমি বেশ কয়েকটি গবেষকের সাথে কথা বলেছি যারা দৃ ad়রূপে তা করে নাডেটা সম্পর্কে অন্য বিশেষজ্ঞের ব্যাখ্যা কী তা শুনতে চান কারণ অভিজ্ঞতাগতভাবে অন্যান্য বিশেষজ্ঞরা বেশি আত্মবিশ্বাসী হয়ে ওঠেন। তারা বরং কেবল অন্য বিশেষজ্ঞের ডেটা থেকে অনুমান করা যেতে পারে তা জানতে এবং তারপরে তাদের নিজস্ব সিদ্ধান্তে আসতে পারে। আমি কোথায় এটি শুনেছিলাম তা মনে করতে পারছি না, তবে কোথাও আমি "আপনি যদি একজন বয়েসিয়ান হন তবে আপনি চান যে সবাই ফ্রিকোয়েনসিস্ট হন" এই বাক্যাংশটি পড়েছি। আমি এটি ব্যাখ্যা করি যে তাত্ত্বিকভাবে আপনি যদি একজন বেইসিয়ান হন এবং কেউ যদি তাদের বিশ্লেষণের ফলাফলগুলি বর্ণনা করে তবে আপনার প্রথমে তাদের পূর্ববর্তী প্রভাবগুলি সরিয়ে ফেলার চেষ্টা করা উচিত এবং তারপরে আপনি যদি নিজের ব্যবহার করেন তবে তার প্রভাব কী হবে তা নির্ধারণ করার চেষ্টা করা উচিত। যদি তারা আপনাকে বিশ্বাসযোগ্য ব্যবস্থার চেয়ে আত্মবিশ্বাসের ব্যবধান দেয় তবে এই ছোট্ট অনুশীলনটি সরল করা হবে!

অবশ্যই, আপনি যদি তথ্যমূলক প্রিয়ারদের ত্যাগ করেন তবে বায়সিয়ান বিশ্লেষণগুলিতে এখনও ইউটিলিটি রয়েছে। ব্যক্তিগতভাবে, আমি এখানে তাদের সর্বোচ্চ উপযোগ মিথ্যা বিশ্বাস করি; কিছু সমস্যা রয়েছে যা এমএলই পদ্ধতি ব্যবহার করে কোনও উত্তর পাওয়া চূড়ান্ত তবে এমসিমিসি দিয়ে খুব সহজেই সমাধান করা যায়। তবে এটি বেয়েসিয়ানের সর্বোচ্চ উপযোগিতা সম্পর্কে আমার দৃষ্টিভঙ্গি আমার পক্ষের দৃ strong় প্রবীণদের কারণে, তাই এটি নুনের দানা দিয়ে নিয়ে যান।


1
(+1 টি) যথাযথ উত্তর, যদিও আমি অভিমানী করছি আপনি কি বোঝানো না ফলাফল সঞ্চয় করতে যতটা মেমরির প্রয়োজন?
jsakaluk

1
প্রবীণদের কাছ থেকে স্বাধীনতার ক্ষেত্রে: আপনি কি বলছেন যে আপনার সমস্যা সম্পর্কে যত কম চিন্তা করা এবং বুঝতে হবে, তত ভাল? আমি বেশ কয়েকটি সফটওয়্যার বিক্রেতাকে জানি যারা আপনার সাথে কথা বলতে চান, সুতরাং আপনি পয়েন্ট-এন-ক্লিক করতে পারেন - বা আরও ভাল, এক-ক্লিক করতে পারেন - এবং আপনি যে কোনও সমস্যার কল্পনা করতে পারেন তার উত্তর পেতে পারে! মুরগি, আপনার এমনকি কোনও সমস্যার প্রয়োজন নেই, কেবল তাদের ওয়েবসাইটে তাদের ডেটা ফিড করুন এবং তারা সমস্ত সম্ভাব্য সমস্যা খুঁজে পাবেন এবং তাদের সমাধান করবেন, টট মিষ্টি! (দুঃখিত, একটি নিষ্ঠুর খড়ের মতো লোকের মতামত দিয়ে জবাব দিতে পারিনি couldn't)
ওয়েন

1
@ ওয়াইন: আমি জানি আপনি রসিকতা করছেন তবে এটি 100% সঠিক। বাস্তব বিশ্বের সমস্যার উত্তর দেওয়ার জন্য পরিসংখ্যান একটি সরঞ্জাম। আমি সত্যিই জোর দিয়ে বলতে চাই যে এটি একটি সরঞ্জাম, চূড়ান্ত পণ্য নয়। "ফ্রিকোয়েনসিস্ট বনাম বয়েশিয়ান" যুক্তিটি যেভাবেই হোক না কেন তা বিবেচনা না করেই (আমি "বসে থাকি" যেটিই আমার প্রশ্নের উত্তরের উত্তর দেয় "যার অর্থ আমি বিভিন্ন সমস্যার জন্য উভয়কেই পছন্দ করি), এর কোন যুক্তি নেই যে ব্যবহারের সহজতা যে কোনও সরঞ্জামের জন্য একটি সত্যিকারের ইউটিলিটি।
ক্লিফ এবি

অবশ্যই, যদি আপনার সরঞ্জামটি ঘন ঘন একটি ভয়ঙ্কর পণ্য উত্পাদন করে যা একটি সমস্যা। এবং যদি আমি নিশ্চিত হয়ে যে একটি ঘন ঘনবাদী পদ্ধতি এটি করছে তবে বায়সিয়ান পদ্ধতিটি না থাকলে আমি খুব দ্রুত বায়েশিয়ান পদ্ধতিটিকে সমর্থন করব।
ক্লিফ এবি

1
@ ক্লিফ্যাব: সহজেই ব্যবহারের বিষয়টি গুরুত্বপূর্ণ, এবং আপনি যেমন বলছেন ফলাফলগুলি যদি সমান মানের হয় তবে কেন ব্যবহার করতে আরও কঠোর? একই সময়ে, স্পষ্ট করে তৈরি এবং প্রবীণদের বোঝার বিষয়ে চিন্তা করা (বায়েশিয়ান নয়, আমি আক্ষরিক অর্থেই বলতে চাইছি প্রতিটি বিজ্ঞানী, প্রতিটি ক্ষেত্র এবং প্রতিটি গবেষণা রয়েছে) ভাল বিজ্ঞানের পক্ষে সমালোচনা করে to বায়েশিয়ান পরিসংখ্যান সুস্পষ্ট এবং আপনাকে এই বিষয়গুলির কয়েকটি সম্পর্কে ভাবতে এবং বুঝতে বাধ্য করে। যে পরিমাণে এটি কেবলমাত্র পেডেন্টিক অসুবিধা নয়, এটি তাত্ক্ষণিকভাবে ভাল এবং তাই এর বিপরীতটি স্ল্যাম-ডঙ্কও ভাল নয়।
ওয়েন

23

ঘনঘনবাদী পরিসংখ্যানগুলির কয়েকটি কংক্রিট সুবিধা:

  • ঘন ঘন সমস্যাসমূহের প্রায়শই ক্লোজড-ফর্ম সমাধান রয়েছে যখন আপনি বয়েসিয়ান অ্যানালগের একটি বদ্ধ ফর্ম সমাধান করার আগে একটি কনজুগেটের প্রয়োজন হবে। এটি বিভিন্ন কারণে কার্যকর - যার মধ্যে একটি গণনার সময়।
  • একটি কারণ যা আশাকরি, শেষ পর্যন্ত চলে যাবে: সাধারণ মানুষকে ঘন ঘন বিশেষজ্ঞের পরিসংখ্যান শেখানো হয়। আপনি যদি অনেকের দ্বারা বুঝতে চান তবে আপনার ঘন ঘন কথা বলতে হবে।
  • নকল হাইপোথিসিস সিগন্যাফিকেশন টেস্টিং (এনএইচএসটি) দৃষ্টিভঙ্গিটি যখন কোনও ব্যক্তিকে ভুল প্রমাণ করা হয় তখন ("আমি আপনার অধিকারটি ধরে নেব এবং ডেটা অত্যধিক ডেটা দেখিয়ে যাচ্ছি যে আপনি ভুল বলছেন) তা প্রমাণ করার জন্য একটি" নির্দোষ প্রমাণিত হওয়া অবধি "কার্যকর হয়। হ্যাঁ, বয়েশিয়ানে এনএইচএসটি এনালগ রয়েছে তবে আমি ঘন ঘনবাদীদের সংস্করণগুলি আরও অনেকগুলি সোজা-এগিয়ে এবং ব্যাখ্যাযোগ্য হিসাবে দেখতে পাই।
  • নেই কোন ধরনের জিনিস হিসেবে সত্যিই যা কিছু লোক অস্বস্তিকর করে তোলে Uninformative পূর্বে।

1
(+1) ধন্যবাদ - আপনি কি প্রথম পয়েন্টটি কিছুটা পরিষ্কার করতে পারবেন? কেউ যেমন বায়েশিয়ান সম্পর্কে দক্ষ নন, আপনি "কনজুগেট পূর্ব" (?) এর প্রয়োজনীয়তার বিষয়ে যে
বক্তব্যটি তুলে ধরছেন তা

5
আমি মনে করি না আপনি ঘনঘনবাদী হাইপোথিসিস পরীক্ষাকে সঠিকভাবে ব্যাখ্যা করছেন। আপনি সবেমাত্র , কিন্তু পি-মানটি আসলে । পি-মানটির সঠিক ব্যাখ্যা: শূন্যের পরে, পর্যবেক্ষণের পরে কেবলমাত্র চরম বা আরও চরম হিসাবে ফলাফল পাওয়ার সম্ভাবনা আছে। %। বয়েসিয়ান পদ্ধতির পক্ষে যুক্তি দেখানোর সময় এই ভুল ব্যাখ্যাটি প্রায়শই উত্থাপিত হয়। তা ছাড়া আমি আপনার উত্তরটি পছন্দ করি। P ( D a t a)P(H0|Data)αP(Data|H0)α
জাচারি ব্লুমেনফিল্ড

@ জাচারি ব্লুমেনফিল্ড এটি উল্লেখ করার জন্য ধন্যবাদ, আমার মনে বায়েশিয়ান ছিল। আমি এখন এটি ঠিক করুন।
ট্রায়নাডোস্ট্যাট

1
@ জাসাকালুক যদি উত্তর ও পূর্ববর্তীগুলি একই বন্টন হয় তবে পূর্ববর্তীটি সংযুক্ত হিসাবে বলা হয় - বন্ধ ফর্মের উত্তরোত্তর গ্যারান্টি রয়েছে। উদাহরণস্বরূপ, যদি আমাদের ডেটা বার্নুলি হয় এবং আমরা আগে একটি বিটা ( , ) বেছে নিয়েছিলাম তবে আমরা জানি যে উত্তরোত্তরটি হ'ল বিটা ( , ) কোনও অনুকরণ, নমুনা বা তীব্র গণনা না করে। αβα+i=1nxiβ+ni=1nxi
ট্রায়নাডোস্ট্যাট

16

অবিলম্বেবাদী পদ্ধতিগুলি ব্যবহার করার সর্বাধিক গুরুত্বপূর্ণ কারণ, যা অবাক হওয়ার মতো এখনও উল্লেখ করা হয়নি, এটি ত্রুটি নিয়ন্ত্রণ। খুব প্রায়শই, গবেষণা দ্ব্যর্থহীন ব্যাখ্যার দিকে পরিচালিত করে (আমি কি এই বিষয়ে একটি স্টাডি বিল্ডিং করা উচিত, না? একটি হস্তক্ষেপ বাস্তবায়ন করা উচিত, না?)। ক্রমবর্ধমান পন্থাগুলি আপনাকে আপনার প্রকার 1 ত্রুটির হারকে কঠোরভাবে নিয়ন্ত্রণ করতে দেয়। বায়েশিয়ান পন্থাগুলি নেই (যদিও কিছু সম্ভাব্যতার কাছাকাছি থেকে সার্বজনীনভাবে আবদ্ধ হয়, তবে তবুও, ত্রুটির হার ছোট নমুনাগুলিতে এবং অপেক্ষাকৃত কম প্রান্তিক প্রমাণ সহ (যেমন, বিএফ> 3) খুব বেশি হতে পারে Fre আপনি ফ্রিকোয়েনসিস্ট বৈশিষ্ট্যগুলি পরীক্ষা করতে পারেন বেইস ফ্যাক্টর (উদাহরণস্বরূপ দেখুন http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2604513) তবে এটি এখনও একটি ফ্রিকোয়েন্সিস্ট পদ্ধতি। আমি প্রায়শই মনে করি, গবেষকরা ত্রুটি নিয়ন্ত্রণ সম্পর্কে সেকেন্ড (কিছু নির্দিষ্ট অনুমানের সাথে তুলনামূলক) প্রমাণের চেয়ে বেশি যত্নবান হন এবং আমি মনে করি খুব কমপক্ষে, সবাই কিছুটা ত্রুটি নিয়ন্ত্রণের বিষয়ে যত্নশীল, এবং এইভাবে দুটি পদ্ধতির ব্যবহার করা উচিত complementarily।


ভাল যুক্তি. আমি গ্রুপ-সিক্যুয়াল পদ্ধতিগুলি এবং একাধিক পরীক্ষার অন্যান্য ফর্মগুলি সম্পর্কেও ভাবছি, যেখানে মনে হয় (আমার সংকীর্ণ দৃষ্টিকোণ থেকে, যা সাহিত্যের যথেষ্ট অংশকে উপেক্ষা করেছে) বায়েশিয়ার পক্ষে আগ্রহের অভাব ছিল (তাই দূরে) একরকম ত্রুটি নিয়ন্ত্রণ পাওয়ার শর্তে। অবশ্যই অনেক পরিস্থিতিতে বায়েশিয়ান পদ্ধতিগুলি - বিশেষত কিছুটা সংশয়ী প্রিয়ার বা একটি শ্রেণিবিন্যাসের মডেলটির মাধ্যমে কিছুটা সঙ্কুচিত হওয়ার সাথে কিছুটা অগ্রহণযোগ্য ডিগ্রি ত্রুটি নিয়ন্ত্রণ করতে পারে, তবে সেখানকার ঘন ঘনবাদী পক্ষ নিয়ে আরও অনেক চিন্তাভাবনা করা হয়েছে।
Björn

3
(+1) আমি এই বিষয়টি সত্যিই পছন্দ করি ... কারণ এটি কারণেই আমি দার্শনিকভাবে ঘন ঘন ঘন ঘনবাদী .... যখন আমরা পরিসংখ্যানের সাথে সহায়তা করার জন্য পরিসংখ্যান করি তখন আমরা আমাদের সূচনাগুলি আরও নির্ভুল হওয়া চাই (অর্থাত কম ত্রুটি) অন্ধ অনুমান করার চেয়ে। প্রকৃতপক্ষে, আমি যদি আমার ইনফারেন্সগুলি প্রকৃতপক্ষে সত্য বা মিথ্যা (ফলো-অন স্টাডিজ দ্বারা বৈধ হওয়ার অর্থে) সম্পর্কে কিছুটা বিবেচনা করি তবে ত্রুটির হারগুলি খুব গুরুত্বপূর্ণ। আমি কেবল বায়েশিয়ান সম্ভাব্যতার সাথে স্বাচ্ছন্দ্য বোধ করতে পারি না (তবে, নমুনার আকার যখন ছোট থাকে তখন পদ্ধতিগুলি সেগুলি বুদ্ধিমান "নিয়মিত অনুমানকারী" হিসাবে খুব কার্যকর ... মনে হয় অ্যাগ্রিসিট-কল)

এটি বেয়েস / ঘন ঘন তুলনামূলক তুলনায় সিদ্ধান্ত তত্ত্বের মতো বেশি শোনাচ্ছে। এছাড়াও, বায়সিয়ান পদ্ধতির সাথে আপনার বিধি বন্ধ করার বিষয়ে চিন্তা করার দরকার নেই .... আমি আরও বুঝতে পারি যে বেইস টাইপ 1 এবং টাইপ 2 ত্রুটির হারের মধ্যে আরও ভাল "ভারসাম্য" অর্জন করতে পারে ....
সম্ভাব্যতা ব্লগ

8

আমি মনে করি একটি পরিসংখ্যানবিদ হিসাবে আপনাকে নিজের কাছে সবচেয়ে বড় প্রশ্নটি জিজ্ঞাসা করতে হবে যে আপনি সম্ভাবনার নীতিটি বিশ্বাস করেন বা মানতে চান want আপনি যদি সম্ভাবনার নীতিতে বিশ্বাসী না হন তবে আমি মনে করি পরিসংখ্যানগুলির ঘন ঘন দৃষ্টান্তটি অত্যন্ত শক্তিশালী হতে পারে তবে আপনি যদি সম্ভাবনার নীতিতে বিশ্বাসী হন তবে অবশ্যই (আমি বিশ্বাস করি) আপনাকে অবশ্যই বায়েশীয় দৃষ্টান্তটি সমর্থন করতে হবে বা এটি লঙ্ঘন না।


আপনি যদি এটির সাথে অপরিচিত থাকেন তবে সম্ভাব্য নীতিটি আমাদের যা বলে তা নীচে:

সম্ভাবনার নীতি :কিছু তথ্যপরিলক্ষিতহওয়ারপরেসম্পর্কে সূচনা বা সিদ্ধান্ত নেওয়ার ক্ষেত্রে, সমস্ত প্রাসঙ্গিক পরীক্ষামূলক তথ্য সম্ভাবনাঅন্তর্ভুক্ত থাকে : যেখানেobserved পর্যবেক্ষণ করা ডেটার সাথে সামঞ্জস্য করে এবং এইভাবে সংশোধন করা হয়।θx

(θ;x)=p(x|θ)
x

তদ্ব্যতীত, যদি এবং two দুটি নমুনা বিন্দু যেমন সমানুপাতিক হয় , সেখানে একটি ধ্রুবক যেমনxy(θ;x)(θ;y)C(x,y)

(θ;x)=C(x,y)(θ;y)for all θ,

তারপরে এবং from থেকে প্রাপ্ত সিদ্ধান্তগুলি একরকম হওয়া উচিত \yxy

দ্রষ্টব্য যে উপরের ধ্রুবক বিভিন্ন জোড়ার জন্য পৃথক হতে পারে তবে উপর নির্ভর করে না ।C(x,y)(x,y)θC(x,y)θ

এর বিশেষ ক্ষেত্রে, সম্ভাবনা নীতিতে বলা হয়েছে যে দুটি নমুনা পয়েন্ট যদি একই সম্ভাবনা ফাংশনটির ফলস্বরূপ হয়, তবে তারা সম্পর্কে একই তথ্য রাখে । তবে সম্ভাবনার নীতিটি আরও এগিয়ে যায়। এটিতে বলা হয়েছে যে দুটি নমুনা পয়েন্টের যদি কেবলমাত্র আনুপাতিক সম্ভাবনা থাকে তবে তারা equivalent সম্পর্কে সমতুল্য তথ্য ধারণ করে ।θ θC(x,y)=1θθ


এখন, বায়েশিয়ান পরিসংখ্যানগুলির একটি অঙ্কন হ'ল, যথাযথ প্রিরিয়ারদের অধীনে বায়েসীয় দৃষ্টান্ত কখনও সম্ভাবনার নীতি লঙ্ঘন করে না। যাইহোক, খুব সাধারণ পরিস্থিতি রয়েছে যেখানে ঘন ঘনবাদী দৃষ্টান্ত সম্ভাবনা নীতি লঙ্ঘন করবে।

অনুমানের পরীক্ষার উপর ভিত্তি করে এখানে একটি খুব সাধারণ উদাহরণ। নিম্নোক্ত বিবেচনা কর:

এমন একটি পরীক্ষা বিবেচনা করুন যেখানে 12 বার্নোল্লি ট্রায়াল চালানো হয়েছিল এবং 3 টি সাফল্য লক্ষ্য করা গেছে। থামার নিয়মের উপর নির্ভর করে আমরা ডেটাগুলি নিম্নলিখিত হিসাবে চিহ্নিত করতে পারি:

  • দ্বিপদী বিতরণ: এবং ডেটা:x = 3X|θBin(n=12,θ)x=3
  • দ্বিপদী বিতরণ: এবং ডেটা:Y = 12Y|θNegBin(k=3,θ)y=12

এবং এইভাবে আমরা নিম্নলিখিত সম্ভাব্য ফাংশনগুলি অর্জন করব: যা বোঝায় এবং সুতরাং সম্ভাবনা নীতি অনুসারে আমাদের উভয় সম্ভাবনা থেকেই সম্পর্কে একই উচিত ।

1(θ;x=3)=(123)θ3(1θ)92(θ;y=12)=(112)θ3(1θ)9
1(θ;x)=C(x,y)2(θ,y)
θ

এখন, দৃষ্টান্ত থেকে নিম্নলিখিত অনুমানগুলি পরীক্ষা করার কল্পনা করুন

Ho:θ12versusHa:θ<12

দ্বিপদী মডেলের জন্য আমাদের নিম্নোক্ত বিষয়গুলি রয়েছে:

p-value=P(X3|θ=12)=(120)(12)12+(121)(12)12+(122)(12)12+(123)(12)12=0.0723

লক্ষ্য করুন যে তবে অন্যান্য শর্তাদি সম্ভাবনা নীতি সন্তুষ্ট না।(123)(12)12=1(12;x=3)

Gণাত্মক দ্বিপদী মডেলের জন্য আমাদের নিম্নোক্ত বিষয়গুলি রয়েছে:

p-value=P(Y12|θ12)=(112)(12)12+(122)(12)12+(132)(12)12+...=0.0375

উপরের পি-মান গণনাগুলি থেকে আমরা দেখতে পাই যে দ্বিপদী মডেলটিতে আমরা প্রত্যাখ্যান করতে ব্যর্থ কিন্তু নেতিবাচক দ্বিপদী মডেল ব্যবহার করে আমরা প্রত্যাখ্যান । সুতরাং, যদিও সেখানে পি-মান এবং এই পি-মানগুলির উপর ভিত্তি করে সিদ্ধান্তগুলি মিলে যায় না। এই পি-মান যুক্তিটি প্রায়শই ফ্রেইসিডনিস্ট পি-মানগুলির বিরুদ্ধে বায়েশিয়ানরা ব্যবহার করে।HoHo1(θ;x)2(θ;y)

নীচের হাইপোথিসিসগুলি পরীক্ষা করার জন্য এখন আবার বিবেচনা করুন, তবে দৃষ্টান্তের

Ho:θ12versusHa:θ<12

দ্বিপদী মডেলের জন্য আমাদের নিম্নোক্ত বিষয়গুলি রয়েছে:

P(θ12|x)=1/21π(θ|x)dx=1/21θ3(1θ)9π(θ)dθ/01θ3(1θ)9π(θ)dθ

তেমনি, নেতিবাচক দ্বিপদী মডেলের জন্য আমাদের নিম্নলিখিতগুলি রয়েছে:

P(θ12|y)=1/21π(θ|x)dx=1/21θ3(1θ)9π(θ)dθ/01θ3(1θ)9π(θ)dθ

এখন বায়েশিয়ার সিদ্ধান্তের বিধিগুলি ব্যবহার করে, যদি some (বা অন্য কিছু প্রান্তিক) এবং জন্য একইভাবে পুনরাবৃত্তি করুন ।HoP(θ12|x)>12y

তবে, এবং তাই আমরা এখানে পৌঁছেছি একই উপসংহার এবং এই পদ্ধতি সম্ভাবনার নীতিটি সন্তুষ্ট করে।P(θ12|x)=P(θ12|y)


এবং তাই আমার দুর্বৃত্তদের অবসান করার জন্য, যদি আপনি সম্ভাবনার নীতিটি যত্ন না করেন তবে ঘন ঘনবাদী হওয়া মহান! (আপনি যদি বলতে না পারেন, আমি একজন বায়েশিয়ান :))


1
আমি স্পষ্টভাবে চিন্তাশীল (এবং সম্ভবত সময়সাপেক্ষ) প্রতিক্রিয়াটির প্রশংসা করি, তবে আমি মনে করি এই উত্তরটি "উত্তরগুলি ... যতটা সম্ভব অ্যাক্সেসযোগ্যভাবে জানানো হয়েছে ..." প্রশ্নের ম্যান্ডেট থেকে দূরে যাওয়া।
জাসাকালুক

1
@ জাসাকালুক আমি অনুমান করি যে আমি কী লক্ষ্য করেছিলাম এবং যুক্তিটি ব্যাক আপ করতে চাইছে তা হ'ল আপনি যদি প্রয়োগকৃত পরিসংখ্যানবিদরা সমস্ত সময় গ্রহণের জন্য অর্থ গ্রহণের সম্ভাবনা নীতিটি অবহেলা করতে চান তবে তা ব্যবহার করে ঘনঘনবাদী দৃষ্টান্ত বায়েশীয় দৃষ্টান্তের জন্য অনেক সহজ বিকল্প হতে পারে। তবে, আপনি যদি না পারেন তবে আপনাকে সম্ভবত বিকল্পগুলি খুঁজে পেতে হবে।
রাস্টিস্ট্যাটিস্টিয়ান

4
@ রাস্টিস্ট্যাটাস্টিকিয়ান সম্ভাবনা নীতি সম্ভাবনাবিদদের একটি কেন্দ্রীয় শিক্ষিকা। Likelihoodists Bayesian নয় এ সব । আমি আমার উত্তরে লিঙ্ক পোস্ট করেছি। আপনার দাবি "যদি আপনি সম্ভাবনা নীতিতে বিশ্বাসী হন, তবে (আমি বিশ্বাস করি) আপনাকে অবশ্যই বায়েশীয় দৃষ্টান্তকে সমর্থন করতে হবে" এটি মিথ্যা।
stan

@ স্ট্যান আমি আপনার সাথে একমত যে হ্যাঁ সম্ভাবনাবিদরা সম্ভাবনা নীতিতে নিশ্চিত বিশ্বাস করে believe তবে আমার বিশ্বাস করা অত্যন্ত কঠিন যে আপনি যদি কোনও বায়েশিয়ানকে জিজ্ঞাসা করেন যে তারা যদি সম্ভাবনা নীতিটি মেনে চলতে বিশ্বাস করে যে তারা বলবে না যে তারা না করে (এটিই আমার মতামত আপনাকে সম্মত করতে হবে না)।
রাস্টিস্ট্যাটিকস্টিয়ান

2
সম্ভাব্য নীতি (এলপি), শর্তসাপেক্ষ নীতি (সিপি) এবং যথাযথ নীতি (এসপি) এর ভূমিকা যথাযথ নয়..এটি কারণ হ'ল এই নীতিগুলি প্রমাণের সাথে সম্পর্কিত (ডেটা দ্বারা উপস্থাপিত), যেখানে অনুমানের প্রমাণের বাইরে চলে যাওয়া জড়িত । এটি সর্বদা ঝুঁকিপূর্ণ, তবে অগ্রগতি করা প্রয়োজনীয়। বার্নবামস উপপাদ্য দেখুন (এখানে আলোচনা করা হয়েছে ... আমি অবশ্যই বাকী

6

আপনি এবং আমি দুজনেই বিজ্ঞানী এবং বিজ্ঞানী হিসাবে প্রমাণের প্রশ্নে প্রধানত আগ্রহী। সেই কারণে, আমি মনে করি যে বায়সিয়ানরা যখন সম্ভব হয় তখন তার চেয়ে বেশি পছন্দ হয়।

বায়েশিয়ান আমাদের প্রশ্নের উত্তর দেয়: অন্য একটি অনুমানের পক্ষে প্রমাণের শক্তি কী? অন্যদিকে ঘনঘনবাদী দৃষ্টিভঙ্গিগুলি করবেন না: তারা কেবলমাত্র একটি অনুমানের ভিত্তিতে তথ্য অদ্ভুত কিনা তা রিপোর্ট করে report

এটি বলেছিল, উল্লেখযোগ্য বায়েশিয়ান অ্যান্ড্রু গেলম্যান মডেল নির্দিষ্টকরণের ত্রুটিগুলির তদন্ত হিসাবে পি-ভ্যালু (বা পি-মানের-মতো গ্রাফিকাল চেক) ব্যবহারকে সমর্থন করেছেন বলে মনে হচ্ছে। আপনি এই ব্লগ পোস্টে এই পদ্ধতির একটি ইঙ্গিত দেখতে পারেন ।

তাঁর ধারণাটি যেমন আমি বুঝতে পেরেছি, এটি দ্বি-পদক্ষেপের প্রক্রিয়ার মতো কিছু: প্রথমত, তিনি বায়েশিয়ানকে জিজ্ঞাসা করেন যে একটি মডেলের জন্য অন্যটির প্রমাণ কী? দ্বিতীয়ত, তিনি পছন্দের মডেলটি ডেটা প্রদত্ত সমস্ত প্রশংসনীয়কে লক্ষ্য করে কিনা তা সম্পর্কে ফ্রিকোয়ালিস্ট প্রশ্ন জিজ্ঞাসা করেন। এটি আমার কাছে যুক্তিসঙ্গত হাইব্রিড পদ্ধতির মতো বলে মনে হচ্ছে।


1
যদিও গেলম্যান ব্লগের লিঙ্কটি বৈধ থাকবে, তবে মধ্যরাতের পরে এটি "আজকের" হবে না। সেই অনুসারে সম্পাদিত।
নিক কক্স

8
ঘন ঘনবাদী দৃষ্টিভঙ্গি প্রমাণ পরিমাপ করে না, এবং এটি কেবলমাত্র বায়েশীয় বিশ্বেই এই প্রবন্ধটির সাথে আমি দৃ strongly়ভাবে একমত নই। আপনি হাইপোথিসিস টেস্টিংয়ের উত্সকে ছেড়ে চলে যাচ্ছেন, যেমন এলআর টেস্ট, অন্যের পক্ষে প্রমাণের বিরুদ্ধে একটি অনুমানের প্রমাণ পরিমাপ করে।
ক্লিফ এবি

1
(+1) থেকে @ ক্লিফএবি - "ঘন ঘনবাদী" পরিসংখ্যান সম্পর্কে ভাবার জন্য প্রত্যেকের জন্য দয়া করে "সম্ভাবনা অনুপাত", "বার্নবাউমের উপপাদ্য" দেখুন এবং সম্ভবত খানিকটা রায়ল পড়ুন .... খড়ের উপর ঝাঁপ দাও না - মানুষের যুক্তি NHST- এর সাথে জড়িত - যা বলে মনে হয় যে এটির বিপর্যয়মূলক ত্রুটি থাকা সত্ত্বেও বৈজ্ঞানিক অগ্রগতি কমেনি বলে মনে হচ্ছে .... এর কারণ পরিসংখ্যানবিদরা কার্বন-ভিত্তিক MINITAB প্রোগ্রাম নয় ... তারা ভাবেন [হ্যাঁ, পরিসংখ্যান করছেন আসলে একটি পেশা, যেমন medicineষধ, বা অর্থনীতি বা অটো-মেকানিক্সের মতো ... আপনি কেবল একটি বই পড়তে পারবেন না, একটি সূত্র চেষ্টা করতে পারেন এবং সত্যকে নিজের কোলে নেওয়ার আশা করতে পারেন]।

2
@ বে: ব্যক্তিগতভাবে, আমি বিশ্বাস করি যে পি-মানগুলি বৈজ্ঞানিক প্রক্রিয়াটির জন্য কিছুটা দুর্বল করেছে (যে ক্ষেত্রে জীববিজ্ঞানীরা খণ্ডকালীন পরিসংখ্যানবিদদের কাগজপত্র প্রকাশের জন্য বাধ্য করা হয়েছে, তারা জীববিজ্ঞান হওয়ার সময় হ্রাস করেছেন), তবে আমি তা করি না কোনওভাবেই পি-মানগুলির বিকল্পগুলি এই সমস্যাটি হ্রাস করবেন বলে মনে করবেন না! আমি অনুভব করি যে পি-মানগুলির বিষয়টি তাদের তাত্ত্বিক পটভূমি নয়, তবে অ-পরিসংখ্যানবিদদের দ্বারা তাদের ব্যবহারের সহজতা। উত্তরোত্তর সম্ভাবনা, (উদাহরণস্বরূপ) আমি মনে করি যে নির্দিষ্ট বিষয়টিকে আরও ভাল না করে আরও খারাপ করা হবে।
ক্লিফ এবি

2
@ ক্লিফ্যাব আরও সম্মত হতে পারে না ... এটি সেদিক থেকে ভাবেন নি..কিন্তু এটি কেবল প্রকাশের প্রকৃতি বলে আমি মনে করি ... গবেষণা বিভাগগুলি কর্মীদের পরিসংখ্যানবিদদের সামর্থ্য না করা পর্যন্ত। যে কোনও পরিসংখ্যানের সরঞ্জাম এর ব্যবহারে জ্ঞানহীন কোনও দ্বারা অপব্যবহার করা যেতে পারে ... করুণা পরিসংখ্যান সরঞ্জামগুলি ব্যবহার করা এত সহজ বলে মনে হচ্ছে ...

6

ব্যক্তিগতভাবে আমি এমন পরিস্থিতি ভাবতে অসুবিধা বোধ করছি যেখানে একজন বেইশিয়ানর চেয়ে ঘন ঘনবাদী উত্তরকে অগ্রাধিকার দেওয়া হবে। আমার চিন্তাভাবনা এখানে এবং p- মান এবং নাল অনুমানের পরীক্ষার সমস্যা সম্পর্কে fharrell.com এর অন্যান্য ব্লগ নিবন্ধে বিশদ is ঘন ঘনवादীরা কয়েকটি মৌলিক সমস্যা উপেক্ষা করার প্রবণতা রাখে। এখানে মাত্র একটি নমুনা দেওয়া হয়েছে:

  • ধ্রুব বৈকল্পিক এবং কয়েকটি অন্যান্য ক্ষেত্রে গসিয়ান লিনিয়ার মডেলের বাইরে, গণনা করা পি-মানগুলি আপনার ডেটাসেট এবং মডেলের জন্য অজানা নির্ভুলতার জন্য
  • যখন পরীক্ষাটি অনুক্রমিক বা অভিযোজিত হয়, এটি প্রায়শই এমন হয় যে কোনও পি-মান এমনকি গণনা করা যায় না এবং এটি অর্জনের জন্য কেবল একটি সামগ্রিক- স্তর নির্ধারণ করতে পারেα
  • ক্রমবর্ধমানবাদীরা প্রথম ধরণের ত্রুটিটি নীচে না যেতে বলে খুশি বলেছিলেন, বলুন, এখনই নমুনার আকারটি বৃদ্ধি পাবে 0.05 না
  • বহুগুণ সংশোধন কীভাবে গঠন করা হয় তার জন্য কোনও ঘনঘনবাদী প্রেসক্রিপশন নেই, যার ফলে পদ্ধতিগুলির একটি অ্যাডহক হজ-পোজ হয়

প্রথম বিষয়টির বিষয়ে, একটি সাধারণভাবে ব্যবহৃত মডেল হ'ল বাইনারি লজিস্টিক মডেল। এর লগ সম্ভাবনা খুব অ-চতুর্ভুজযুক্ত, এবং এই জাতীয় মডেলগুলির জন্য গণনা করা বিশাল আত্মবিশ্বাস সীমা এবং পি-মানগুলি খুব সঠিক নয়। এটি বৈয়েশিয়ার লজিস্টিক মডেলের সাথে বিপরীতে করুন, যা সঠিক অনুমান সরবরাহ করে।

অন্যরা ঘনঘনবাদী অনুমান ব্যবহারের কারণ হিসাবে ত্রুটি নিয়ন্ত্রণকে উল্লেখ করেছেন । আমি এটিকে যৌক্তিক বলে মনে করি না, কারণ তারা যে ত্রুটিটি উল্লেখ করে তা হ'ল দীর্ঘমেয়াদী ত্রুটি, এমন একটি প্রক্রিয়াটি কল্পনা করে যাতে হাজারে পরিসংখ্যান পরীক্ষা হয়। একজন বিচারক যিনি বলেছিলেন যে "আমার আদালতে দীর্ঘমেয়াদী মিথ্যা দৃiction় প্রমাণের সম্ভাবনা কেবল 0.03" তা বাতিল করা উচিত। বর্তমান আসামীটির পক্ষে সঠিক সিদ্ধান্ত নেওয়ার সর্বোচ্চ সম্ভাবনা থাকার অভিযোগ তার বিরুদ্ধে রয়েছে । অন্যদিকে একটি বিয়োগের প্রভাবের পরবর্তী সম্ভাবনা হ'ল শূন্য বা পিছনের দিকের প্রভাবের সম্ভাব্যতা এবং এটি আমাদের আসলে ত্রুটির সম্ভাবনা।


2
"কীভাবে বহুগুণ সংশোধন হয় তার জন্য কোন ঘন ঘন প্রেসক্রিপশন নেই, যার ফলে পদ্ধতিগুলির একটি অ্যাডহক হজ-পোজ হয়।" অন্যদিকে, আমি কখনও কোনও বায়েশিয়ানকে বহুগুণ সংশোধন করতে দেখিনি। অ্যান্ড্রু গেলম্যান এমনকি গর্বের সাথে ঘোষণা করেছিলেন যে তিনি সেগুলি কখনও ব্যবহার করেন না। উদাহরণস্বরূপ, আমি লোকেরা প্রান্তিক 95% বিশ্বাসযোগ্য অন্তরগুলি প্রতিবেদন করে দেখেছি , তবে এই অন্তরগুলির যৌথ বিশ্বাসযোগ্যতা 95% নয়। না এটি সুস্পষ্টভাবে কীভাবে এটি সমাধান করা যায়। আপনার কোন পরামর্শ বা উদাহরণ আছে? θ1,,θkk
সিভিলস্ট্যাট

5

তৃতীয় দার্শনিক বিদ্যালয়: সম্ভাবনাবাদ সম্পর্কে অনেক লোক সচেতন বলে মনে হয় না। এডাব্লুএফ এডওয়ার্ডসের বই, সম্ভাবনা, এটি পড়ার জন্য সম্ভবত সেরা জায়গা। এখানে তিনি লিখেছেন একটি ছোট নিবন্ধ।
সম্ভাবনাবাদ বায়েশিয়ানিজমের মতো পি-ভ্যালুগুলিও বজায় রাখে, তবে বায়সিয়ানদের প্রায়শই সন্দেহজনক পূর্বকেও বর্জন করে। সেখানে একটি ভূমিকা চিকিত্সা এখানে হিসাবে ভাল।


5
কোভমোগোরভের ধারণাগুলি থেকে উন্নত ভভকের অ্যালগরিদমিক সম্ভাবনা রয়েছে।
আকসকল

2
"অনেক মানুষ তৃতীয় দার্শনিক স্কুল সচেতন বলে মনে হচ্ছে না: likelihoodism" আমি মনে করি না এই বাক্য 2016 সালে সত্য না ...
টিম

4
@ টিম, যদিও আমার পরিচিত প্রত্যেক ব্যক্তি ঘনত্ব এবং বায়েশিয়ানবাদের সাথে পরিচিত, তবে সম্ভাব্যতার কথা শুনে এমন কাউকে আমি কখনও পাইনি । মূল প্রশ্নকর্তা মনে হয় আমার সহকর্মীদের মতো যারা ঘন ঘন প্রশিক্ষণ পেয়েছিলেন এবং বায়সিয়ানবাদে ক্রমবর্ধমান আগ্রহী হয়ে উঠছেন। সম্ভবত বেশিরভাগ লোকেরা যারা আমার উত্তরটি পড়েছেন তারা মনে করেন যে আমি সম্ভাবনা অনুপাত ব্যবহার করে সর্বাধিক সম্ভাবনার অনুমান বা অনুমানগুলি পরীক্ষা করছি। নাঃ! আমি আপনাকে পরামর্শ দিচ্ছি Yudi Pawitan এবং এই বক্তৃতা
স্ট্যান

7
সেই পন্থা কোনটি ধর্ম, তাই বিশ্বাস করতে অনেক না হয়, তারা সমস্যার নির্দিষ্ট ধরনের মাত্র সহায়ক হয়, এবং পন্থা এককে অপরের জন্যে :) কিছু সমস্যা জন্য ভাল উপযুক্ত এবং অন্যান্য হয়
টিম

1
(+1) সম্ভাবনা বিদ্যালয়ের উল্লেখ করার জন্য এবং পাভিতান সম্পর্কিত মন্তব্যের জন্য। পাভিটনের "ইন অল প্রসপিলিটিস" বইটি নাটকীয়ভাবে প্রশস্ত হয়েছে এবং পরিসংখ্যান চর্চা দ্বারা বর্ধিত হয়েছে ... আমি কেবল বয়েস বনাম ফ্রিকোয়েন্সিজ সম্পর্কেও অবগত ছিলাম। তিনি বেয়েসের প্রচলিত দার্শনিক ও পদ্ধতিগত দিকগুলি, "ধ্রুপদী" ঘনত্ববাদ এবং অবশ্যই নির্ভুল সম্ভাবনার বিদ্যালয়টিকে আচ্ছাদন করেছেন। আপনার দার্শনিক প্রবণতা নির্বিশেষে পরিসংখ্যানগুলির আরও পরিশীলিত ব্যবহারকারী হওয়ার জন্য কেবল একটি দুর্দান্ত বই।

4

মডেল বিল্ডিংয়ের ক্ষেত্রে ঘন ঘনবাদী পদ্ধতির সবচেয়ে বড় অসুবিধা সবসময়ই ছিল, ট্রায়নাডোস্ট্যাটস তার প্রথম পয়েন্টে উল্লেখ করেছে যে বড় ক্লোজড-ফর্ম সমাধানগুলি উল্টানোর সাথে জড়িত চ্যালেঞ্জগুলি। ক্লোজড-ফর্ম ম্যাট্রিক্স বিপরীতের জন্য পুরো ম্যাট্রিক্সটি র‍্যামের বাসিন্দা হওয়া দরকার, একক সিপিইউ প্ল্যাটফর্মে একটি গুরুত্বপূর্ণ সীমাবদ্ধতা হয় প্রচুর পরিমাণে ডেটা বা ব্যাপকভাবে শ্রেণিবদ্ধ বৈশিষ্ট্যগুলির সাথে। বায়েশিয়ান পদ্ধতিগুলি একটি নির্দিষ্ট পূর্বের থেকে এলোমেলো ড্র অনুকরণ করে এই চ্যালেঞ্জটি ঘিরে কাজ করতে সক্ষম হয়েছে। এটি সর্বদা বায়সিয়ান সমাধানগুলির বৃহত্তম বিক্রয় পয়েন্টগুলির মধ্যে একটি ছিল, যদিও উত্তরগুলি কেবল সিপিইউতে একটি উল্লেখযোগ্য ব্যয়ে পাওয়া যায়।

অ্যান্ড্রু আইনস্টি এবং কেন ট্রেন, প্রায় 10 বছর আগে একটি গবেষণাপত্রে যে মডেল-বিল্ডিংয়ের জন্য বায়েশিয়ান পদ্ধতির সাথে তুলনামূলক সীমাবদ্ধ মিশ্রণ (যা ঘন ঘনবাদী বা বদ্ধ ফর্ম) এর সাথে আমি উল্লেখটি হারিয়ে ফেলেছি এবং দেখতে পেয়েছি যে বিস্তৃত ক্রিয়ামূলক ফর্মাল ফর্ম এবং কর্মক্ষমতা মেট্রিক্স, দুটি পদ্ধতি মূলত সমতুল্য ফলাফল প্রদান করে। যেখানে বায়েশিয়ান সমাধানগুলির প্রান্ত ছিল বা বৃহত্তর স্বাচ্ছন্দ্য ছিল সেই উদাহরণগুলিতে যেখানে তথ্যগুলি খুব কম এবং খুব উচ্চ মাত্রার ছিল।

তবে, সেই কাগজটি "বিভাজন এবং বিজয়" অ্যালগরিদমগুলি তৈরি করার আগে লেখা হয়েছিল যে ব্যাপকভাবে সমান্তরাল প্ল্যাটফর্মগুলি উত্সাহিত করে, উদাহরণস্বরূপ, এই http://dimacs.rutgers.edu/TechnicalReports/TechReports/2012/2012- 01.pdf

ডি অ্যান্ড সি পদ্ধতির আগমনের অর্থ হ'ল এমনকি চুলচেরা, খুব কম, সবচেয়ে উচ্চ মাত্রিক সমস্যার জন্যও বয়েশিয়ান পদ্ধতির ঘন ঘন ঘনতান্ত্রিক পদ্ধতির চেয়ে কোনও সুবিধা নেই। দুটি পদ্ধতি সমান।

অপেক্ষাকৃত সাম্প্রতিক এই বিকাশটি যে কোনও পদ্ধতির ব্যবহারিক সুবিধা বা সীমাবদ্ধতা সম্পর্কে যে কোনও বিতর্ককে লক্ষ্য করার মতো।


আমি মনে করি এটি আলোচনার জন্য একটি দুর্দান্ত সংযোজন (+1) তবে এটি অনুসরণ করা আমার পক্ষে কঠিন। এটি সত্যই, সত্যই, তার পাঞ্চ-লাইনটি স্থগিত করে ... সম্ভবত আপনি এটি কিছুটা পুনর্গঠন করতে পারেন? :)
usεr11852

@ ইউজার ১১৮৮২ আপনি বলবেন না যে পোস্টটি কার্যকর কিছু বিষয়ে কথা বলতে ব্যর্থ হয়েছে তবে আপনি যুক্তিটির বিকাশকে সাংবাদিকতার মানদণ্ডে না দেখে পেয়ে গেছেন। যেহেতু এই থ্রেডটি "সম্প্রদায়" এ চলেছে, আমি আপনার পরামর্শের আশেপাশে এটি পুনর্গঠিত করার জন্য কাজ করতে খুব ঝুঁকির (প্রেরণা?) নই। এটি যেমন দাঁড়াতে পারে। তবে আপভোট এবং মন্তব্যের জন্য আপনাকে ধন্যবাদ thank
মাইক হান্টার

1.) ম্যাট্রিক্স বিপরীতটি প্রায়শই এমএলই অনুমানের জন্য ব্যবহৃত হয় (যা অনেকগুলি ঘন ঘন পদ্ধতিগুলির মধ্যে কেবল একটি), তবে সবসময় নয়। MLE প্রাক্কলন আমার কাজ পর্যন্ত প্রায়ই উপর অপ্টিমাইজেশান জড়িত পরামিতি (অর্থাত প্যারামিটার স্থান নমুনা আকার সঙ্গে সুসংগত বৃদ্ধি করতে পারেন) এবং ম্যাট্রিক্স বিপর্যয় একেবারে হয় না একটি বিকল্প ... কিন্তু আমি এখনও সম্ভাবনা নিখুত! ২) ম্যাট্রিক্স বিপর্যয় এখনও বেইসিয়ান পরিসংখ্যানগুলিতে সর্বদা ঘটে থাকে যেমন একটি ব্লক আপডেটার স্যাম্পলার। n
ক্লিফ এবি

@ ক্লিফ্যাব আমি ক্রস-পণ্যগুলির ম্যাট্রিক্সের আনোভা-টাইপ বিপরীতকরণের কথা ভাবছিলাম।
মাইক হান্টার

@ ডি জনসন: আমি দেখছি। তবে আমার বক্তব্যটি ছিল যে ম্যাট্রিক্স বিপরীতটি ঘন ঘন ঘন ঘন ঘন ঘন ঘন বেইসিয়ান পদ্ধতিগুলিতে অরথোগোনাল; উভয় শিবিরই এমন কৌশলগুলি ব্যবহার করে যা তাদের অনেক পদ্ধতিতে খুব অনুরূপ কিছু করে (কমপক্ষে গণনা ব্যয়ের ক্ষেত্রে)।
ক্লিফ এবি

3

ঘনঘটিত পরীক্ষাগুলি নাল হাইপোথিসিসকে মিথ্যা বলায় ফোকাস করে। তবে নুল হাইপোথিসিস সিগন্যাফিক্স টেস্টিং (এনএইচএসটি) বায়েশিয়ান দৃষ্টিকোণ থেকেও করা যেতে পারে, কারণ সমস্ত ক্ষেত্রে এনএইচএসটি কেবল পি এর গণনা (পর্যবেক্ষিত প্রভাব | প্রভাব = 0)। সুতরাং, ঘন ঘনবাদী দৃষ্টিকোণ থেকে এনএইচএসটি পরিচালনা করা যখন প্রয়োজন তখন এটি সনাক্ত করা শক্ত hard

বলা হচ্ছে, ঘন ঘনবাদী পদ্ধতির সাহায্যে এনএইচএসটি পরিচালনার সর্বোত্তম যুক্তি হ'ল স্বাচ্ছন্দ্য এবং অ্যাক্সেসযোগ্যতা। লোকজনকে ঘন ঘন পরিসংখ্যান শেখানো হয়। সুতরাং, ঘন ঘন NHST চালানো সহজ, কারণ আরও অনেক পরিসংখ্যান প্যাকেজ রয়েছে যা এটি করা সহজ করে তোলে। একইভাবে, ঘন ঘন NHST এর ফলাফলগুলি যোগাযোগ করা সহজ, কারণ NHST- এর এই ফর্মের সাথে লোকেরা পরিচিত। সুতরাং, আমি দেখছি যে ঘন ঘনবাদী পদ্ধতির জন্য সর্বোত্তম যুক্তি হিসাবে: পরিসংখ্যান প্রোগ্রামগুলির অ্যাক্সেসিবিলিটি যা তাদের চালাবে এবং সহকর্মীদের কাছে ফলাফলের যোগাযোগ সহজতর করবে। এটি কেবল সাংস্কৃতিক, সুতরাং ঘন ঘনবাদী দৃষ্টিভঙ্গি যদি তাদের আধিপত্য হারাতে পারে তবে এই যুক্তিটি পরিবর্তিত হতে পারে।


5
ফিশার কী ভাবেন সে সম্পর্কে মন্তব্যগুলি এখানে উত্সাহিত বলে মনে হচ্ছে যদি না আপনি সঠিক উদ্ধৃতি সরবরাহ করতে পারেন। নাল হাইপোথিসিস একটি নমুনা পরীক্ষার অংশ হিসাবে একটি ডিভাইস যা ছোট নমুনাগুলি থেকে অতিরিক্ত ব্যাখ্যা করার ফলাফল থেকে বিজ্ঞানীদের নিরুৎসাহিত করার চেষ্টা করে। ফিশার অন্য কারও মতোই আগ্রহী ছিলেন যে বিজ্ঞানীদের উচিত ভাল বিজ্ঞান করার জন্য পরিসংখ্যানগুলি ব্যবহার করা; তিনি নিজেই জেনেটিক্সের খুব গুরুতর অবদানকারী ছিলেন।
নিক কক্সবাজার

4
আমি সম্পূর্ণরূপে একমত, এবং তাই আমি ফিশারের মানসিক অবস্থা সম্পর্কে জল্পনা কল্পনা সরিয়ে উত্তরটি সম্পাদনা করেছি।
লিজ পেজ-গোল্ড

3

বেশ কয়েকটি মন্তব্য:

  • বেয়েসিয়ান এবং ঘন ঘনবাদী পরিসংখ্যানবিদদের মধ্যে মৌলিক পার্থক্য হ'ল বেইসিয়ান সম্ভাব্যতার সরঞ্জামগুলিকে এমন পরিস্থিতিতে প্রসারিত করতে ইচ্ছুক যেখানে ঘন ঘন ঘনবাদী তা করেন নি ist

    • আরও সুনির্দিষ্টভাবে, বেয়েসিয়ান বিভিন্ন পরামিতিগুলির মধ্যে তার নিজের মনে অনিশ্চয়তার নমুনা তৈরি করতে সম্ভাব্যতা ব্যবহার করতে ইচ্ছুক । ঘনত্ববিদদের কাছে এই প্যারামিটারগুলি স্কেলার (যদিও স্কেলার যদিও পরিসংখ্যানবিদ আসল মান জানেন না)। বায়েশিয়ানদের কাছে, বিভিন্ন পরামিতিগুলি এলোমেলো ভেরিয়েবল হিসাবে উপস্থাপিত হয়! এটি অত্যন্ত পৃথক। প্যারামিটার ভ্যালিয়াসের উপরে বায়েশিয়ানদের অনিশ্চয়তা একটি পূর্ববর্তী দ্বারা প্রতিনিধিত্ব করা হয় ।
  • বায়েশিয়ার পরিসংখ্যানগুলিতে আশা করা যায় যে ডেটা পর্যবেক্ষণ করার পরে, উত্তরোত্তর পূর্বটিকে অগ্রাহ্য করে, পূর্বের কোনও বিষয় নয়। তবে এটি প্রায়শই হয় না: ফলাফলগুলি পূর্বের পছন্দের প্রতি সংবেদনশীল হতে পারে! বিভিন্ন প্রিয়ার সহ বিভিন্ন বেইশিয়ানদের উত্তরোত্তরগুলির সাথে একমত হওয়ার দরকার নেই।

মনে রাখার একটি মূল বিষয় হ'ল ঘনত্বেবাদী পরিসংখ্যানবিদদের বক্তব্যগুলি এমন কোনও বিবৃতি যা পূর্ববর্তী বিশ্বাস নির্বিশেষে যে কোনও দুটি বায়েশিয়ান একমত হতে পারে!

ঘনঘনবাদী প্রিয়ার বা পোস্টারিয়ারগুলির বিষয়ে মন্তব্য করেন না, কেবল সম্ভাবনা।

কিছুটা ক্ষেত্রে ঘনত্ববাদী পরিসংখ্যানবিদদের বক্তব্যগুলি কম উচ্চাভিলাষী, তবে বায়সিয়ানদের সাহসী বক্তব্যগুলি পূর্বের কার্যভারের উপর উল্লেখযোগ্যভাবে নির্ভর করতে পারে। যে পরিস্থিতিতে প্রিয়াররা বিষয়টি বিবেচনা করে এবং যেখানে প্রবীণদের নিয়ে মতবিরোধ রয়েছে, সেখানে ঘন ঘনবাদী পরিসংখ্যানগুলির আরও সীমাবদ্ধ, শর্তাধীন বিবৃতি দৃmer়তার ভিত্তিতে দাঁড়িয়ে থাকতে পারে।


2

অনেক গবেষণার লক্ষ্য চূড়ান্ত সিদ্ধান্তে পৌঁছানো নয়, বরং সম্প্রদায়ের বোধগম্যভাবে একটি প্রশ্নের বোধকে এক দিকে চালিত করার জন্য আরও কিছু প্রমাণ অর্জন করা

বাইশিয়ান পরিসংখ্যান অপরিহার্য যখন আপনার যা প্রয়োজন তা উপলভ্য প্রমাণের আলোকে সিদ্ধান্ত বা উপসংহারের মূল্যায়ন করা উচিত। বায়েশিয়ান পরিসংখ্যান ব্যতীত মান নিয়ন্ত্রণ করা অসম্ভব। যে কোনও পদ্ধতি যেখানে আপনার কিছু তথ্য নেওয়া এবং তারপরে এটি (রোবোটিকস, মেশিন লার্নিং, ব্যবসায়িক সিদ্ধান্ত গ্রহণ) বায়েশিয়ান পরিসংখ্যান থেকে উপকার পাওয়া দরকার।

তবে অনেক গবেষক তা করছেন না। তারা এখনও কিছু পরীক্ষা-নিরীক্ষা চালাচ্ছে, কিছু তথ্য সংগ্রহ করছে এবং তারপরে "এই উপাত্তগুলি এভাবে নির্দেশ করে" বলে অন্যরা এতক্ষণে যে সমস্ত প্রমাণ জড়ো করেছে, সেগুলি দিয়ে উত্সাহটি সর্বোত্তম উপসংহার কিনা তা নিয়ে খুব চিন্তাভাবনা না করেই । বিজ্ঞান একটি ধীর প্রক্রিয়া হতে পারে এবং "এই মডেলটি সঠিক হওয়ার সম্ভাবনাটি 72%!" এর মতো একটি বিবৃতি হতে পারে! প্রায়শই অকাল বা অপ্রয়োজনীয়।

এটি একটি সাধারণ গাণিতিক উপায়েও উপযুক্ত, কারণ ঘন ঘনবাদী পরিসংখ্যানগুলি প্রায়শই গাণিতিকভাবে কোনও বৈয়েশিয়ার পরিসংখ্যানের আপডেট-ধাপের মতো হয়ে থাকে। অন্য কথায়, যদিও বয়েশিয়ান পরিসংখ্যান (অগ্রাধিকারের মডেল, প্রমাণ) → নতুন মডেল, ঘনত্ববাদী পরিসংখ্যান কেবল প্রমাণ হিসাবে প্রমাণিত হয় এবং অন্য দুটি অংশ পূরণ করার জন্য এটি অন্যকে ছেড়ে যায়।


যদিও এই পোস্টটির বেশিরভাগ অংশ আকর্ষণীয়, তবে এটি অনেকগুলি অসমর্থিত মতামত নিয়ে গঠিত। এই সাইটে কী ধরণের উত্তর আশা করা যায় সে সম্পর্কে দয়া করে আমাদের সহায়তা কেন্দ্রের সাথে পরামর্শ করুন।
whuber

@ যাহা আমি দেখি। আমি একটি উদ্ধৃতি যুক্ত করেছি আমি আমার মাথার উপরের অংশটি মনে করতে পারি, তবে বাকী অংশগুলির কাছে আমার কাছে উদ্ধৃতি নেই, সুতরাং এটি যদি খুব অসমর্থিত মনে হয় তবে আমি এটি মুছতে পারি।
ওয়েন

5
আমি অবাক হয়েছি যে আপনি মান নিয়ন্ত্রণের কথা উল্লেখ করেছেন, যেহেতু এটি এমন একটি অঞ্চলের মতো বলে মনে হয় যেখানে সম্ভাবনার ঘনত্ববাদী ব্যাখ্যা (অনেকগুলি পরীক্ষার তুলনায় আপেক্ষিক ফ্রিকোয়েন্সি) খুব স্বাভাবিক হবে: কারখানাটি সঠিকভাবে কাজ করছে, এই সম্ভাবনাটি আমরা কতটা দেখতে পাব? (বা আরও) ভাঙা উইজেট? বায়েশিয়ান পরিসংখ্যানগুলি কিসিসির জন্য বিশেষত কার্যকর করে তোলে সে সম্পর্কে কী আমি আপনাকে বিশদভাবে বলতে চাই?
ম্যাট ক্রাউস

@ ম্যাটক্রাউজ ধরুন আমাদের লক্ষ্যটি হ'ল <1% হারে ত্রুটিযুক্ত উইজেটগুলি প্রেরণ করা। আমরা জানি কারখানাটি 10% হারে ত্রুটিযুক্ত উইজেট তৈরি করে, এবং আমাদের একটি পরীক্ষা আছে যার টাইপ -1 এবং টাইপ -2 ত্রুটি হারগুলি s এবং 1 / (বর্গক্ষেত্র (4 - 1 / s ^ 2)) যেখানে s কঠোরতা পরামিতি। কঠোরতার জন্য আমাদের কী ব্যবহার করা উচিত?
ওভেন

2
ক্রমাগত অধ্যয়ন থেকে ঘনঘনবাদী পরিসংখ্যান তথ্য একত্রিত করতে পারে না এমন ধারণা মেটা-বিশ্লেষণের ক্ষেত্রটিকে উপেক্ষা করে বলে মনে হচ্ছে।
ক্লিফ এবি

2

বায়েশিয়ান পদ্ধতির প্রকৃত সম্পাদনা ফ্রিকোয়েন্সিস্টের চেয়ে প্রযুক্তিগত। "আরও প্রযুক্তিগত" দ্বারা আমি বোঝাতে চাইছি যেমন: ১) প্রিয়ার বেছে নেওয়া, ২) আপনার মডেলটিকে কোনও বিইজিএস / জেজিএস / স্ট্যানে প্রোগ্রামিং করা এবং ৩) নমুনা ও রূপান্তর সম্পর্কে চিন্তাভাবনা।

স্পষ্টতই, বায়েশিয়ান সংজ্ঞা অনুসারে, # 1 প্রায়শই alচ্ছিক নয়। যদিও কিছু সমস্যা এবং পদ্ধতি রয়েছে তবুও যুক্তিসঙ্গত ডিফল্ট থাকতে পারে, কিছুটা ব্যবহারকারীর কাছ থেকে বিষয়টি গোপন করে। (যদিও এতে সমস্যাও হতে পারে!)

# 2 সমস্যাটি কিনা আপনার ব্যবহার করা সফ্টওয়্যারটির উপর নির্ভর করে। ঘনতান্ত্রিক পরিসংখ্যানগত পদ্ধতির চেয়ে বায়েশিয়ান পরিসংখ্যানগুলির আরও সাধারণ সমাধানগুলির দিকে বাঁক রয়েছে এবং বিইজিএস, জেএজিএস এবং স্ট্যানের মতো সরঞ্জামগুলি এটির একটি প্রাকৃতিক অভিব্যক্তি। যাইহোক, বিভিন্ন সফ্টওয়্যার প্যাকেজে বায়েশিয়ান ফাংশন রয়েছে যেগুলি সাধারণত ঘন ঘন ক্রিয়াকলাপ পদ্ধতি হিসাবে কাজ করে বলে মনে হয়, তাই এটি সর্বদা সমস্যা নয়। (এবং সাম্প্রতিক সমাধানগুলি আর প্যাকেজগুলির মতো rstanarmএবং brmsএই ব্যবধানটি কমিয়ে দিচ্ছে)) তবুও, এই সরঞ্জামগুলি ব্যবহার করা একটি নতুন ভাষায় প্রোগ্রামিংয়ের সাথে খুব মিল।

আইটেম # 3 সাধারণত প্রযোজ্য, যেহেতু রিয়েল-ওয়ার্ল্ড বয়েশিয়ান অ্যাপ্লিকেশনগুলির বেশিরভাগই এমসিসিএম স্যাম্পলিং ব্যবহার করে। (অন্যদিকে, ঘন ঘন এমএলই-ভিত্তিক পদ্ধতিগুলি অপ্টিমাইজেশন ব্যবহার করে যা কোনও স্থানীয় মিনিমে রূপান্তরিত হতে পারে বা একেবারে রূপান্তরিত করতে পারে না, এবং আমি অবাক হই যে কতজন ব্যবহারকারী এটি পরীক্ষা করে দেখবেন এবং না?)

আমি যেমন একটি মন্তব্যে বলেছি, আমি নিশ্চিত নই যে প্রবীণদের কাছ থেকে মুক্তি আসলে বৈজ্ঞানিক সুবিধা। এটি অবশ্যই বিভিন্ন উপায়ে এবং প্রকাশনার বিভিন্ন পয়েন্টে সুবিধাজনক, তবে আমি নিশ্চিত নই যে এটি আসলে আরও ভাল বিজ্ঞানের জন্য তৈরি করেছে। (এবং বড় ছবিতে, আমাদের সকলকে বিজ্ঞানী হিসাবে আমাদের প্রিজনদের সম্পর্কে সচেতন হতে হবে, বা আমরা কোন পরিসংখ্যানগত পদ্ধতি ব্যবহার করি না কেন, আমাদের তদন্তে আমরা সমস্ত ধরণের পক্ষপাতদুষ্টতায় ভুগব।)


(3) এর সাথে সম্পর্কিত, অনেক ধ্রুপদী পরিসংখ্যানের মডেলগুলির (যেমন গ্ল্যামের) অবতল লগ হওয়ার সম্ভাবনা রয়েছে, সুতরাং চরম কোণার ক্ষেত্রে বাইরে স্ট্যান্ডার্ড অ্যালগরিদমগুলি ব্যর্থ হওয়া খুব বিরল। অবিরত সমস্যাগুলির (যেমন এনএন) ক্ষেত্রে, যখন এগুলির জন্য ভুল অনুভূতি (যা সাধারণত ব্যবহারকারীরা বোঝে) সম্পর্কে গুরুতর উদ্বেগের প্রয়োজন হয়, তবে এগুলি (কাকতালীয়ভাবে নয়) এমন সমস্যাও রয়েছে যেখানে ক্লাসিক এমসিএমসি অ্যালগরিদমগুলি কেবলমাত্র যদি চালানো হয় তবে মারাত্মকভাবে ব্যর্থ হবে , বলুন, একজন মানুষের জীবনকাল। তবে এটি সাধারণত অপ্টিমাইজেশন অ্যালগরিদমের চেয়ে এমসিসিএম ঠিক করার মতো টানা কম!
ক্লিফ এবি

2

ধারণা : আমি জানি না। আমি বিশ্বাস করি যে বায়েশিয়ান পরিসংখ্যানগুলি ভাবার পক্ষে সবচেয়ে যুক্তিযুক্ত উপায় তবে কেন আমি তা সমর্থন করি না।

ঘনত্ববাদীর সুবিধা হ'ল প্রাথমিক স্তরের বেশিরভাগ লোকের পক্ষে এটি সহজ। তবে আমার কাছে ছিল অবাক। আত্মবিশ্বাসের ব্যবধানটি কী তা আমি বৌদ্ধিকভাবে পরিষ্কার করতে না পারলে কয়েক বছর সময় লেগেছিল। তবে আমি যখন ব্যবহারিক পরিস্থিতির মুখোমুখি হতে শুরু করেছি, ঘন ঘন ধারণাটি সহজ এবং অত্যন্ত প্রাসঙ্গিক বলে মনে হয়েছিল।

প্রায়োগিক

আমি আজকাল সবচেয়ে গুরুত্বপূর্ণ যে প্রশ্নটিতে মনোনিবেশ করার চেষ্টা করি তা হ'ল ব্যবহারিক দক্ষতা সম্পর্কে: ব্যক্তিগত কাজের সময়, যথার্থতা এবং গণনার গতি।

ব্যক্তিগত কাজের সময়: বেসিক প্রশ্নের জন্য, আমি বাস্তবে প্রায় কখনও বায়েশিয়ান পদ্ধতি ব্যবহার করি না: আমি মৌলিক ঘনত্ববাদী সরঞ্জামগুলি ব্যবহার করি এবং সর্বদা একটি বেয়েশিয়ার সমতুল্যর উপর একটি টি-টেস্ট পছন্দ করি যা কেবল আমার মাথা ব্যথা করে। আমি যখন জানতে চাই যে আমি আমার গার্লফ্রেন্ডের চেয়ে টিকট্যাকিতে আরও উল্লেখযোগ্যভাবে ভাল আছি তখন আমি চি-স্কোয়ারড :-) করি। প্রকৃতপক্ষে, এমনকি কম্পিউটার বিজ্ঞানী হিসাবে গুরুতর কাজে, ঘন ঘন মৌলবাদী সরঞ্জামগুলি সমস্যাগুলি তদন্ত করতে এবং এলোমেলো কারণে ভ্রান্ত সিদ্ধান্তগুলি এড়াতে কেবল অমূল্য।

যথার্থতা: মেশিন লার্নিংয়ে যেখানে ভবিষ্যদ্বাণী বিশ্লেষণের চেয়ে বেশি গুরুত্বপূর্ণ সেখানে বায়েশিয়ান এবং ঘন ঘন বিশেষজ্ঞের মধ্যে কোনও পরম সীমানা নেই। এমএলই হ'ল ঘনঘনবাদী এপ্রোচৰ স্রেফ অনুমানক। তবে নিয়মিত এমএলই (এমএপি) একটি আংশিক বায়েশিয়ান পদ্ধতির : আপনি উত্তরোত্তরটির মোড খুঁজে পান এবং আপনি উত্তরোত্তরগুলির বাকি অংশগুলির যত্ন নেন না। নিয়মিতকরণ কেন ব্যবহার করা হয় তার ঘন ঘন ন্যায়বিচারের কথা আমি জানি না। ব্যবহারিকভাবে নিয়মিতকরণ কখনও কখনও অনিবার্য কারণ কাঁচা এমএলই অনুমান এত বেশি হয় যে 0 আরও ভাল ভবিষ্যদ্বাণীকারী হতে পারে। যদি নিয়মিতকরণকে সত্যিকারের বায়েশিয়ান পদ্ধতি হিসাবে সম্মত করা হয়, তবে এটি একাই ন্যায্যতা দেয় যে বেয়েস কম ডেটা সহ শিখতে পারে।

গণনার গতি: ঘন ঘন পদ্ধতিগুলি প্রায়শই গণনামূলকভাবে দ্রুত এবং বাস্তবায়নের জন্য সহজ। এবং কোনওভাবে নিয়মিতকরণ তাদের মধ্যে কিছুটা বেয়েস প্রবর্তনের জন্য সস্তা উপায় সরবরাহ করে। এটি হতে পারে কারণ বায়েশিয়ান পদ্ধতিগুলি এখনও তারা যতটা পারে ততটা অনুকূলিত হয়নি। উদাহরণস্বরূপ, কিছু এলডিএ বাস্তবায়ন আজকাল দ্রুত। তবে তাদের খুব কঠোর পরিশ্রমের প্রয়োজন ছিল। এনট্রপি অনুমানের জন্য, প্রথম উন্নত পদ্ধতিগুলি ছিল বেয়েশিয়ান। তারা দুর্দান্ত কাজ করেছে তবে শীঘ্রই ঘন ঘন পদ্ধতিগুলি আবিষ্কার করা হয়েছিল এবং খুব কম গণনার সময় নেয় ... গণনার সময়টির জন্য ঘন ঘন পদ্ধতিগুলি সাধারণত পরিষ্কারভাবে উচ্চতর হয়। ঘন ঘনবাদী পদ্ধতিগুলি বায়েশিয়ান পদ্ধতিগুলির অনুমান হিসাবে ভাবা অবাস্তব নয়।


2
"আমি কেন নিয়মিতকরণ ব্যবহার করতে হবে" এর ঘন ঘন ন্যায়বিচারের কথা আমি জানি না "। এটা সহজ; পুনরাবৃত্তি পরীক্ষার অধীনে, এটি নমুনা ছাড়াই ত্রুটি দেখিয়েছে।
ক্লিফ এবি

2

এক ধরণের সমস্যা যার মধ্যে একটি নির্দিষ্ট ফ্রুয়েনসিস্ট ভিত্তিক পদ্ধতির মূলত যে কোনও বায়েশিয়ানকে প্রাধান্য পেয়েছে তা হ'ল এম-ওপেন ক্ষেত্রে ভবিষ্যদ্বাণী।

এম-ওপেন মানে কী?

এম-ওপেন ইঙ্গিত দেয় যে প্রকৃত মডেল যা ডেটা উত্পন্ন করে আমরা যে মডেলগুলি বিবেচনা করছি তার সেটে উপস্থিত হয় না। উদাহরণস্বরূপ, যদি প্রকৃত গড়টি ক্রিয়াকলাপ হিসাবে চতুর্ভুজ হয় , তবুও আমরা কেবলমাত্র মডেলগুলিকে লিনিয়ার ফাংশন হিসাবে বিবেচনা করি, আমরা এম-ওপেন ক্ষেত্রে। অন্য কথায়, মডেল মিস-স্পেসিফিকেশনটির ফলাফল এম-ওপেন ক্ষেত্রে ঘটে।yxx

বেশিরভাগ ক্ষেত্রে, এটি বেয়েশিয়ার বিশ্লেষণগুলির জন্য একটি বিশাল সমস্যা; আমি প্রায় সমস্ত তত্ত্ব সম্পর্কে জানি যে সঠিকভাবে নির্দিষ্ট করা মডেল উপর নির্ভর করে। অবশ্যই, সমালোচনামূলক পরিসংখ্যানবিদ হিসাবে আমাদের মনে করা উচিত যে আমাদের মডেলটি সর্বদা ভুল বানানযুক্ত। এটি বেশ একটি বিষয়; আমাদের বেশিরভাগ তত্ত্বটি মডেলটি সঠিক হওয়ার উপর ভিত্তি করে রয়েছে, তবুও আমরা জানি এটি কখনই নয়। মূলত, আমরা আশা করি যে আমাদের মডেলটি খুব বেশি ভুল নয় just

কেন ফ্রিকোয়েন্সিস্ট পদ্ধতিগুলি এটিকে আরও ভালভাবে পরিচালনা করে?

সব না। উদাহরণস্বরূপ, আমরা যদি স্ট্যান্ডার্ড ত্রুটিগুলি তৈরি করতে বা পূর্বাভাস অন্তর তৈরির জন্য স্ট্যান্ডার্ড এমএলই সরঞ্জাম ব্যবহার করি তবে আমরা বয়েশিয়ান পদ্ধতি ব্যবহারের চেয়ে ভাল না।

যাইহোক, একটি নির্দিষ্ট ফ্রিকোয়েন্সিস্ট সরঞ্জাম রয়েছে যা খুব নির্দিষ্টভাবে এই উদ্দেশ্যে হ'ল: ক্রস বৈধতা। এখানে, আমাদের মডেল নতুন ডেটা সম্পর্কে কতটা ভাল ভবিষ্যদ্বাণী করবে তা অনুমান করার জন্য, আমরা মডেলটি ফিট করার সময় কিছুটা তথ্য ছেড়ে দিই এবং আমাদের মডেলটি অদৃশ্য তথ্যের কতটা পূর্বাভাস দেয় তা পরিমাপ করে।

নোট করুন যে এই পদ্ধতিটি মিস-স্পেসিফিকেশনকে মডেল করার জন্য সম্পূর্ণভাবে দ্বিধাহীন, মডেলটি "সঠিক" কিনা তা নির্বিশেষে কোনও মডেল নতুন ডেটা সম্পর্কে কতটা ভবিষ্যদ্বাণী করবে তা কেবল আমাদের অনুমান করার জন্য একটি পদ্ধতি সরবরাহ করে।

আমি এটা যুক্তি দিতে চাই যে এই সত্যিই ভবিষ্যদ্বাণীপূর্ণ মডেলিং করে একটি Bayesian দৃষ্টিকোণ থেকে ন্যায্যতা কঠিন পদ্ধতির পরিবর্তন খুব কঠিন মনে করি না (পূর্বে এইজন্য তথ্য সামনে পূর্বে জ্ঞান প্রতিনিধিত্ব অনুমিত হয়, সম্ভাবনা ফাংশন এক মডেল, ইত্যাদি) এটি একটি ফ্রিকোয়েন্সিস্ট দৃষ্টিকোণ থেকে ন্যায়সঙ্গত করা খুব সহজ (আমরা মডেলটি + নিয়মিতকরণের পরামিতিগুলি বেছে নিয়েছি যা বার বার নমুনা তৈরির মাধ্যমে নমুনা ত্রুটি থেকে সর্বোত্তম দিকে পরিচালিত করে)।

ভবিষ্যদ্বাণীমূলক অনুমান কীভাবে করা হয় এটি এটি পুরোপুরি বিপ্লব করেছে। আমি মনে করি না কোনও পরিসংখ্যানবিদ (বা কমপক্ষে) এমন একটি ভবিষ্যদ্বাণীপূর্ণ মডেলকে গুরুত্ব সহকারে বিবেচনা করবেন যা ক্রস-বৈধকরণের সাথে তৈরি বা চেক করা হয়নি, যখন এটি উপলব্ধ (যেমন, আমরা পর্যবেক্ষণগুলি স্বাধীনভাবে ধরে নিতে পারি, হিসাব দেওয়ার চেষ্টা না করে নমুনা পক্ষপাত ইত্যাদির জন্য)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.