বায়সিয়ান কাঠামো ব্যাখ্যায় আরও কীভাবে উন্নত হয় যখন আমরা সাধারণত অজ্ঞাতসারে বা সাবজেক্টিভ প্রিয়ারগুলি ব্যবহার করি?


18

এটা প্রায়ই, যুক্তি দেওয়া হয় bayesian ফ্রেমওয়ার্ক ব্যাখ্যা একটি বড় সুবিধা আছে যে (frequentist বেশি) কারণ এটি ডেটা দেওয়া একটি প্যারামিটার সম্ভাবনা নির্ণয় - পরিবর্তে পি ( এক্স | θ ) frequentist কাঠামোর মধ্যে যেমন । এ পর্যন্ত সব ঠিকই.p(θ|x)p(x|θ)

তবে পুরো সমীকরণটি এর উপর ভিত্তি করে:

p(θ|x)=p(x|θ).p(θ)p(x)

আমার কাছে 2 কারণে সামান্য সন্দেহজনক দেখাচ্ছে:

  1. অনেকগুলি কাগজপত্রে, নিয়মিত অননুমোদিত প্রিয়ার (অভিন্ন বিতরণ) ব্যবহার করা হয় এবং তারপরে কেবল , তাই বায়াসিয়ানরা ঘন ঘন হিসাবে একই ফলাফল পান - সুতরাং কীভাবে ব্যাখ্যার কাঠামো ব্যাখ্যায় আরও ভাল, যখন বয়েশিয়ান উত্তরোত্তর এবং ঘন ঘনবাদীদের সম্ভাবনা একই বিতরণ হয়? এটি ঠিক একই ফলাফল দেয়।p(θ|x)=p(x|θ)

  2. তথ্যবহুল প্রিরিয়ারগুলি ব্যবহার করার সময়, আপনি বিভিন্ন ফলাফল পান তবে বায়সিয়ান ইতিবাচক বিষয় দ্বারা প্রভাবিত হয়, সুতরাং পুরো এরও বিষয়গত টিং রয়েছে ।p(θ|x)

অন্য কথায়, পুরো যুক্তি চেয়ে ব্যাখ্যা ভালো হচ্ছে পি ( এক্স | θ ) একটি অনুমান উপর তৈরী করে যে পি ( θ ) এর "বাস্তব", যা স্বাভাবিকভাবে নয় ধরনের, এটা শুধু একটা হয় প্রারম্ভিক পয়েন্টটি আমরা কোনওভাবে এমসিএমসি রান, একটি অনুমান হিসাবে তৈরি করতে বেছে নিই, তবে এটি বাস্তবতার বিবরণ নয় (এটি আমি মনে করি সংজ্ঞায়িত করা যায় না)।p(θ|x)p(x|θ)p(θ)

সুতরাং আমরা কীভাবে যুক্তি দিতে পারি যে ব্যায়েসিয়ান ব্যাখ্যায় আরও ভাল?


4
(1) কেমন লাগে সন্দেহ কারণ এটির উপসংহার ভুল: Uninformative গতকাল দেশের সর্বোচ্চ তাপমাত্রা সঙ্গে Bayesian ফলাফল নেই না অগত্যা frequentist সিদ্ধান্তে হিসাবে একই। প্রকৃতপক্ষে, অনেক ক্ষেত্রে "একটি অপ্রয়োজনীয় পূর্ব" এমনকি কী তা নিয়ে কোনও চুক্তি নেই বলে মনে হয়! (২) বিতর্কযোগ্যও কারণ এটি স্পষ্টতই ধরে নিয়েছে যে ঘন ঘন বিশ্লেষণে করা প্রতিটি অনুমানই বিষয়ভিত্তিক নয় - তবে বিষয়টি তেমনটি নয়। অবশেষে, "ব্যাখ্যায় আরও ভাল" বলতে আপনার অর্থ কী? আপনার প্রশ্নটি এর কোনও সংজ্ঞা ছাড়াই অস্পষ্ট।
হোবার

1
আমি whuber এর মন্তব্য ছাড়াও বলতে চাই, বায়েস ঘন ঘনবাদী চেয়ে ভাল যে সাধারণ কারণ নেই , তাই যুক্তি। কখনও কখনও বায়েস অর্থপূর্ণ ফলাফল দেয় এবং কখনও কখনও ঘন ঘন উপায় ভাল better যাইহোক, প্রয়োগ করা ক্ষেত্রে, কারও খুব আলাদা ফলাফল পাওয়ার কারণ নেই। দার্শনিক দৃষ্টিকোণ থেকে, বেয়েস অবশ্যই শক্তিশালী তবে আমরা সবাই জানি, তত্ত্ব ও অনুশীলন কখনও কখনও তীব্রভাবে পৃথক হয়। এছাড়াও, আমি আপনার প্রথম অনুচ্ছেদ সম্পর্কে কিছুটা উদ্বিগ্ন। আমার কাছে মনে হচ্ছে আপনি প্রতিশ্রুতিবদ্ধ বায়েশিয়ান (এতে কোনও ভুল নেই)।
সানকুলসু

শিরোনাম হওয়া উচিত নয় uninformative or *objective* priors? subjectiveগতকাল দেশের সর্বোচ্চ তাপমাত্রা ঠিক হয় তথ্যপূর্ণ গতকাল দেশের সর্বোচ্চ তাপমাত্রা।
জাভাদবা

উত্তর:


15

ইতিমধ্যে পোস্ট করা চমত্কারগুলির চেয়ে আরও সংকীর্ণ প্রতিক্রিয়া জানাতে এবং ব্যাখ্যায় সুবিধার দিকে মনোনিবেশ করা - একটি বায়েসিয়ান ব্যাখ্যা যেমন, "95% বিশ্বাসযোগ্য ব্যবধান" হ'ল সত্য প্যারামিটারের মানটির মধ্যে যে সম্ভাবনা থাকে তা হ'ল অন্তর 95% সমান। একটি এর দুটি সাধারণ ঘনত্ববাদী ব্যাখ্যার মধ্যে একটি, যেমন, "95% আত্মবিশ্বাসের ব্যবধান", এমনকি যদি সংখ্যার দিক থেকে দু'টি একই হয় তবে তা কি দীর্ঘকালীন সময়ে, যদি আমরা বহুবার এই প্রক্রিয়াটি চালাতে পারি, তবে যে ফ্রিকোয়েন্সিটি ব্যবধানটি আসল মানটি 95% এ রূপান্তরিত করে। আগেরটি স্বজ্ঞাত, পরেরটি নয়। কোনও পরিচালকের কাছে এমন কিছু সময় বোঝানোর চেষ্টা করুন যা আপনি বলতে পারবেন না যে "আমাদের সৌর প্যানেলগুলি 25 বছরেরও বেশি কম 20% হ্রাস পাবে এই সম্ভাবনা 95%", তবে পরিবর্তে অবশ্যই বলতে হবে "

একটি বিকল্প ঘনত্ববাদী ব্যাখ্যাটি হ'ল "ডেটা উত্পন্ন হওয়ার আগে, আমি যে পদ্ধতিতে স্থির হয়েছি তা ব্যবহার করে যে ব্যবধানটি আমি গণনা করব তার 5% সম্ভাবনা ছিল পুরোপুরি সত্য প্যারামিটার মানের নীচে নেমে আসবে। তবে, এখন আমরা তথ্য সংগ্রহ করেছি, আমরা এ জাতীয় কোনও বিবৃতি দিতে পারি না, কারণ আমরা সাবজেক্টিভিস্ট নই এবং সম্ভাবনাটি 0 বা 1 হয়, এটি নির্ভর করে যে এটি সত্য পরামিতি মানের নীচে পুরোপুরি মিথ্যাচার করে না বা না করে। " যা নিরীক্ষকদের সাথে এবং কোনও ওয়ারেন্টি রিজার্ভ গণনার সময় সহায়তা করবে। (আমি সাধারণত এই সংজ্ঞাটি যুক্তিসঙ্গত বলে মনে করি, যদিও এটি সাধারণত কার্যকর না হয়; স্বজ্ঞাতভাবে এটি বোঝাও সহজ নয় এবং বিশেষত আপনি যদি কোনও পরিসংখ্যানবিদ না হন তবে তাও নয় not)

উভয়ই ঘনঘনবাদী ব্যাখ্যা স্বজ্ঞাত নয়। বায়েশিয়ান সংস্করণটি হ'ল। সুতরাং বায়েশিয়ান পদ্ধতির দ্বারা অনুষ্ঠিত "ব্যাখ্যায় বড় সুবিধা"।


বিরোধী ঘন ঘন ঘন তর্ক নিয়ে আমার সমস্যাটি হ'ল এটি প্রক্রিয়াটিকে উত্তর হিসাবে বর্ণনা করার জন্য খুব বেশি চেষ্টা করে। ব্যাখ্যায় নিজের জন্য একই পরীক্ষার চেষ্টা করুন, তবে ফলাফল থেকে কী উপসংহার টানবেন। ঘন ঘন এবং একজন বায়েশিয়ার দেওয়া ফলাফল শোনার ভিত্তিতে আপনি কীভাবে অন্যরকম আচরণ করবেন ? বাস্তবে, আপনি এখনও উভয় বুঝতে পারলে আপনি এখনও একইরকম অভিনয় করতে যাচ্ছেন। "উপাত্তের দ্বারা দেওয়া আত্মবিশ্বাসের ভিত্তিতে সর্বোত্তম কাজ করা এবং তাই" এটি ব্যাখ্যা করার জন্য পদ্ধতির স্তরে যাওয়ার দরকার নেই।
পাসক্যালভিকুটেন

এছাড়াও, সংজ্ঞা অনুসারে, আপনাকে বেইসিয়ান ক্ষেত্রে আরও ব্যাখ্যা করতে হবে, যেহেতু আপনার কাছে কেবল "ডেটা আমাদের যা বলে" তা নয় তবে পূর্বের কী তথ্য রয়েছে! বায়েশিয়ানরা দীর্ঘ ঘন ঘন ব্যাখ্যা দেওয়ার প্রবণতা পোষণ করে তবে তারা কোনটি আগে বেছে নিয়েছে, তারা কেন একটি পূর্ব পছন্দ করেছে এবং বিশেষত কেন সেই পূর্বকে তা ব্যাখ্যা করার দিকে যায় না।
পাসক্যালভিকুটেন

ঠিক আছে, আমি আপনার শেষ বিষয়টির সাথে আংশিকভাবে একমত নই। উদাহরণ হিসাবে, যখন আমি আমার আগের কাজটিতে খুব, খুব ব্যয়বহুল টুকরো সরঞ্জামগুলির উপর নির্ভরযোগ্যতা বিশ্লেষণ করছিলাম, আমরা আমাদের পূর্ববর্তী নির্ভরযোগ্যতা বিশ্লেষণের ফলাফলগুলিকে আমাদের নতুনটির জন্য পূর্বের হিসাবে বিবেচনা করতাম, "সমতুল্য নমুনার আকার" এর চেয়ে নিম্নমানের বাস্তব বিশ্বের অস্তিত্ব এবং নকশায় ছোটখাট পরিবর্তন ইত্যাদি বিবেচনায় রাখুন এবং সত্যই, বায়েশিয়ান পরিসংখ্যানগুলি ডেটা সহ আপনার পূর্ববর্তী আপডেট করা; শাস্ত্রীয় পরিসংখ্যান "আপডেট" করে না, তাই কিছু ব্যতিক্রম ব্যতীত আপনার পূর্ববর্তী সমতল হলে আপনি কেবল একই ফলাফল পাবেন।
jboman

আমি কেবল ডেটাসেটগুলিকে একীভূত করব এবং অন্য একটি বিশ্লেষণ করবো ... পূর্ববর্তী হওয়ার দরকার নেই। প্রকৃত পূর্বের ডেটার চেয়ে ভাল আর কোনও নেই: আপনি একটি "আসল" ডেটা ভিত্তিক পোস্টেরিয়র পাবেন।
পাসক্যালভিকুটেন

ভাল আপনি আপনার নতুন পূর্বের জন্য ঠিক পূর্ববর্তী পোস্টটি নাও চাইতে পারেন, আমাদের ক্ষেত্রে চলমান ছোটখাটো ডিজাইনের পরিবর্তন এবং আমাদের জ্ঞানের কারণে যা এমএফজি। প্রক্রিয়াটি আমাদের পূর্বের 100% ভবিষ্যতের ডেটার জন্য তথ্যবহুল তৈরি করেও বিকশিত হয়েছিল। রান-টাইম বিবেচনাও থাকতে পারে। তবে আপনার বক্তব্যটি সাধারণত একটি ভাল, এটি আমার কাছে মনে হয়।
jboman

13

p(θ|x)p(x|θ)p(x|θ)p(θ|x)

নোট করুন যে তথ্যমূলক প্রিয়ারগুলি অগত্যা সাবজেক্টিভ নয়, উদাহরণস্বরূপ আমি এটিকে বিষয়গত জ্ঞান হিসাবে বিবেচনা করব না যে কিছু শারীরিক ব্যবস্থা সম্পর্কে পূর্বের জ্ঞান পরিমাপের ইউনিটগুলির (যেমন তারা মূলত স্বেচ্ছাসেবী হয়) থেকে পৃথক হওয়া উচিত, যা রূপান্তর গ্রুপগুলির ধারণা নিয়ে আসে এবং "ন্যূনতম তথ্যবহুল" প্রিরিয়ার্স।

সাবজেক্টিভ জ্ঞানকে উপেক্ষা করার ফ্লিপ দিকটি হ'ল আপনার সিস্টেমটি সাব-অনুকূল হতে পারে কারণ আপনি বিশেষজ্ঞ জ্ঞানকে উপেক্ষা করছেন, তাই সাবজেক্টিভিটি অগত্যা কোনও খারাপ জিনিস নয়। উদাহরণস্বরূপ, "মুদ্রার পক্ষপাতদুষ্টতা আবিষ্কার করুন" সমস্যার ক্ষেত্রে, প্রায়শই প্রেরণাদায়ী উদাহরণ হিসাবে ব্যবহৃত হয়, আপনি ডাটা আসার আগে ইউনিফর্মের সাথে তুলনামূলকভাবে ধীরে ধীরে শিখতে পারবেন But তবে সমস্ত পক্ষপাত কি সমানভাবে যুক্তিসঙ্গত অনুমান হিসাবে দেখা যায়? না, কিছুটা পক্ষপাতদুষ্ট মুদ্রা তৈরি করা সহজ, বা একটি সম্পূর্ণ পক্ষপাতদুষ্ট (দুটি মাথা বা দুটি টাল) তৈরি করা সহজ, তাই যদি আমরা আমাদের বিশ্লেষণে এই অনুমানটি তৈরি করি তবে একটি বিষয়গত পূর্বের মাধ্যমে, আমাদের চিহ্নিত করার জন্য কম ডেটা প্রয়োজন হবে পক্ষপাতিত্ব আসলে হয়।

ঘনঘনবাদী বিশ্লেষণেও প্রায়শই বিষয়গত উপাদান থাকে (উদাহরণস্বরূপ নাল অনুমানকে বাতিল করার সিদ্ধান্ত নেওয়া হয় যদি পি-মান 0.05 এর চেয়ে কম হয়, এটি করার কোনও যৌক্তিক বাধ্যবাধকতা নেই, এটি নিছক একটি traditionতিহ্য যা কার্যকর প্রমাণিত হয়েছে)। বায়েশিয়ান পদ্ধতির সুবিধা হ'ল সাবজেক্টিভিটি এটিকে নিবিষ্ট রেখে না রেখে গণনায় সুস্পষ্টভাবে তৈরি করা হয়।

দিনের শেষে, এটি "কোর্সের জন্য ঘোড়া" এর বিষয়, আপনার টুলবক্সে আপনার দুটি সেট সরঞ্জাম থাকা উচিত এবং হাতের কাজটির জন্য সেরা সরঞ্জামটি ব্যবহার করার জন্য প্রস্তুত থাকতে হবে।


6

বায়েশিয়ান কাঠামোর ঘন ঘন বিশেষজ্ঞের চেয়ে বড় সুবিধা রয়েছে কারণ এটি সঠিক বিতরণ অনুমানগুলি জানার ক্ষেত্রে "স্ফটিক বল" থাকার উপর নির্ভর করে না। বেয়েসিয়ান পদ্ধতিগুলি আপনার কাছে কী তথ্য রয়েছে তা ব্যবহার করা এবং সেই তথ্যটিকে সম্ভাব্যতা বন্টনের মধ্যে কীভাবে এনকোড করা যায় তা নির্ভর করে।

বায়েশিয়ান পদ্ধতিগুলি ব্যবহার করে মূলত তার সম্পূর্ণ শক্তিতে সম্ভাবনা তত্ত্ব ব্যবহার করা হয়। বেয়েস উপপাদ্য সম্ভাবনা তত্ত্বের ক্লাসিক পণ্য নিয়মের পুনরুদ্ধার ছাড়া আর কিছুই নয়:

পি(θএক্স|আমি)=পি(θ|আমি)পি(এক্স|θআমি)=পি(এক্স|আমি)পি(θ|এক্সআমি)

যে পর্যন্ত না পি(এক্স|আমি)0(অর্থাত্ পূর্ববর্তী তথ্য যা বলেছিল তা অসম্ভব বলে দেয়নি) আমরা এর দ্বারা ভাগ করে নিতে পারি, এবং বেয়েস থার্মে পৌঁছাতে পারি। আমি ব্যবহার করেছিআমি পূর্বের তথ্যগুলি বোঝাতে, যা সর্বদা উপস্থিত থাকে - আপনি তথ্য ছাড়াই সম্ভাব্যতা বিতরণ বরাদ্দ করতে পারবেন না।

এখন, আপনি যদি মনে করেন যে বয়েস উপপাদ্য সন্দেহজনক, তবে যৌক্তিকভাবে, আপনাকে অবশ্যই ভাবতে হবে যে পণ্যটির বিধিটিও সন্দেহযুক্ত। আপনি এখানে একটি ডিডাকটিভ যুক্তি খুঁজে পেতে পারেন , যা কক্সের উপপাদ্যের অনুরূপ পণ্য এবং যোগ বিধিগুলি উত্পন্ন করে। প্রয়োজনীয় অনুমানের আরও সুস্পষ্ট তালিকা এখানে পাওয়া যাবে

যতদূর আমি জানি, ঘন ঘনবাদী অনুমান একটি যৌক্তিক কাঠামোর মধ্যে ভিত্তিগুলির সেটগুলির উপর ভিত্তি করে নয়। যেহেতু এটি সম্ভাবনার কোলমোগোরভ অলক্ষেত্র ব্যবহার করে, সম্ভবত সম্ভাবনা তত্ত্ব এবং পরিসংখ্যানগত অনুক্রমের মধ্যে কোনও যোগসূত্র বলে মনে হয় না। ঘনঘনবাদী অনুমানের জন্য কোনও অলঙ্কার নেই যা অনুসরণ করা একটি পদ্ধতিতে পরিচালিত করে। এখানে নীতি ও পদ্ধতি রয়েছে (সর্বাধিক সম্ভাবনা, আত্মবিশ্বাসের ব্যবধান, পি-মান ইত্যাদি) এবং সেগুলি ভালভাবে কাজ করে তবে এগুলি বিচ্ছিন্ন এবং বিশেষ সমস্যাগুলির জন্য বিশেষায়িত হয়ে থাকে। আমি মনে করি কমপক্ষে কঠোর যৌক্তিক কাঠামোর ক্ষেত্রে, ঘন ঘনবাদী পদ্ধতিগুলি তাদের ভিত্তিতে সবচেয়ে ভাল বাম

পয়েন্ট জন্য 1ব্যাখ্যাটির দৃষ্টিকোণ থেকে একই ফলাফল পাওয়া কিছুটা অপ্রাসঙ্গিক। দুটি পদ্ধতি একই ফলাফলের দিকে নিয়ে যেতে পারে, তবে এর অর্থ এই নয় যে তারা সমতুল্য। আমি যদি শুধু অনুমান করা হয়θ, এবং সর্বাধিক সম্ভাবনা অনুমান (এমএলই) অনুমান করার জন্য ঘটেছিল, এর অর্থ এই নয় যে আমার অনুমান এমএলইয়ের মতোই ভাল।

পয়েন্ট জন্য 2, কেন আপনার উদ্বেগ হওয়া উচিত যে বিভিন্ন তথ্যযুক্ত লোকেরা বিভিন্ন সিদ্ধান্তে আসবে? গণিতে পিএইচডি প্রাপ্ত কেউ উচ্চ বিদ্যালয়ের স্তরের গণিতের সাথে বিভিন্ন সিদ্ধান্তে পৌঁছাতে হবে এবং উচিত। তাদের বিভিন্ন ধরণের তথ্য রয়েছে - আমরা কেন তাদের সাথে একমত হওয়ার আশা করব? যখন আপনাকে তথ্য জানার উপস্থাপন করা হয়, আপনি নিজের মতামত পরিবর্তন করেন। এটি কী ধরণের তথ্য ছিল তার উপর কতটা নির্ভর করে। বয়েস উপপাদ্যটিতে এটি থাকা উচিত, এই বৈশিষ্ট্যটি রয়েছে।

পূর্বের তুলনায় সম্ভাবনা তীক্ষ্ণ হলে প্রায়শই ইউনিফর্ম ব্যবহার করা প্রায়শই একটি সুবিধাজনক অনুমান is কখনও কখনও চেষ্টা করার মতো নয়, আগে গিয়ে সঠিকভাবে সেটআপ করা। একইভাবে, বায়েশিয়ান পরিসংখ্যানকে এমসিসিএমের সাথে বিভ্রান্ত করার ভুল করবেন না। এমসিএমসি হ'ল গসিয়ান চতুষ্কোণের সমান এবং ল্যাপ্লেস আনুমানিককরণের মতো একই শ্রেণিতে একীকরণের জন্য একটি অ্যালগরিদম। এটি চতুষ্কোণের চেয়ে কিছুটা বেশি দরকারী কারণ আপনি আপনার সমস্ত ইন্টিগ্রালগুলি করতে করতে অ্যালগরিদমের আউটপুটটি পুনরায় ব্যবহার করতে পারেন (উত্তরোত্তর উপায় এবং রূপগুলি অবিচ্ছেদ্য), এবং আরও কিছুটা সাধারণ যে ল্যাপ্লেস কারণ আপনার কোনও বড় নমুনার প্রয়োজন নেই, বা একটি উত্তরের পিছনে ভাল গোলাকার শিখর (ল্যাপ্লেস যদিও দ্রুত হয়)।


3

আমি সাধারণত "শিক্ষামূলক" টাইপ উদাহরণগুলিতে ব্যবহৃত ইউনিফর্মটি দেখেছি বা যে ক্ষেত্রে সত্যিকারের কোনও নির্দিষ্ট হাইপারপ্যারামিটার সম্পর্কে কিছুই জানা যায়নি। সাধারণত, আমি অজ্ঞাতপরিচয় প্রিরিয়ারগুলি দেখতে পাই যা সমাধানটি কী হবে সে সম্পর্কে খুব কম তথ্য সরবরাহ করে তবে কোনটি ভাল সমাধান সম্ভবত দেখতে কেমন তা গাণিতিকভাবে এনকোড করে। উদাহরণস্বরূপ, একজন সাধারণত গাউসিয়ান পূর্বে দেখতে পান (μ=0) একটি রিগ্রেশন সহগের উপরে স্থাপন করে, জ্ঞানটি এনকোড করে যে সমস্ত জিনিস সমান হচ্ছে, আমরা এমন সমাধানগুলিকে পছন্দ করি যেখানে সহগের কম মাত্রা থাকে। এটি কোনও ডেটা সেটকে উপভোগ করা এড়ানো, সমাধানগুলি সন্ধান করে যা উদ্দেশ্যমূলক কার্যকে সর্বাধিক করে তোলে তবে যা আমাদের সমস্যার নির্দিষ্ট প্রসঙ্গে বোঝায় না। এক অর্থে, তারা একটি নির্দিষ্ট ডোমেন সম্পর্কে পরিসংখ্যানগত মডেলকে কিছু "ক্লু" দেওয়ার একটি উপায় সরবরাহ করে।

তবে এটি (আমার মতে) বায়েশিয়ান পদ্ধতিগুলির সবচেয়ে গুরুত্বপূর্ণ দিক নয়। বায়েশিয়ান পদ্ধতিগুলি উত্পাদনমূলক, যাতে এটি কীভাবে ডেটা অস্তিত্ব নিয়ে আসে তার একটি সম্পূর্ণ "গল্প" সরবরাহ করে। সুতরাং, তারা কেবল নিদর্শন অনুসন্ধানকারী নয়, বরং তারা পরিস্থিতিটির পুরো বাস্তবতা বিবেচনায় নিতে সক্ষম। উদাহরণস্বরূপ, এলডিএ (সুপ্ত ডিরিচলেট বরাদ্দ) বিবেচনা করুন, যা কোনও পাঠ্য দলিল কীভাবে আসে তার পুরো জেনারেটর গল্প সরবরাহ করে, যা এরকম কিছু হয়:

  1. সহ-ঘটমান নির্দিষ্ট বিষয়ের সম্ভাবনার উপর ভিত্তি করে কিছু বিষয়ের মিশ্রণ নির্বাচন করুন; এবং
  2. নির্বাচিত বিষয়ের উপর ভিত্তি করে শর্তযুক্ত শব্দভাণ্ডার থেকে শব্দের কয়েকটি সেট নির্বাচন করুন।

সুতরাং, ডোমেনে (এখানে, পাঠ্য নথিগুলি) এবং কীভাবে তারা তৈরি হয়েছে সেগুলির খুব নির্দিষ্ট বোঝার ভিত্তিতে মডেলটি ফিট; অতএব, আমরা যে তথ্য ফিরে পাই তা সরাসরি আমাদের সমস্যা ডোমেনে তৈরি করা হয় (শব্দের প্রদত্ত বিষয়গুলির সম্ভাবনা, বিষয়গুলি একত্রে উল্লেখ করার সম্ভাবনা, বিষয়যুক্ত নথির সম্ভাবনা এবং কতটা পরিমাণে ইত্যাদি)। বায়েস উপপাদ্যটি এটি করার জন্য প্রয়োজনীয় যে বিষয়টি প্রায় গৌণ, তাই এই ছোট্ট রসিকতা "বাইস বায়েশিয়ান হত না, এবং খ্রিস্টও খ্রিস্টান হত না।"

সংক্ষেপে, বায়েশিয়ান মডেলগুলি সম্ভাব্যতা বিতরণ ব্যবহার করে ডোমেন অবজেক্টগুলিকে কঠোরভাবে মডেলিংয়ের বিষয়ে; অতএব, আমরা এমন জ্ঞানকে এনকোড করতে সক্ষম হয়েছি যা অন্যথায় একটি সাধারণ বৈষম্যমূলক প্রযুক্তির সাথে উপলভ্য হবে না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.