মেশিন লার্নিংয়ে "পূর্ব" শব্দটি দ্বারা কী বোঝানো হয়েছে


12

আমি মেশিন লার্নিংয়ে নতুন। আমি বেশ কয়েকটি কাগজপত্র পড়েছি যেখানে তারা বিভিন্ন অ্যাপ্লিকেশনগুলির জন্য গভীর জ্ঞানার্জন নিযুক্ত করেছে এবং বেশিরভাগ মডেল ডিজাইনের ক্ষেত্রে "পূর্ব" শব্দটি ব্যবহার করেছে, মানবদেহের অনুমানের আগে বলুন। কেউ বলতে পারে এর আসলে কী বোঝায়। আমি টিউটোরিয়ালগুলিতে কেবল পূর্ববর্তী ও উত্তরবর্তীগুলির গাণিতিক সূত্রগুলি খুঁজে পেতে পারি।


5
এটি গাণিতিক ধারণা তাই হ্যাঁ, এটি গাণিতিকভাবে তৈরি করা হয়েছে। যাইহোক, উইকিপিডিয়া পৃষ্ঠাটি প্রচুর স্বীকৃতি দেবে বলে মনে হচ্ছে। আপনি এটি চেক করেছেন? যদি তা হয়, তবে আপনি যা বোঝেন নি এবং আপনি একটি উত্তরে যা সন্ধান করছেন সে সম্পর্কে আরও বলতে পারেন?
ডেভিড রিচার্বি

@David Richerby । আপনার প্রতিক্রিয়ার জন্য আপনাকে ধন্যবাদ. হ্যাঁ আমি সেই উইকিপিডিয়া পৃষ্ঠাটি যাচাই করেছিলাম এবং আমি একটি অস্পষ্ট ধারণা সংগ্রহ করতে পারি যে এটির একটি ভেরিয়েবল সম্পর্কিত জ্ঞান বা তথ্য সম্পর্কে। আমি বডি পোজ অনুমানের কাগজগুলি পড়ছিলাম যেখানে যেখানে দেহ পোজ প্রিয়ার, বডি কাইনেটিক পূর্বে, 3 ডি হিউম্যান পোজের উপরে প্রিয়ারদের মডেলিং, প্রিয়ার শিখার আগে 3 ডি হিউম্যান পোজের অনুমানের আগে উল্লেখ ছিল। এই প্রসঙ্গে "পূর্ব" শব্দটি আসলে কী বোঝায় তা আমি পরিষ্কারভাবে বুঝতে পারি না।
অ্যামি

উত্তর:


13

সহজভাবে এবং কোনও গাণিতিক চিহ্ন না রেখে পূর্বের অর্থ সম্ভাব্যতা বন্টনের ক্ষেত্রে কোনও ইভেন্ট সম্পর্কে প্রাথমিক বিশ্বাস । তারপরে আপনি একটি পরীক্ষা-নিরীক্ষা করেন এবং কিছু ডেটা পান এবং তারপরে পরীক্ষার ফলাফল, (উত্তরোত্তর সম্ভাবনা বন্টন) অনুসারে আপনার বিশ্বাসকে (এবং তাই সম্ভাব্যতা বন্টন) "আপডেট" করুন।

উদাহরণ: ধরুন আমাদের দুটি কয়েন দেওয়া হয়েছে। তবে আমরা জানি না কোন মুদ্রাটি জাল। কয়েন 1 নিরপেক্ষ (হাইডস এবং টেইলসের 50% সম্ভাবনা রয়েছে), এবং কয়েন 2 পক্ষপাতদুষ্ট, বলুন, আমরা জানি এটি সম্ভাব্যতার সাথে 60% হেডস দেয়। গাণিতিকভাবে:

আমাদের শিরোনাম দেওয়া হয়েছে, এটি মুদ্রা 1 হওয়ার সম্ভাবনা হ'ল 0.4 এবং এটির মুদ্রা 2 হবার সম্ভাবনা 0.6 কয়েন 2

p(H|Coin1)=0.4
p(H|Coin2)=0.6

সুতরাং, পরীক্ষা-নিরীক্ষার আগে এটিই আমরা জানি।

এখন আমরা এটি টস একটি মুদ্রা বাছাই করতে যাচ্ছি, এবং আমাদের যা আছে (এইচ বা টি) তথ্যের ভিত্তিতে আমরা অনুমান করতে যাচ্ছি যে আমরা কোন মুদ্রাটি বেছে নিয়েছি (মুদ্রা 1 বা মুদ্রা 2))

প্রাথমিকভাবে আমরা ধরে নিই উভয় কয়েনের সমান সম্ভাবনা রয়েছে, কারণ আমাদের কাছে এখনও কোনও তথ্য নেই। এটি আমাদের পূর্ববর্তী । এটি অভিন্ন বিতরণ isp(Coin1)=p(Coin2)=0.5

এখন আমরা এলোমেলোভাবে একটি মুদ্রা নিয়েছি, এটি টস করছি এবং একটি শিরোনাম রয়েছে। এই মুহূর্তে সবকিছু ঘটে। আমরা গনা অবর সম্ভাব্যতা / বন্টন Bayesian সূত্র ব্যবহার করে:

p(Coin1|H)=p(H|Coin1)p(Coin1)p(H|Coin1)p(Coin1)+p(H|Coin2)p(Coin2)=0.4×0.50.4×0.5+0.6×0.5=0.4

p(Coin2|H)=p(H|Coin2)p(Coin2)p(H|Coin1)p(Coin1)+p(H|Coin2)p(Coin2)=0.6×0.50.4×0.5+0.6×0.5=0.6

সুতরাং, প্রথমদিকে আমাদের প্রতিটি মুদ্রার জন্য সম্ভাবনা ছিল , তবে এখন পরীক্ষার পরে আমাদের বিশ্বাসগুলি পরিবর্তিত হয়েছে, এখন আমরা বিশ্বাস করি যে মুদ্রাটি সম্ভাব্যতা 0.4 সহ মুদ্রা 1 এবং এটি সম্ভাব্য 0.6 সহ মুদ্রা 2। এটি আমাদের উত্তরোত্তর বিতরণ, বার্নোল্লি বিতরণ।0.5

এটি মেশিন লার্নিংয়ে ব্যবহৃত বায়েশিয়ান অনুমান এবং পরিসংখ্যানের মূল নীতি।


2
আপনার উপরের উদাহরণটি ঠিক করতে হবে। এই গণনাটি দেখায় যে উভয় মুদ্রাগুলি পক্ষপাতদুষ্ট (প্রথমটির শীর্ষস্থানীয় 40% এবং দ্বিতীয়টি হ'ল 60% এর সম্ভাব্যতা রয়েছে) ক্ষেত্রে যদি প্রথমটি পক্ষপাতদুষ্ট হয় তবে এটি এখনও একটি বার্নোল্লি বন্টন তবে সম্ভাবনার সাথে পি (কয়েন 1 | এইচ) = 5/11 এবং পি (মুদ্রা 2 | এইচ) =
6/11

1
উচিত "প্রদত্ত আমরা মাথা আছে, সম্ভাব্যতা এটি 0.4 হয় মুদ্রা 1" হিসেবে পুনর্লিখিত করা "প্রদত্ত যে আমরা মুদ্রা 1, সম্ভাব্যতা এটি মস্তক হয় 0.4 আছে" ?
মতিন উলহাক

ব্যাখ্যাটি মেশিন লার্নিংয়ের ক্ষেত্রে ব্যাখ্যা করে না।
ব্যবহারকারী 3023715
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.