কার্যকারী বায়েশিয়ান নেটওয়ার্কগুলিতে ডি-বিচ্ছেদ তত্ত্ব বোঝা


15

আমি কার্যকারণ বায়েশিয়ান নেটওয়ার্কগুলিতে ডি-বিচ্ছেদ যুক্তিটি বোঝার চেষ্টা করছি। অ্যালগরিদম কীভাবে কাজ করে তা আমি জানি তবে অ্যালগরিদমে বর্ণিত "তথ্যের প্রবাহ" কেন কাজ করে তা আমি ঠিক বুঝতে পারি না ।

এখানে চিত্র বর্ণনা লিখুন

উপরের গ্রাফের উদাহরণস্বরূপ, ভাবুন যে আমাদের কেবল এক্স দেওয়া আছে এবং অন্য কোনও ভেরিয়েবল পরিলক্ষিত হয়নি। তারপরে ডি-বিচ্ছেদের নিয়ম অনুসারে, এক্স থেকে ডি পর্যন্ত তথ্য প্রবাহিত হয়:

  1. এক্স প্রভাবিত করে A, যা P(A)P(A|X) । এটি ঠিক আছে, যেহেতু A X এর কারণ ঘটায় এবং আমরা যদি এক্স এর প্রভাব সম্পর্কে জানি, এটি কারণ কারণ সম্পর্কে আমাদের বিশ্বাসকে প্রভাবিত করে Information

  2. এক্স বি কে প্রভাবিত করে যা । এটি ঠিক আছে, যেহেতু এক্স সম্পর্কে আমাদের জ্ঞান দ্বারা A পরিবর্তন করা হয়েছে, A তে পরিবর্তন এর কারণ, বি সম্পর্কে আমাদের বিশ্বাসকেও প্রভাবিত করতে পারে।P(B)P(B|X)

  3. এক্স সি, যা প্রভাবিত P(C)P(C|X) । এটি ঠিক আছে কারণ আমরা জানি যে বি এর অপ্রত্যক্ষ প্রভাব সম্পর্কে আমাদের জ্ঞান দ্বারা পক্ষপাতদুষ্ট, এবং যেহেতু বি এক্স দ্বারা পক্ষপাতদুষ্ট, এটি বি এর সমস্ত প্রত্যক্ষ এবং অপ্রত্যক্ষ প্রভাবকে প্রভাবিত করবে। সি বি এর প্রত্যক্ষ প্রভাব এবং এটি এক্স সম্পর্কে আমাদের জ্ঞান দ্বারা প্রভাবিত হয়

ঠিক আছে, এই মুহুর্তে, আমার জন্য সবকিছু ঠিক আছে যেহেতু তথ্যগুলির প্রবাহটি স্বজ্ঞাত কারণ-প্রভাবের সম্পর্কের অনুসারে ঘটে। তবে আমি এই স্কিমের তথাকথিত "ভি স্ট্রাকচার" বা "কোলাইডার্স" এর বিশেষ আচরণ পাচ্ছি না। ডি-বিভাজন তত্ত্ব অনুসারে উপরের গ্রাফে সি এবং বি এর সাধারণ কারণ এবং এটি বলে যে আমরা যদি সি বা এর কোন বংশধরকে পর্যবেক্ষণ না করি তবে এক্স থেকে প্রবাহের তথ্য সি তে অবরুদ্ধ করা হয়েছে ঠিক আছে, ঠিক আছে , তবে আমার প্রশ্ন কেন?

এক্স থেকে শুরু করে উপরের তিনটি ধাপ থেকে আমরা দেখেছি যে সি এক্স সম্পর্কে আমাদের জ্ঞান দ্বারা প্রভাবিত হয় এবং কারণ-প্রসঙ্গে সম্পর্ক অনুসারে তথ্য প্রবাহ ঘটেছিল। ডি-বিভাজন তত্ত্বটি বলে যে আমরা সি থেকে ডি তে যেতে পারি না যেহেতু সি পরিলক্ষিত হয় না। তবে আমি মনে করি যেহেতু আমরা জানি যে সি পক্ষপাতদুষ্ট এবং D সি এর কারণ, তাই তত্ত্বটি বিপরীতে বলেছে, পাশাপাশি ডিটিকেও প্রভাবিত করা উচিত। আমি আমার চিন্তাভাবনার ধরণে পরিষ্কারভাবে কিছু অনুভব করছি তবে এটি কী তা দেখতে পাচ্ছি না।

সুতরাং আমার কেন সি তে তথ্য প্রবাহকে অবরুদ্ধ করা হয়েছে, যদি সিটি পর্যবেক্ষণ না করা হয় তবে তার একটি ব্যাখ্যা আমার দরকার।


এটি এক্স থেকে ডি তে প্রবাহিত হয় না, যদি কেবল এক্স পর্যবেক্ষণ করা হয়। আপনি ছবির ঠিক নীচে এটি বিবরণ। (যদিও আপনি এটি আরও নিচে সঠিকভাবে বর্ণনা করেছেন)।
ziggystar

আমি এটি ইতিমধ্যে জানি, যে তথ্য প্রবাহটি সি তে অবরুদ্ধ V যেখানে আমাদের একটি "ভি-কাঠামো" রয়েছে। আমি যা জানতে চাই তা হল; কোনও কারণ-সম্পর্ক সম্পর্কের দৃষ্টিভঙ্গি থেকে ভি-স্ট্রাকচার কেন আমাদের সি পর্যবেক্ষণ না করে তথ্যের প্রবাহকে বাধা দেয়।
উফুক

উত্তর:


6

আপনি যে কারণে অনাবৃত ইফেক্ট থেকে অন্য কোনও কারণে যুক্তি করতে পারবেন না এটি কি স্বজ্ঞাত নয়? যদি বৃষ্টিপাত (বি) এবং স্প্রিংকলার (ডি) ভেজা স্থল (সি) এর কারণ হয়, তবে আপনি কি যুক্তি দিতে পারেন যে বৃষ্টি দেখে বোঝা যায় যে সম্ভবত জমিটি ভেজা, এবং যুক্তিটি অবিরত রাখতে হবে যে জমিটি থেকেই ছিটিয়ে রাখা উচিত since ভেজা?! অবশ্যই না. আপনি যুক্তি দিয়েছিলেন যে বৃষ্টির কারণে মাটি ভিজে গেছে - আপনি অতিরিক্ত কারণগুলি সন্ধান করতে পারবেন না!

আপনি যদি ভেজা স্থলটি পর্যবেক্ষণ করেন তবে অবশ্যই পরিস্থিতি পরিবর্তন হয়। ফ্র্যাঙ্কের ব্যাখ্যা অনুসারে এখন আপনি একটি কারণ থেকে অন্য কারণে যুক্তি করতে সক্ষম হতে পারেন।


4

এক মুহুর্তের জন্য এক্সকে ভুলে যাওয়া এবং খ, সি এবং ডি এর কেবলমাত্র সংঘর্ষকারীর কথা বিবেচনা করুন কারণ ভি-কাঠামো বি এবং ডি এর মধ্যে পথ আটকাতে পারে তার কারণটি হ'ল সাধারণভাবে, যদি আপনার দুটি স্বতন্ত্র এলোমেলো ভেরিয়েবল থাকে (বি এবং ডি) যা একই ফলাফলকে প্রভাবিত করে (সি), তারপরে ফলাফলটি জানলে আপনি এলোমেলো ভেরিয়েবলের মধ্যে সম্পর্ক সম্পর্কে উপসংহার টানতে পারবেন, এভাবে তথ্য প্রবাহকে অনুমতি দেয়।

পি(বি|ডি)পি(বি)পি(ডি|বি)পি(ডি))। সুতরাং, লন ভেজা রয়েছে তা জেনে পথটি অবরোধ করে এবং বি এবং ডি নির্ভর করে।

এটি আরও ভালভাবে বুঝতে, বার্কসনের প্যারাডক্সে একই পরিস্থিতি বর্ণনা করার জন্য এটি দেখতে পারা দরকারী ।


1) আমার ডি-বিচ্ছেদ সম্পর্কে কোনও সংজ্ঞা দেওয়ার আগে একটি স্বাধীন কারণ কী তা বুঝতে অসুবিধা হয়। অনেক লেখক স্বজ্ঞাত কারণ-প্রভাব সম্পর্ক ব্যবহার করে ডি-বিচ্ছেদকে সংজ্ঞায়িত করেন। আমি বিভিন্ন উত্স থেকে যা পড়ছি তার উপর ভিত্তি করে একটি যুক্তি ব্যবস্থা তৈরি করার চেষ্টা করি এবং আমার স্বজ্ঞাতগুলির উপর ভিত্তি করে আমি এই উপপাদকের সাথে শর্তে আসতে পারি। এটি নিম্নলিখিতগুলির মতো: "যদি এক্স ব্যতীত অন্য কোনও পরিবর্তনশীল পর্যবেক্ষণ না করা হয়, তবে এক্স সম্পর্কে জ্ঞান এক্স এর প্রভাবগুলি (সমস্ত বংশধর), এক্সের প্রত্যক্ষ বা অপ্রত্যক্ষ কারণ (পূর্বপুরুষ) এবং এক্স এর কারণগুলির অন্যান্য সমস্ত প্রভাবকে প্রভাবিত করতে পারে।"
উফুক ক্যান্সার বিচিকী

2) আমি এই চিন্তাকে ন্যায়সঙ্গত প্রমাণ করি: ক) এক্স এর প্রত্যক্ষ এবং অপ্রত্যক্ষ প্রভাবগুলিকে প্রভাবিত করতে পারে, স্পষ্টতই, যেহেতু বিভিন্ন এক্স মানগুলি বিভিন্ন কারণ তৈরি করে। খ) এক্স এর প্রত্যক্ষ এবং অপ্রত্যক্ষ কারণগুলিকে প্রভাবিত করতে পারে যেহেতু আমরা যদি কোনও প্রভাব লক্ষ্য করি তবে আমরা ডায়াগনস্টিক পদ্ধতির মাধ্যমে কারণগুলি সম্পর্কে নতুন তথ্য অর্জন করতে পারি। গ) এক্স তার প্রত্যক্ষ এবং অপ্রত্যক্ষ কারণগুলির অন্যান্য প্রভাবগুলি (নিজেকে বাদ দিয়ে) প্রভাবিত করে, যেহেতু এক্স সম্পর্কে জ্ঞান আমাদের এই কারণগুলির সম্পর্কে বিশ্বাসকে পরিবর্তন করে যা ফলস্বরূপ সমস্ত প্রভাবকে প্রভাবিত করে। আমি এই ধরণের সাথে এ জাতীয় কার্যত বায়েশিয়ান নেটওয়ার্কগুলি ব্যাখ্যা করার চেষ্টা করি। এই দিয়ে শুরু করা কি সঠিক?
উফুক

3) এটি যেমন আমি ভেরিয়েবলগুলির স্বতন্ত্রতা-নির্ভরতা আচরণগুলি বোঝার জন্য একটি স্বজ্ঞাত "তথ্য প্রবাহ" প্যাটার্ন গঠনের চেষ্টা করছি। এই নিদর্শন দিয়ে আমি দেখতে পাচ্ছি না যে একটি স্বাধীন কারণ কী এবং এটি এখানেই আমি আটকে আছি। স্পষ্টতই আমি কিছু মিস করছি বা আমি এই চিন্তার ধরণটির সাথে পুরোপুরি ভুল হতে পারি।
উফুক 17

আমি মনে করি আমার আসল উত্তরটি কিছুটা বিভ্রান্তিকর ছিল, কারণ আমি বি এবং ডি'কে 'কারণ' (এখনই স্থির) বলে উল্লেখ করেছি। তথ্য প্রবাহ হ'ল একটি ধারণা যা পর্যবেক্ষণের সাথে যুক্ত, কার্যকারণমূলক হস্তক্ষেপগুলি নয়। যেমনটি আপনি জানেন, দুটি র্যান্ডম ভেরিয়েবলগুলি স্বাধীন হয় যদি একটি পর্যবেক্ষণ আপনাকে দ্বিতীয় সম্পর্কে কোনও তথ্য না দেয়। আপনার বক্তব্যগুলি পর্যবেক্ষণ এবং অনুমানের সাথে লড়াই করতে পারে বলে মনে হচ্ছে। এক্স এর পর্যবেক্ষণ আমাদের তার পিতামাতার (বিবৃতি এ) এবং এটির প্রত্যক্ষ কারণগুলির আমাদের অনুক্রমকে সামঞ্জস্য করতে সহায়তা করে তবে কোনও ভি-কাঠামো যদি পথটি ব্লক করে চলেছে তবে আমরা উপরে বর্ণিত কারণে অপ্রত্যক্ষ কারণগুলির জন্য অনুক্রমকে সামঞ্জস্য করতে পারি না।
ফ্র্যাঙ্কডি

1

ঠিক আছে, এই মুহুর্তে, আমার জন্য সবকিছু ঠিক আছে যেহেতু তথ্যের প্রবাহ স্বজ্ঞাত কারণ-প্রভাব সম্পর্কের অনুসারে ঘটে। তবে আমি এই স্কিমের তথাকথিত "ভি স্ট্রাকচার" বা "কোলাইডার্স" এর বিশেষ আচরণ পাচ্ছি না।

তারপরে এখানে কঠোর বাদামটি হ'ল ভি-কাঠামো। আমি কেবল একই প্রভাবে এস এর থেকে পৃথক, অন্য একটি পরিবর্তনশীল ডি এর পর্যবেক্ষণের প্রভাব এবং প্রভাবের পর্যবেক্ষণের উপর নির্ভরশীল একটি পরিবর্তনশীল এস এর সম্ভাব্যতার মধ্যে পার্থক্য বর্ণনা করতে চাই like একটি কল্পিত উদাহরণ ব্যবহার ।

যাক যে কেউ কোর্স করছে, লিনিয়ার বীজগণিত বলুন। তিনি যদি পাস করতে পারেন তবে এটি পরীক্ষার অসুবিধার উপর নির্ভর করে। আসুন, পি দ্বারা কোর্স পাস করার ঘটনাটি চিহ্নিত করুন, অন্যথায় 1 এবং 0 হিসাবে পাস করুন; এবং ডি হিসাবে পরীক্ষার অসুবিধা, 1 হিসাবে সহজ এবং 0 হিসাবে সহজ And পরীক্ষাটা নাও. আমরা এস দ্বারা ইভেন্টটিকে বোঝাচ্ছি এবং এর সম্ভাবনা 0.0001। এটি অসম্ভব বলে মনে হচ্ছে তবে সংজ্ঞা অনুসারে এর সুযোগটি শূন্য হওয়া উচিত নয়।

অতএব আমাদের কাছে এখন ভি-কাঠামো ফর্মের একটি গ্রাফ রয়েছে:

 D   S
  | |
 \| |/ 
   P  

পি(¬পি|এস)=0.999999 এবং পি(পি|এস)=0.000001, পরীক্ষা যত সহজ হবে তা বিবেচনাধীন। এবং পূর্বের সম্ভাবনাগুলি নিম্নরূপ:

| d0   | d1      |      
|:-----|--------:|   
| 0.5  | 0.5     |  

| s0     | s1      |      
|:-------|--------:|   
| 0.9999 | 0.0001  |

| S     | D    | P(p0|S,D) | P(p1|S,D) |  
|:------|-----:|----------:|----------:|
|s0     | d0   |   0.20    |   0.80    |
|s0     | d1   |   0.90    |   0.10    |
|s1     | d0   |   0.999999|   0.000001|
|s1     | d1   |   0.999999|   0.000001| 

এস এবং ডি স্বতন্ত্র আছেন কি না পি তা পরীক্ষা করতে আমাদের দুটি বিতরণ করা উচিত (উইকিপিডিয়ায় প্রথম দুটি সমীকরণ দেখুন: শর্তাধীন স্বাধীনতা ):পি(এস|পি) এবং পি(এস|পি,ডি)। যদি তারা সমান হয় তবে আমরা বলতে পারি যে শর্তাধীন স্বাধীনতা রয়েছে, অন্যথায় এটি হয় না।

1) যদি আমরা ফলাফলটি না জানি তবে আমরা অবশ্যই কোর্সটি সহজ হিসাবে প্রদত্ত এককত্বের সম্ভাবনা গণনা করতে পারি।

পি(এস|¬ডি)=পি(এস,পি|¬ডি)+ +পি(এস,¬পি|¬ডি)=পি(এস=1,পি=1,ডি=0)পি(ডি=0)+ +পি(এস=1,পি=0,ডি=0)পি(ডি=0)=পি(এস=1)পি(ডি=0|এস=1)পি(পি=1|ডি=0,এস=1)পি(ডি=0)+ +পি(এস=1)পি(ডি=0|এস=1)পি(পি=0|ডি=0,এস=1)পি(ডি=0)=পি(এস=1)পি(ডি=0|এস=1)পি(ডি=0)=পি(এস=1)পি(ডি=0)পি(ডি=0)=পি(এস=1)=0.0001

আপনি উপরের দেখতে পাচ্ছেন যে পরীক্ষাটি পাস হয়েছে কি না তাতে কিছু যায় আসে না। যা আসা উচিত তা আসার কথা। এটি পি এর চেয়ে প্রান্তিক সম্ভাবনা হিসাবে দেখা যেতে পারে।

এবং শিক্ষার্থীরা পরীক্ষায় পাস না করায় একাকীত্ব হওয়ার সম্ভাবনাটিও আমরা কার্যকর করতে পারি:

P(S,|¬P)=P(S,¬P)P(¬P)=P(S,¬p,D)+P(S,¬P,¬D)P(¬P)=P(¬P|S,D)P(S)P(D)+P(¬P|S,¬D)P(S)P(¬D)S,DP(¬P|S,D)P(S)P(D)=0.0001818

Knowing that the guy doesn't pass the exam we can guess that he may be brainwashed by a machine is 0.0001818 which is a little bigger than when we don't know it.

2) But what if we know that the guy failed the exam and the exam is easy?

P(S,|¬P,¬D)=P(S=1,P=0,D=0)P(P=0,D=0)=P(P=0|S=1,D=0)P(S=1)P(D=0)P(P=0|S=1,D=0)P(S=1)P(D=0)+P(P=0|S=0,D=0)P(S=0)P(D=0)=0.999999×0.0001×0.50.2×0.9999×0.5+0.999999×0.0001×0.5=0.0004998

Lo and behold, the change is much bigger than we just know he doesn't plass the exam. Then we see that P(S|P)P(S|P,D) we can infer that SD|PI(P(P,S,D)) which means D can influence S via P.

May this detailed derivation be of hlep.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.