সর্বাধিক সম্ভাবনার প্রাক্কলনকারী - মাল্টিভারিয়েট গাউসিয়ান


20

প্রসঙ্গ

মাল্টিভিয়ারেট গাউসিয়ান প্রায়শই মেশিন লার্নিংয়ে উপস্থিত হয় এবং নিম্নলিখিত ফলাফলগুলি অনেক এমএল বই এবং কোর্সগুলিতে ব্যয় ছাড়াই ব্যবহৃত হয়।

একটি ম্যাট্রিক্স আকারে দেওয়া তথ্য এর মাত্রা , যদি আমরা ধরে নিই যে তথ্য একটি অনুসরণ -variate গসিয়ান পরামিতি সঙ্গে বন্টন গড় ( ) এবং সহভেদাংক ম্যাট্রিক্স ( ) সর্বাধিক সম্ভাবনা অনুমানকারীগুলি এর দ্বারা প্রদত্ত:Xm×ppμp×1Σp×p

  • μ^=1mi=1mx(i)=x¯
  • Σ^=1mi=1m(x(i)μ^)(x(i)μ^)T

আমি বুঝতে পারি যে মাল্টিভারিয়েট গাউসিয়ান জ্ঞান অনেকগুলি এমএল কোর্সের জন্য পূর্ব-প্রয়োজনীয়, তবে একবারে এবং স্বতঃস্ফূর্ত উত্তরে পুরো বিকাশ লাভ করা সহায়ক হবে কারণ আমি অনুভব করি যে অনেক স্ব-শিক্ষাব্রতী পরিসংখ্যানের আশেপাশে পদক্ষেপ নিচ্ছেন। উত্তর খুঁজছেন স্ট্যাকেক্সচেঞ্জ এবং ম্যাথ.স্ট্যাকেক্সেক্সঞ্জ ওয়েবসাইটগুলি।


প্রশ্ন

মাল্টিভারিয়েট গাউসিয়ানের সর্বাধিক সম্ভাবনার প্রাক্কলনের সম্পূর্ণ বিকাশ কী is


উদাহরণ:

লিনিয়ার বৈষম্যমূলক বিশ্লেষণের উপর এই লেকচার নোটগুলি (পৃষ্ঠা 11), বা এগুলি ফলাফলগুলি ব্যবহার করে এবং পূর্ববর্তী জ্ঞান ধরে নেয়।

কয়েকটি পোস্টও রয়েছে যা আংশিকভাবে উত্তর দেওয়া বা বন্ধ রয়েছে:

উত্তর:


24

সর্বাধিক সম্ভাবনার প্রাক্কলনকারীদের আবিষ্কার করা

ধরে নিন যে আমাদের র্যান্ডম ভেক্টর রয়েছে, প্রতিটি আকারের : যেখানে প্রতিটি র্যান্ডম ভেক্টর থাকতে পারে ভেরিয়েবলগুলি জুড়ে একটি পর্যবেক্ষণ (ডেটা পয়েন্ট) হিসাবে ব্যাখ্যা করা । যদি প্রতিটি বহুভিত গাউসিয়ান ভেক্টর হিসাবে iid হয়:mpX(1),X(2),...,X(m)pX(i)

X(i)Np(μ,Σ)

যেখানে প্যারামিটারগুলি অজানা। তাদের অনুমানটি পেতে আমরা সর্বাধিক সম্ভাবনার পদ্ধতিটি ব্যবহার করতে পারি এবং লগ সম্ভাবনার কার্যটি সর্বোচ্চ করতে পারি।μ,Σ

নোট করুন যে এলোমেলো ভেক্টরগুলির স্বাধীনতার দ্বারা, ডেটা- of এর যৌথ ঘনত্ব হ'ল ব্যক্তিগত ঘনত্বের পণ্য , এটি হ'ল । লগারিদম গ্রহণের ফলে লগ-সম্ভাবনার ফাংশন পাওয়া যায়{X(i),i=1,2,...,m}i=1mfX(i)(x(i);μ,Σ)

l(μ,Σ|x(i))=logi=1mfX(i)(x(i)|μ,Σ)=log i=1m1(2π)p/2|Σ|1/2exp(12(x(i)μ)TΣ1(x(i)μ))=i=1m(p2log(2π)12log|Σ|12(x(i)μ)TΣ1(x(i)μ))

l(μ,Σ;)=mp2log(2π)m2log|Σ|12i=1m(x(i)μ)TΣ1(x(i)μ)

ডেরাইভিংμ^

সাথে ডেরিভেটিভ নিতে এবং শূন্যকে সমান করতে আমরা নিম্নলিখিত ম্যাট্রিক্স ক্যালকুলাস পরিচয়টি ব্যবহার করব:μ

wTAww=2Aw যদি on এবং উপর নির্ভর করে না তা প্রতিসাম্য।wAA

μl(μ,Σ|x(i))=i=1mΣ1(μx(i))=0Since Σ is positive definite0=mμi=1mx(i)μ^=1mi=1mx(i)=x¯

যাকে প্রায়শই নমুনা বলতে ভেক্টর বলা হয় ।

ডেরাইভিংΣ^

কোভেরিয়েন্স ম্যাট্রিক্সের জন্য এমএলই আবিষ্কার করার জন্য আরও কাজ এবং নিম্নলিখিত লিনিয়ার বীজগণিত এবং ক্যালকুলাস বৈশিষ্ট্যগুলি ব্যবহার করা প্রয়োজন:

  • ট্রেসটি ম্যাট্রিক্স পণ্যগুলির চক্রীয় অনুমানের অধীনে অবিচ্ছিন্ন:tr[ACB]=tr[CAB]=tr[BCA]
  • যেহেতু স্কেলার, তাই আমরা এর ট্রেস নিতে এবং একই মানটি পেতে পারি:xTAxxtAx=tr[xTAx]=tr[xtxA]
  • Atr[AB]=BT
  • Alog|A|=AT

এই বৈশিষ্ট্যগুলির সংমিশ্রণ আমাদের গণনা করতে দেয়

AxtAx=Atr[xTxA]=[xxt]T=xTTxT=xxT

যা ভেক্টর এর বাহ্যিক পণ্য নিজের সাথে।x

আমরা এখন লগ-সম্ভাবনা ফাংশনটি আবার লিখতে পারি এবং ডেরাইভেটিভ আর্ট comp গণনা করতে পারি (নোট ধ্রুবক রয়েছে)Σ1C

l(μ,Σ|x(i))=Cm2log|Σ|12i=1m(x(i)μ)TΣ1(x(i)μ)=C+m2log|Σ1|12i=1mtr[(x(i)μ)(x(i)μ)TΣ1]Σ1l(μ,Σ|x(i))=m2Σ12i=1m(x(i)μ)(x(i)μ)T  Since ΣT=Σ

শূন্যের সমান এবং ig জন্য সমাধানΣ

0=mΣi=1m(x(i)μ)(x(i)μ)TΣ^=1mi=1m(x(i)μ^)(x(i)μ^)T

সোর্স


বিকল্প প্রমাণ, আরও কমপ্যাক্ট ফর্ম, বা স্বজ্ঞাত ব্যাখ্যাটি স্বাগত!
জাভিয়ের বুরেট সিকোট

জন্য শিক্ষাদীক্ষা সালে , কেন নেই ইতিবাচক নির্দিষ্ট করা প্রয়োজন? এটি কি যথেষ্ট বলে মনে হচ্ছে যে অবিচ্ছিন্ন? অবিচ্ছিন্ন ম্যাট্রিক্স , কেবলমাত্র ? μΣΣAAx=0x=0
টম বনেট

স্পষ্ট করার জন্য, এমন এক ম্যাট্রিক্স যা সীমাবদ্ধ তির্যক এবং অ-তির্যক উপাদানগুলি ভেক্টরগুলির মধ্যে পারস্পরিক সম্পর্ক নির্দেশ করে, সঠিক? যদি তা হয় তবে এই ভেক্টরগুলি কোন অর্থে স্বতন্ত্র? এছাড়াও, কেন যৌথ সম্ভাবনা ফাংশন সম্ভাবনার সমান? যৌথ ঘনত্ব, , পূর্বের, অর্থাৎ দ্বারা গুণিত হওয়ার সম্ভাবনার সমান হওয়া উচিত নয় ? Σm×mf(x,y)f(x|y)f(y)
ম্যাথিউজ ২৪

1
@ টমবেনেট সিগমা ম্যাট্রিক্স সংজ্ঞা দ্বারা ইতিবাচক সুনিশ্চিত - প্রমাণের জন্য stats.stackexchange.com/questions/52976/… দেখুন । ম্যাট্রিক্স ক্যালকুলাস পরিচয়ের জন্য ম্যাট্রিক্সকে প্রতিসম হতে হবে, ইতিবাচক সুনির্দিষ্ট নয়। তবে যেহেতু ধনাত্মক সুনির্দিষ্ট ম্যাট্রিকগুলি সর্বদা প্রতিসাম্যপূর্ণ
জেভিয়ার বুরেট সিকোট ২

1
হ্যাঁ প্রকৃতপক্ষে - পর্যবেক্ষণগুলির মধ্যে স্বাধীনতা সম্ভাবনা পেতে দেয় - শব্দটি যথেষ্ট অস্পষ্ট হতে পারে - এটি সম্ভবত সম্ভাবনার বহু সংস্করণ।
পূর্বেরটি

5

for এর জন্য একটি বিকল্প প্রমাণ যা সরাসরি সাথে সম্মান নিয়ে ডেরাইভেটিভ গ্রহণ করে :Σ^Σ

উপরের মতো লগ-সম্ভাবনার সাথে বাছাই করা হচ্ছে: যেখানে এবং আমরা এর আবর্তনশীল এবং রৈখিক বৈশিষ্ট্য ব্যবহার করেছেন । গণনা করার জন্য আমরা প্রথমে এটি পর্যবেক্ষণ করি

(μ,Σ)=Cm2log|Σ|12i=1mtr[(x(i)μ)TΣ1(x(i)μ)]=C12(mlog|Σ|+i=1mtr[(x(i)μ)(x(i)μ)TΣ1])=C12(mlog|Σ|+tr[SμΣ1])
Sμ=i=1m(x(i)μ)(x(i)μ)Ttr/Σ
Σlog|Σ|=ΣT=Σ1
above উপরের চতুর্থ সম্পত্তি দ্বারা। দ্বিতীয় টার্মের ডাইরিভেটিভ নিতে আমাদের সেই প্রপার্টিটির দরকার হবে যা ( ম্যাট্রিক্স কুকবুক থেকে সমীকরণ 63৩)। সাথে এটি প্রয়োগ করে আমরা সেই কারণ এবং উভয়ই প্রতিসম হয়। তারপর
Xtr(AX1B)=(X1BAX1)T.
B=I
Σtr[SμΣ1]=(Σ1SμΣ1)T=Σ1SμΣ1
ΣSμ
Σ(μ,Σ)mΣ1Σ1SμΣ1.
এটিকে 0 তে সেট করা এবং পুনরায় সাজানো
Σ^=1mSμ.

এই পদ্ধতির মান one respect এর সাথে ডেরিভেটিভ ব্যবহার করে স্ট্যান্ডার্ডের চেয়ে আরও বেশি কাজ এবং আরও জটিল ট্রেস পরিচয় প্রয়োজন। আমি শুধু পাওয়া এটা দরকারী কারণ আমি বর্তমানে এটা ব্যবহার করা অনেক বেশি কঠিন বলে মনে হয়, যার জন্য একটি পরিবর্তিত সম্ভাবনা ফাংশনের ডেরাইভেটিভস নেওয়া প্রয়োজন চেয়ে ।Λ=Σ1/Σ1/Σ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.