এটি এমএমডি সম্পর্কে একটি সংক্ষিপ্তসার আরও কিছুটা দিতে সহায়তা করতে পারে।
সাধারণভাবে, বৈশিষ্ট্যগুলির গড় এমবেডিংয়ের মধ্যে দূরত্ব হিসাবে বিতরণগুলির মধ্যে দূরত্বগুলি উপস্থাপনের ধারণা দ্বারা এমএমডি সংজ্ঞায়িত করা হয় । অর্থাৎ বলতে আমরা ডিস্ট্রিবিউশন আছে এবং একটি সেট উপর । এমএমডি একটি বৈশিষ্ট্য মানচিত্র দ্বারা সংজ্ঞায়িত করা হয় , যেখানে , যাকে প্রজনন কার্নেল হিলবার্ট স্পেস বলা হয়। সাধারণভাবে, এমএমডি হ'ল
PQX φ:X→HHMMD(P,Q)=∥EX∼P[φ(X)]−EY∼Q[φ(Y)]∥H.
একটি উদাহরণ হিসাবে, আমাদের কাছে এবং । :
সুতরাং এই এমএমডি দুটি বিতরণের মাধ্যমের মধ্যবর্তী দূরত্ব। এই জাতীয় ডিস্ট্রিবিউশনগুলির সাথে মিলে যাওয়া তাদের অর্থগুলির সাথে মেলে, যদিও তারা তাদের ভিন্নতা বা অন্য উপায়ে ভিন্ন হতে পারে।X=H=Rdφ(x)=xMMD(P,Q)=∥EX∼P[φ(X)]−EY∼Q[φ(Y)]∥H=∥EX∼P[X]−EY∼Q[Y]∥Rd=∥μP−μQ∥Rd,
আপনার কিছুটা আলাদা: আমাদের এবং ,, , যেখানে একটি ম্যাট্রিক্স। সুতরাং আমাদের
এই এমএমডি হ'ল মধ্যবর্তী দুটি পৃথক অনুমানের মধ্যে পার্থক্য। যদি বা ম্যাপিং অন্যথায় পরিবর্তিত না হয়,X=RdH=Rpφ(x)=A′xAd×pMMD(P,Q)=∥EX∼P[φ(X)]−EY∼Q[φ(Y)]∥H=∥EX∼P[A′X]−EY∼Q[A′Y]∥Rp=∥A′EX∼P[X]−A′EY∼Q[Y]∥Rp=∥A′(μP−μQ)∥Rp.
p<dA′ আগেরটির তুলনায়: এটি পূর্ববর্তী যেটি বিতরণ করে তার মধ্যে পার্থক্য করে না।
আপনি আরও শক্তিশালী দূরত্ব তৈরি করতে পারেন। উদাহরণস্বরূপ, যদি এবং আপনি তবে এমএমডি পূর্ব becomes হয়ে যায় , এবং কেবলমাত্র বিভিন্ন উপায়ে নয় বিতরণগুলিও পৃথক করতে পারে differentX=Rφ(x)=(x,x2)(EX−EY)2+(EX2−EY2)2−−−−−−−−−−−−−−−−−−−−−−−−−√
এবং আপনি এর চেয়ে আরও শক্তিশালী হতে পারেন: যদি if একটি সাধারণ পুনরুত্পাদন কার্নেল হিলবার্ট স্পেসে মানচিত্র করে, তবে আপনি এমএমডি গণনা করতে কার্নেল ট্রিক প্রয়োগ করতে পারেন , এবং দেখা গেছে যে গাউসিয়ান কার্নেল সহ অনেকগুলি কার্নেল এমএমডি বাড়ে lead শূন্য এবং যদি কেবল বিতরণগুলি অভিন্ন হয়।φ
বিশেষত, , আপনি পেতে পারেন
যা আপনি নমুনাগুলির সাহায্যে সোজাভাবে অনুমান করতে পারেন।k(x,y)=⟨φ(x),φ(y)⟩HMMD2(P,Q)=∥EX∼Pφ(X)−EY∼Qφ(Y)∥2H=⟨EX∼Pφ(X),EX′∼Pφ(X′)⟩H+⟨EY∼Qφ(Y),EY′∼Qφ(Y′)⟩H−2⟨EX∼Pφ(X),EY∼Qφ(Y)⟩H=EX,X′∼Pk(X,X′)+EY,Y′∼Qk(Y,Y′)−2EX∼P,Y∼Qk(X,Y)
আপডেট: এখানে "সর্বাধিক" নামটি এসেছে।
বৈশিষ্ট্যটির মানচিত্র একটি পুনরুত্পাদন কার্নেল হিলবার্ট স্পেসে মানচিত্র। এগুলো শূণ্যস্থান আছে ফাংশন , এবং একটি চাবি সম্পত্তি (যাকে বলা হয় সন্তুষ্ট প্রতিলিপি সম্পত্তি :) কোন ।φ:X→H⟨f,φ(x)⟩H=f(x)f∈H
সবচেয়ে সহজ উদাহরণে, সহ , আমরা প্রতিটি as কিছু to এর সাথে ফাংশন হিসাবে দেখি , । তারপরে প্রজনন সম্পত্তি বোঝা উচিতX=H=Rdφ(x)=xf∈Hw∈Rdf(x)=w′x⟨f,φ(x)⟩H=⟨w,x⟩Rd
গাউসিয়ান কার্নেলের মতো আরও জটিল সেটিংসে, আরও জটিল কাজ, তবে পুনরুত্পাদন সম্পত্তি এখনও ধারণ করে।f
এখন, আমরা এমএমডি এর বিকল্প বৈশিষ্ট্য দিতে পারি:
দ্বিতীয় লাইন হিলবার্ট স্পেসগুলির নিয়ম সম্পর্কে সাধারণ তথ্য:MMD(P,Q)=∥EX∼P[φ(X)]−EY∼Q[φ(Y)]∥H=supf∈H:∥f∥H≤1⟨f,EX∼P[φ(X)]−EY∼Q[φ(Y)]⟩H=supf∈H:∥f∥H≤1⟨f,EX∼P[φ(X)]⟩H−⟨f,EY∼Q[φ(Y)]⟩H=supf∈H:∥f∥H≤1EX∼P[⟨f,φ(X)⟩H]−EY∼Q[⟨f,φ(Y)⟩H]=supf∈H:∥f∥H≤1EX∼P[f(X)]−EY∼Q[f(Y)].
supf:∥f∥≤1⟨f,g⟩H=∥g∥ দ্বারা অর্জন করা হয়েছে । চতুর্থ কোনও প্রযুক্তিগত অবস্থার উপর নির্ভর করে যা বোচনার ইন্টিগ্রাবিলিটি নামে পরিচিত তবে এটি সত্য যেমন বাউন্ডেড কার্নেল বা সীমানা সমর্থন সহ বিতরণের জন্য utions তারপরে শেষে আমরা প্রজনন সম্পত্তি ব্যবহার করি।f=g/∥g∥
এটি সর্বাধিক টেস্ট ফাংশন উপর, - এই শেষ লাইন কেন এটি "সর্বাধিক গড় অমিল" বলা হয় হয় ইউনিট বল , দুই ডিস্ট্রিবিউশন মধ্যে গড় পার্থক্য।fH