দুটি সম্ভাবনার বিতরণ কতটা সমান তা পরিমাপ করার অনেকগুলি উপায় রয়েছে। জনপ্রিয় পদ্ধতিগুলির মধ্যে (বিভিন্ন মহলে) রয়েছে:
কোলমোগোরভ দূরত্ব: বন্টন কার্যের মধ্যবর্তী দূরত্ব;
ক্যান্টোরোভিচ-রুবিনস্টাইন দূরত্ব: প্রত্যাশার মধ্যে সর্বাধিক পার্থক্যটি লিপস্চিটজ ধ্রুবক সাথে দুটি ক্রিয়াকলাপ বন্টনকে আরও বাড়িয়ে তোলে, যা বিতরণ ফাংশনগুলির মধ্যে দূরত্ব হিসাবেও পরিণত হয় ;
বেষ্টিত-Lipschitz দূরত্ব: কে আর দূরত্ব কিন্তু অধিকাংশ সময়ে ফাংশন এছাড়াও পরম মান আছে করার প্রয়োজন হয় মত ।
এগুলির বিভিন্ন সুবিধা এবং অসুবিধা রয়েছে। কেবলমাত্র 3. এর অর্থে কনভার্সেশন আসলে বিতরণে রূপান্তরের সাথে সংক্ষিপ্তভাবে মিলিত হয়; 1. বা 2. অর্থে রূপান্তর সাধারণভাবে কিছুটা শক্তিশালী। (বিশেষত, যদি সম্ভাব্যতা সহ , হয়, তবে বিতরণে তে রূপান্তরিত হয় তবে দূরত্বে নয় However তবে সীমাবদ্ধতা বিতরণ যদি অবিচ্ছিন্ন থাকে তবে এই প্যাথলজিটি ঘটে না। )
প্রাথমিক সম্ভাবনা বা পরিমাপ তত্ত্বের দৃষ্টিকোণ থেকে, ১. খুব স্বাভাবিক কারণ এটি কিছু সেট হওয়ার সম্ভাবনাগুলির তুলনা করে। অন্যদিকে আরও পরিশীলিত সম্ভাব্য দৃষ্টিভঙ্গি সম্ভাবনার চেয়ে প্রত্যাশাগুলিতে বেশি মনোনিবেশ করে। এছাড়াও, কার্যকরী বিশ্লেষণের দৃষ্টিকোণ থেকে, কিছু ফাংশন স্পেসের সাথে দ্বৈততার উপর ভিত্তি করে 2. বা 3 এর মতো দূরত্বগুলি খুব আকর্ষণীয়, কারণ এই জাতীয় জিনিসগুলির সাথে কাজ করার জন্য গাণিতিক সরঞ্জামগুলির একটি বিশাল সেট রয়েছে।
যাইহোক, আমার ধারণা (আমি ভুল হলে আমাকে সংশোধন করি!) হ'ল পরিসংখ্যানগুলিতে, কলমোগোরভ দূরত্ব বন্টনের মিল খুঁজে পাওয়ার জন্য সাধারণত পছন্দসই উপায়। আমি একটি কারণ অনুমান করতে পারি: যদি বিতরণগুলির মধ্যে একটি সীমাবদ্ধ সমর্থন সহ পৃথক হয় - বিশেষত যদি এটি কিছু বাস্তব-বিশ্বের ডেটা বিতরণ হয় - তবে একটি মডেল বিতরণের কলমোগোরভ দূরত্ব গণনা করা সহজ। (কেআর দূরত্ব গণনা করা কিছুটা শক্ত হবে, এবং বিএল দূরত্ব সম্ভবত ব্যবহারিক দিক থেকে অসম্ভব হবে))
সুতরাং আমার প্রশ্ন (শেষ অবধি), পরিসংখ্যানগত উদ্দেশ্যে কোলমোগোরভ দূরত্ব (বা অন্য কোনও দূরত্ব) কে সমর্থন করার জন্য কি অন্যান্য কারণগুলি ব্যবহারিক বা তাত্ত্বিক?