দুটি মাল্টিভারিয়েট বিতরণের মধ্যে "দূরত্ব" পরিমাপ করা


28

আমি কী করার চেষ্টা করছি তা বর্ণনা করার জন্য কিছু ভাল পরিভাষা খুঁজছি, উত্সগুলি সন্ধান করা আরও সহজ করে তুলতে।

সুতরাং, বলুন আমার কাছে দুটি এবং A এবং B পয়েন্টের দুটি ক্লাস্টার রয়েছে, প্রত্যেকটিই দুটি এবং দুটি মান, X এবং Y এর সাথে যুক্ত, এবং আমি A এবং B এর মধ্যে "দূরত্ব" পরিমাপ করতে চাই - অর্থাৎ সম্ভবত একই বিতরণ থেকে তাদের নমুনা দেওয়া হয়েছিল কতটা সম্ভব? (আমি ধরে নিতে পারি যে বিতরণগুলি স্বাভাবিক)। উদাহরণস্বরূপ, যদি এক্স এবং ওয়াই A তে সংযুক্ত থাকে তবে বি তে নয়, বিতরণগুলি ভিন্ন।

স্বজ্ঞাতভাবে, আমি এ এর ​​কোভেরিয়েন্স ম্যাট্রিক্সটি পেয়ে যাব এবং তারপরে বি এর প্রতিটি বিন্দু সেখানে কতটা ফিট হতে পারে তা দেখুন এবং তদ্বিপরীত (সম্ভবত মহালানোবিসের দূরত্বের মতো সামান্য ব্যবহার)।

তবে এটি কিছুটা "অ্যাড-হক", এবং সম্ভবত এটি বর্ণনা করার আরও কঠোর উপায় আছে (অবশ্যই, অনুশীলনে আমার কাছে দুটিরও বেশি ভেরিয়েবল সহ আরও দুটি ডাটা্যাসেট রয়েছে - আমি আমার ডেটাসেটগুলির মধ্যে কোনটি সনাক্ত করার চেষ্টা করছি outliers হয়)।

ধন্যবাদ!


ডান্নো কেন, তবে আমি যখন আপনার পোস্টটি পড়ি তখন একটি মান্টেল পরীক্ষা আমার চোখের সামনে ভেসে ওঠে।
রোমান Luštrik

উত্তর:


15

রয়েছে Kullback-Leibler বিকিরণ, যা Hellinger দূরত্ব আপনি উপরের উল্লেখ সম্পর্কিত হয়।


2
পয়েন্টগুলি যে অন্তর্নিহিত সম্ভাবনার ঘনত্বটি এসেছে তার কোনও অনুমান না করেই কেউ পয়েন্টগুলির কুলব্যাক-লেবেলার বিচ্যুতি গণনা করতে পারে?
আন্দ্রে হল্জনার

16

হুম, ভট্টাচার্য দূরত্বটি আমি যা খুঁজছি তা মনে হচ্ছে, যদিও হ্যালিঞ্জার দূরত্ব খুব কার্যকর।


আপনি ভট্টাচার্য এবং হিলিংয়ের কথা উল্লেখ করেছেন তারপরে কেএল সম্পর্কে কথা বলার একটি উত্তর গ্রহণ করুন ... শেষে আপনার পছন্দটি কী ছিল এবং কেন?
সাইমন সি

1
আমি বিশ্বাস করি এটি কেএল ডাইভারজেন্স ছিল, কিন্তু ... এটি ছিল ২০১০ সালে এবং আমার স্মৃতিশক্তি নিখুঁত।
এমাইল

আহ আহ হ্যাঁ আমি অনুমান করেছি, তবে যাইহোক আপনাকে ধন্যবাদ!
সাইমন সি

9

অনুসন্ধানমূলক

  • Minkowski-ফর্ম
  • ওজনযুক্ত-গড়-ভেরিয়েন্স (ডাব্লুএমভি)

ননপ্যারমেট্রিক পরীক্ষার পরিসংখ্যান

  • 2 (চি স্কোয়ার)
  • কোলমোগোরভ-স্মারনভ (কেএস)
  • ক্র্যামার / ভন মাইজস (সিভিএম)

তথ্য-তত্ত্বের ডাইভারজেন্স

  • কুলব্যাক-লেবলার (কেএল)
  • জেনসেন – শ্যানন ডাইভারজেন্স (মেট্রিক)
  • জেফ্রি-ডাইভারজেন্স (সংখ্যার স্থিতিশীল এবং প্রতিসম)

স্থল দূরত্বের ব্যবস্থা

  • হিস্টোগ্রাম ছেদ
  • চতুষ্কোণ ফর্ম (কিউএফ)
  • আর্থ মুভার দূরত্ব (EMD)

7

সর্বাধিক সম্পূর্ণ জরিপটি লেয়ানড্রো পার্দো, কমপ্লেটেন্স বিশ্ববিদ্যালয়, চ্যাপম্যান হল 2006 দ্বারা ডাইভারজেন্স মেজারের উপর ভিত্তি করে পরিসংখ্যানগত অনুক্রমের ভিত্তিতে সরবরাহ করা হয়েছে ।


0

"পরিসংখ্যানগত পার্থক্য" এর আরও কয়েকটি ব্যবস্থা

  • অনুমতি পরীক্ষা (ফিশার দ্বারা)
  • কেন্দ্রীয় সীমাবদ্ধ তত্ত্ব এবং স্লুটস্কির উপপাদ্য
  • মান-হুইটনি-উইলকক্সিন পরীক্ষা
  • অ্যান্ডারসন – ডার্লিং পরীক্ষা
  • শাপিরো – উইলক পরীক্ষা
  • হোস্টার – লেমেশো পরীক্ষা
  • কুইপারের পরীক্ষা
  • কার্নেলাইজড স্টেইনের তাত্পর্য
  • জ্যাকার্ডের মিল
  • এছাড়াও, শ্রেণিবিন্যাসের ক্লাস্টারিং গ্রুপগুলির মধ্যে মিলের ব্যবস্থা নিয়ে কাজ করে। গোষ্ঠীর মিলের সর্বাধিক জনপ্রিয় ব্যবস্থাগুলি হ'ল একক লিঙ্কেজ, সম্পূর্ণ লিঙ্কেজ এবং গড় লিঙ্কেজ।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.