বহুমাত্রিক বিতরণ একই হলে পরীক্ষা করুন Test


15

বলুন যে আমার কাছে এন-ডাইমেনশনাল ক্রমাগত-মূল্যবান ভেক্টরগুলির দুটি বা ততোধিক নমুনা জনসংখ্যা রয়েছে। এই নমুনাগুলি একই বিতরণ থেকে হয় কিনা তা পরীক্ষা করার কোন ননপ্যারমেট্রিক উপায় আছে? যদি তা হয় তবে এর জন্য আর বা অজগরটিতে কোনও ফাংশন রয়েছে?


2
কোলমোগোরভ-স্মিমনভ পরীক্ষা দুটি বিতরণ একরকম কিনা তা পরীক্ষার জন্য একটি সাধারণ অ-প্যারাম্যাট্রিক সরঞ্জাম। আমি এর সাথে পরিচিত নই, তবে উইকিপিডিয়া বলতে জাস্টেল, এ, পেঁয়া, ডি এবং জামারকে বোঝায়, আর। (1997) একটি মাল্টিভিয়ারিয়েট কোলমোগোরভ-স্মারনভ ফিটের সার্থকতার পরীক্ষা, পরিসংখ্যান ও সম্ভাবনা পত্র, 35 (3), 251-259 । এই পরীক্ষার মাল্টিভিয়ারেট এক্সটেনশনের জন্য।
ম্যাক্রো

1
এটিতে দুটি মাত্রায় সম্বোধন করে একটি সিভি প্রশ্ন রয়েছে: stats.stackexchange.com/questions/25946/… । এমনকি দুটি মাত্রায় এটি করার কোনও মানক উপায় নেই।
ফ্লাউন্ডারিয়ার

উত্তর:


8

মাল্টিভারিয়েট দুটি স্যাম্পল টেস্ট নিয়ে আমি তখন অনেক গবেষণা করেছি যখন বুঝতে পেরেছিলাম যে কোলমোগোরভ-স্মারনভ পরীক্ষাটি মাল্টিভারিয়েট নয়। তাই আমি চি পরীক্ষাটি দেখেছি, হোটেলিংয়ের টি -২, অ্যান্ডারসন-ডার্লিং, ক্র্যামার-ভন মাইসেস মানদণ্ড, শাপিরো-উইলক ইত্যাদি etc. দৈর্ঘ্য। অন্যগুলি কেবলমাত্র নমুনা বিতরণের তুলনা না করে কেবল স্বাভাবিকতার ধারনা প্রত্যাখ্যান করতে ব্যবহৃত হয়।

নেতৃস্থানীয় সমাধানটি দুটি স্যাম্পলগুলির ক্রমবর্ধমান ডিস্ট্রিবিউশন ফাংশনকে সমস্ত সম্ভাব্য অর্ডারের সাথে তুলনা করে বলে মনে হচ্ছে যা আপনি সম্ভবত সন্দেহ করতে পারেন যে কয়েক হাজার রেকর্ড রয়েছে এমন একটি নমুনার একক রান করার জন্য কয়েক মিনিটের ক্রমে:

https://cran.r-project.org/web/packages/Peacock.test/Peacock.test.pdf

জিয়াওর ডকুমেন্টেশনে যেমন বলা হয়েছে, ফ্যাসানো এবং ফ্রান্সেসচিনি পরীক্ষাটি ময়ূর পরীক্ষার একটি বৈকল্পিক:

http://adsabs.harvard.edu/abs/1987MNRAS.225..155F

ফ্যাসানো এবং ফ্রান্সেসিনি পরীক্ষাটি বিশেষত কম গণনামূলকভাবে নিবিড় হওয়ার উদ্দেশ্যে করা হয়েছিল, তবে আমি আর-তে তাদের কাজের কোনও প্রয়োগ খুঁজে পাইনি I

আপনার মধ্যে যারা ময়ূর বনাম ফাসানো এবং ফ্রান্সেসিচিনি পরীক্ষার গণনার দিকগুলি অন্বেষণ করতে চান তাদের জন্য দ্বিমাত্রিক কোলমোগোরভ – স্মিমনভ পরীক্ষার জন্য কম্পিউটেশনালি দক্ষ আলগোরিদিমগুলি পরীক্ষা করে দেখুন


মাল্টিভারিয়েটগুলির জন্য ক্রম বন্টন কী?
আকসকল

2
F(x,y)=P(X<x,Y<y)pF(x,y)=i=1nI(Xi<x,Yi<y)/n

2
সুন্দর এবং সংক্ষিপ্ত, অ্যাডামো। ফ্যাসানো এবং ফ্রান্সেসচিনি যেমন করেন, তেমনই ময়ূর পরীক্ষাটি ছাঁটাই না করার ক্ষেত্রে পুরোপুরি নির্বোধ বলে মনে হয়। আসুন আশা করি যে কেউ আর এর জন্য একদিন এটি কোড করার সিদ্ধান্ত নিয়েছে It's এটি আপনার গতির পক্ষে বিশেষভাবে সহায়ক যখন আপনার আরও ক্ষয়যোগ্য রেকর্ড রয়েছে, সম্ভবত কোনও বিভাগের পরিবর্তনশীল দ্বারা, এবং দেখতে চান যে আপনার পচনগুলি বাস্তবে বিভিন্ন বিতরণ থেকে আঁকা।
এল ফিশম্যান 21

1

আর প্যাকেজ এনপি (নন-প্যারাম্যাট্রিক) একীভূত স্কোয়ারড ঘনত্ব ব্যবহার করে ক্রমাগত এবং শ্রেণিবদ্ধ তথ্যগুলির ঘনত্বের সমতার জন্য একটি পরীক্ষা করে has লি, মাসৌমি এবং র্যাসিন (২০০৯)

পাশাপাশি বিভাগে 6 এনপি শর্তসাপেক্ষ পিডিএফ ।


1

হ্যাঁ, দুটি মাল্টিভারিয়েট নমুনা যদি একই যৌথ বিতরণ থেকে হয় তবে পরীক্ষার ননপ্যারমেট্রিক উপায় রয়েছে। আমি এল ফিশম্যান দ্বারা উল্লিখিত বিষয়গুলি বাদ দিয়ে বিশদ উল্লেখ করব । আপনি যে প্রাথমিক সমস্যাটি জিজ্ঞাসা করছেন তাকে 'দ্বি-নমুনা-সমস্যা' বলা যেতে পারে এবং জার্নাল অফ মেশিন লার্নিং রিসার্চ এবং জেনারেল অফ স্ট্যাটিস্টিকস এবং অন্যান্যদের মতো জার্নালে বর্তমানে প্রচুর পরিমাণে গবেষণা চলছে । এই সমস্যা সম্পর্কে আমার সামান্য জ্ঞান থাকলে, আমি নিম্নলিখিত হিসাবে দিকনির্দেশ দিতে পারি

  • মাল্টিভারিয়েট নমুনা সেটগুলি পরীক্ষা করার একটি সাম্প্রতিক উপায় হ'ল ম্যাক্সিমামম মিন ডিসক্ল্যাঙ্কি (এমএমডি); সম্পর্কিত সাহিত্য: আর্থার গ্রেটটন 2012 , ভারতথ 2010 এবং অন্যান্য। অন্যান্য সম্পর্কিত পদ্ধতিগুলি এই গবেষণা নিবন্ধগুলিতে পাওয়া যাবে। যদি আগ্রহী হয় তবে এই সমস্যাটিতে অত্যাধুনিক চিত্রের একটি বড় চিত্র পেতে দয়া করে এই নিবন্ধগুলির উদ্ধৃতি দিয়ে নিবন্ধগুলি দেখুন। এবং হ্যাঁ, এর জন্য আর বাস্তবায়ন রয়েছে।

আপনার আগ্রহ যদি রেফারেন্স পয়েন্ট সেটটির সাথে বিভিন্ন পয়েন্ট সেট (নমুনা সেট) তুলনা করে, তারা রেফারেন্স পয়েন্ট সেটটি কতটা কাছাকাছি করে তা দেখতে আপনি এফ-ডাইভারজেন্স ব্যবহার করতে পারেন ।

  • এর একটি জনপ্রিয় বিশেষ কেস হ'ল কুলব্যাক-লেবেলার ডাইভারজেন্স । এটি অনেকগুলি মেশিন লার্নিং সিস্টেমে ব্যবহৃত হয়। এটি আবার দুটি এনপি পদ্ধতিতে করা যেতে পারে; পারজেন উইন্ডো (কার্নেল) পদ্ধতির মাধ্যমে এবং কে-নিকটবর্তী নিকটবর্তী পিডিএফ অনুমানকারী।

যোগাযোগের অন্যান্য উপায়ও থাকতে পারে, এই উত্তরটি কোনওভাবেই আপনার প্রশ্নের বিস্তৃত চিকিত্সা নয়;)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.