বলুন যে আমার কাছে এন-ডাইমেনশনাল ক্রমাগত-মূল্যবান ভেক্টরগুলির দুটি বা ততোধিক নমুনা জনসংখ্যা রয়েছে। এই নমুনাগুলি একই বিতরণ থেকে হয় কিনা তা পরীক্ষা করার কোন ননপ্যারমেট্রিক উপায় আছে? যদি তা হয় তবে এর জন্য আর বা অজগরটিতে কোনও ফাংশন রয়েছে?
বলুন যে আমার কাছে এন-ডাইমেনশনাল ক্রমাগত-মূল্যবান ভেক্টরগুলির দুটি বা ততোধিক নমুনা জনসংখ্যা রয়েছে। এই নমুনাগুলি একই বিতরণ থেকে হয় কিনা তা পরীক্ষা করার কোন ননপ্যারমেট্রিক উপায় আছে? যদি তা হয় তবে এর জন্য আর বা অজগরটিতে কোনও ফাংশন রয়েছে?
উত্তর:
মাল্টিভারিয়েট দুটি স্যাম্পল টেস্ট নিয়ে আমি তখন অনেক গবেষণা করেছি যখন বুঝতে পেরেছিলাম যে কোলমোগোরভ-স্মারনভ পরীক্ষাটি মাল্টিভারিয়েট নয়। তাই আমি চি পরীক্ষাটি দেখেছি, হোটেলিংয়ের টি -২, অ্যান্ডারসন-ডার্লিং, ক্র্যামার-ভন মাইসেস মানদণ্ড, শাপিরো-উইলক ইত্যাদি etc. দৈর্ঘ্য। অন্যগুলি কেবলমাত্র নমুনা বিতরণের তুলনা না করে কেবল স্বাভাবিকতার ধারনা প্রত্যাখ্যান করতে ব্যবহৃত হয়।
নেতৃস্থানীয় সমাধানটি দুটি স্যাম্পলগুলির ক্রমবর্ধমান ডিস্ট্রিবিউশন ফাংশনকে সমস্ত সম্ভাব্য অর্ডারের সাথে তুলনা করে বলে মনে হচ্ছে যা আপনি সম্ভবত সন্দেহ করতে পারেন যে কয়েক হাজার রেকর্ড রয়েছে এমন একটি নমুনার একক রান করার জন্য কয়েক মিনিটের ক্রমে:
https://cran.r-project.org/web/packages/Peacock.test/Peacock.test.pdf
জিয়াওর ডকুমেন্টেশনে যেমন বলা হয়েছে, ফ্যাসানো এবং ফ্রান্সেসচিনি পরীক্ষাটি ময়ূর পরীক্ষার একটি বৈকল্পিক:
http://adsabs.harvard.edu/abs/1987MNRAS.225..155F
ফ্যাসানো এবং ফ্রান্সেসিনি পরীক্ষাটি বিশেষত কম গণনামূলকভাবে নিবিড় হওয়ার উদ্দেশ্যে করা হয়েছিল, তবে আমি আর-তে তাদের কাজের কোনও প্রয়োগ খুঁজে পাইনি I
আপনার মধ্যে যারা ময়ূর বনাম ফাসানো এবং ফ্রান্সেসিচিনি পরীক্ষার গণনার দিকগুলি অন্বেষণ করতে চান তাদের জন্য দ্বিমাত্রিক কোলমোগোরভ – স্মিমনভ পরীক্ষার জন্য কম্পিউটেশনালি দক্ষ আলগোরিদিমগুলি পরীক্ষা করে দেখুন
আর প্যাকেজ এনপি (নন-প্যারাম্যাট্রিক) একীভূত স্কোয়ারড ঘনত্ব ব্যবহার করে ক্রমাগত এবং শ্রেণিবদ্ধ তথ্যগুলির ঘনত্বের সমতার জন্য একটি পরীক্ষা করে has লি, মাসৌমি এবং র্যাসিন (২০০৯)
পাশাপাশি বিভাগে 6 এনপি শর্তসাপেক্ষ পিডিএফ ।
হ্যাঁ, দুটি মাল্টিভারিয়েট নমুনা যদি একই যৌথ বিতরণ থেকে হয় তবে পরীক্ষার ননপ্যারমেট্রিক উপায় রয়েছে। আমি এল ফিশম্যান দ্বারা উল্লিখিত বিষয়গুলি বাদ দিয়ে বিশদ উল্লেখ করব । আপনি যে প্রাথমিক সমস্যাটি জিজ্ঞাসা করছেন তাকে 'দ্বি-নমুনা-সমস্যা' বলা যেতে পারে এবং জার্নাল অফ মেশিন লার্নিং রিসার্চ এবং জেনারেল অফ স্ট্যাটিস্টিকস এবং অন্যান্যদের মতো জার্নালে বর্তমানে প্রচুর পরিমাণে গবেষণা চলছে । এই সমস্যা সম্পর্কে আমার সামান্য জ্ঞান থাকলে, আমি নিম্নলিখিত হিসাবে দিকনির্দেশ দিতে পারি
আপনার আগ্রহ যদি রেফারেন্স পয়েন্ট সেটটির সাথে বিভিন্ন পয়েন্ট সেট (নমুনা সেট) তুলনা করে, তারা রেফারেন্স পয়েন্ট সেটটি কতটা কাছাকাছি করে তা দেখতে আপনি এফ-ডাইভারজেন্স ব্যবহার করতে পারেন ।
যোগাযোগের অন্যান্য উপায়ও থাকতে পারে, এই উত্তরটি কোনওভাবেই আপনার প্রশ্নের বিস্তৃত চিকিত্সা নয়;)