কেউ কেন কলমোগোরভ-স্মারনভ পরীক্ষাকে 2 বা ততোধিক মাত্রায় সাধারণীকরণ করতে পারে না?


10

প্রশ্ন সব বলে। আমি উভয়ই পড়েছি যে একজন কেএসকে দু'জনের চেয়ে সমান বা বড় মাত্রায় সাধারণ করতে পারে না , এবং সংখ্যাসূচক রেসিপিগুলির মতো বিখ্যাত প্রয়োগগুলি কেবল ভুল are আপনি দয়া করে ব্যাখ্যা করতে পারেন কেন তাই হয়?


আমি কাগজের অংশবিশেষে (আমার উত্তরে) বিভাগের ভিত্তিতে কিছু ট্যাগ (বাইভারিয়েট, অভিজ্ঞতামূলক এবং সিডিএফ) যুক্ত করেছি।
গ্লেন_বি -রিনস্টেট মনিকা

পেড্রোফিগেইরা - আমি আমার উত্তরে যথেষ্ট পরিবর্তন করেছি (আমার মূলটি ভুল ছিল; সে সম্পর্কে দুঃখিত)। আমি সম্ভবত আরও সম্পাদনা করব কারণ আমি বেশ কয়েকটি মাল্টিভারিয়েট কেএস পরীক্ষার রেফারেন্স নিয়ে ফিরে আসতে চাইছি।
গ্লেন_বি -রিনস্টেট মনিকা

@ Glen_b আপনার সমস্ত সময় এবং প্রচেষ্টার জন্য আপনাকে অনেক ধন্যবাদ!
pedrofigueira

উত্তর:


13

আমি বিশ্বাস করি যে অনুচ্ছেদে প্রাসঙ্গিক অংশটি উদ্ধৃত করা বৈধ:

৩. কেএস পরীক্ষাটি দুই বা ততোধিক মাত্রায় প্রয়োগ করা যাবে না। জ্যোতির্বিজ্ঞানীদের প্রায়শই একটি লাইনের পাশ না দিয়ে প্লেনে বা উচ্চ মাত্রায় বিতরণ করা পয়েন্ট সহ ডেটাসেট থাকে। একটি ত্রিমাত্রিক কেএস পরীক্ষা উপস্থাপনের জন্য জ্যোতির্বিজ্ঞান সাহিত্যের বেশ কয়েকটি কাগজপত্র, এবং একটি বিখ্যাত ভলিউম সংখ্যাসূচক রেসিপিগুলিতে পুনরুত্পাদন করা হয়। তবে, কোনও ইডিএফ-ভিত্তিক পরীক্ষা (এতে কেএস, এডি এবং সম্পর্কিত পরীক্ষাগুলি অন্তর্ভুক্ত) প্রয়োগ করা যাবে না দুটি বা উচ্চতর মাত্রায়, কারণ পয়েন্টগুলি অর্ডার করার জন্য কোনও অনন্য উপায় নেই যাতে সুসংজ্ঞায়িত ইডিএফগুলির মধ্যে দূরত্বগুলি গণনা করা যায়। কেউ কোনও অর্ডারিং পদ্ধতির উপর ভিত্তি করে একটি পরিসংখ্যান তৈরি করতে পারে এবং তারপরে দুটি ডেটাসেটের (বা একটি ডেটাসেট এবং একটি বক্ররেখা) এর মধ্যে সুপ্রিমম দূরত্ব গণনা করতে পারে। তবে ফলাফলের পরিসংখ্যানগুলির সমালোচনামূলক মানগুলি বিতরণ-মুক্ত নয়।

যেমন বলা হয়েছে, এটি খুব শক্তিশালী বলে মনে হচ্ছে।

1) দ্বিখণ্ডিত বিতরণ ফাংশন, যা F(x1,x2)=P(X1x1,X2x2) থেকে একটি মানচিত্র R2 প্রতি [0,1]। এটি হ'ল, ফাংশনটি 0 থেকে 1 এর মধ্যে অবিচ্ছিন্ন আসল মান গ্রহণ করে Those সেই মানগুলি - সম্ভাবনা হওয়া - অবশ্যই "অর্ডার করা" ইতিমধ্যে - এবং এটি (ফাংশনের মান) এমন জিনিস যা আমাদের ECDF- ভিত্তিক পরীক্ষার জন্য তুলনা করা দরকার । একইভাবে, ইসিডিএফ,F^ দ্বিমুখী ক্ষেত্রে পুরোপুরি ভাল সংজ্ঞায়িত।

আমি মনে করি না যে পাঠ্যটি যেমনটি বোঝায় তেমন একটি অবিবাহিত সম্মিলিত ভেরিয়েবলের কোনও ফাংশনে পরিণত করার চেষ্টা করার প্রয়োজন আছে। আপনি কেবল গণনা করুনF এবং F^ প্রতিটি প্রয়োজনীয় সমন্বয় এবং পার্থক্য গণনা।

২) তবে এটি বিতরণ-মুক্ত কিনা এমন প্রশ্নে তাদের একটি বক্তব্য রয়েছে:

ক) স্পষ্টত এ জাতীয় পরীক্ষার পরিসংখ্যান মার্জিনের ট্রান্সফর্মেশনের পরিবর্তনের দ্বারা পরিবর্তিত হবে না, যার অর্থ, যদি দ্বিবিভক্ত স্বাধীন ইউনিফর্মের পরীক্ষা হিসাবে নির্মিত হয়, U=(U1,U2), তারপর এটি স্বাধীন হিসাবে একটি পরীক্ষা হিসাবে সমানভাবে কাজ করে (X1,X2) কোথায় Ui=Fi(Xi)। সেই অর্থে, এটি বিতরণ-মুক্ত (আমরা 'মার্জিন-মুক্ত "বলতে পারি)।

খ) তবে বিস্তৃত অর্থে সাধারণত একটি অন্তর্নিহিত বিষয় রয়েছে যে কেএস পরিসংখ্যানের একটি নিষ্পাপ সংস্করণ (যেমন আমি কেবল বর্ণনা করেছি) সাধারণভাবে বিতরণ মুক্ত নয়; আমরা কেবল রূপান্তর করতে পারি নাU ইচ্ছামত X=g(U)

আমার উত্তরের আগের সংস্করণে আমি বলেছিলাম:

কোনও অসুবিধা নেই, সমস্যা নেই

ওইটা ভুল. ঠিক যেমন উল্লেখ করা হয়েছে, সেখানে দ্বিবির্ভুক্ত স্বতন্ত্র ইউনিফর্ম থেকে কেবল মার্জিনের পরিবর্তন না হলে সেখানে সমস্যা রয়েছে। যাইহোক, সেই সমস্যাগুলি বেশ কয়েকটি উপায়ে বিভিন্ন পত্র বিবেচনা করা হয়েছে যেগুলি কোলমোগোরভ-স্মারনভ পরিসংখ্যানের বিভাজন / মাল্টিভারিয়েট সংস্করণ দেয় যা এই সমস্যায় ভুগছে না।

আমি ফিরে এসে সেই তথ্যসূত্রগুলির কয়েকটি এবং সময় অনুমতির সাথে সাথে কীভাবে তারা কাজ করে সে সম্পর্কে কিছু আলোচনা যুক্ত করতে পারি।


এই উত্তরটি পরিষ্কারভাবে সঠিক, তবে সতর্ক থাকুন: যে কেএস পরীক্ষাটি ব্যবহার করা যেতে পারে, তার অর্থ এটি ব্যবহার করা উচিত নয়। সাধারণত এখানে আরও ভাল পরীক্ষা (আরও পাওয়ারফুল) থাকে।
কেজেটিল বি হালওয়ারসেন

অবশ্যই - যদিও এটি বিকল্পগুলির আগ্রহের উপর নির্ভর করে।
গ্লেন_বি -রিনস্টেট মনিকা

1
আমি এই উত্তরটি পুরোপুরি বুঝতে পারি না। আমি কল্পনা করেছি যে অনেকগুলি জ্যোতির্বিজ্ঞানযুক্ত ডেটাসেটগুলি (পাশাপাশি আরও অনেক ছোট-মাত্রিক ডেটাসেটগুলি) অন্তর্নিহিত অর্থবহ সমন্বয় ব্যবস্থা নিয়ে আসে না। সুতরাং আপনার দাবি যে পয়েন্টগুলি "ইতিমধ্যে অর্ডার করা হয়েছে" যেমন পরিস্থিতিতে অকার্যকর হবে। আপনি যদি দেখিয়ে নিতে সক্ষম হন যে কেএস পরিসংখ্যানগুলি অবস্থানগুলি সনাক্ত করতে ব্যবহৃত স্থানাঙ্কগুলির চেয়ে স্বতন্ত্র । আমি মনে করি না যে এটি দুটি বা ততোধিক মাত্রায় সত্য, তবে আমার ভুল হতে পারে।
হোয়াইট

1
@ হুবুহু আমার ত্রুটি সম্পর্কে আপনার খুব সদয় প্রতিক্রিয়ার আলোকে আমি যথেষ্ট পরিবর্তন করেছি। দীর্ঘমেয়াদে আরও কার্যকর হবে এমন উত্তর দেওয়ার আশায় আমি উল্লেখগুলি এবং আরও বিশদ যুক্ত করার সাথে সাথে সম্ভবত আরও পরিবর্তন করব।
গ্লেন_বি

(+1) এই উত্তরকে আরও প্রশস্ত করার এবং এটি আরও সার্থক করার জন্য গ্লেন আপনাকে অনেক ধন্যবাদ। যদিও আমি সন্দেহজনক মানের ওপির রেফারেন্সটি পাই (শুরুতেই এটি অনুমানের পরীক্ষার অর্থ কী তা ভুল ব্যাখ্যা করে), এটি শেষ পর্যন্ত স্বীকার করে যে "বুটস্ট্র্যাপ উদ্ধার করতে পারে, এবং নির্দিষ্ট বহুমাত্রিক পরিসংখ্যানগুলির জন্য তাত্পর্য স্তর এবং গবেষণার অধীনে নির্দিষ্ট ডেটাসেট হতে পারে সংখ্যায় গণিত। " আপনার উত্তর কীভাবে তৈরি হচ্ছে এটির সাথে এটি অন্তত আত্মিকভাবে প্রান্তিক মনে হয়।
হোবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.