বিচ্ছিন্ন তথ্য সহ কোলমোগোরভ-স্মারনভ: আরগিতে ডিজিওফ :: কেএস.টেস্টের সঠিক ব্যবহার কী?


23

প্রাথমিক প্রশ্নগুলি:

আমি দুটি পরীক্ষামূলক ডেটা সেট একই বন্টন থেকে আসে কিনা তা পরীক্ষা করতে চাই। আমার কাছে কোলমোগোরভ-স্মারনভ পরীক্ষার পরামর্শ দেওয়া হয়েছিল।

কনভার্স ( প্রাকটিক্যাল ননপ্যারামেট্রিক স্ট্যাটিস্টিকস , 3 ডি) বলে মনে হচ্ছে যে কলমোগোরভ-স্মারনভ পরীক্ষা এই উদ্দেশ্যে ব্যবহার করা যেতে পারে তবে এর আচরণটি বিচ্ছিন্ন বিতরণ সহ "রক্ষণশীল" এবং এটির অর্থ এখানে কী তা আমি নিশ্চিত নই।

আরেক প্রশ্নের বিষয়ে ডেভিডআরের মন্তব্য বলছে "... আপনি এখনও কেএস পরিসংখ্যানের উপর ভিত্তি করে একটি স্তর-পরীক্ষা করতে পারেন, তবে সমালোচনামূলক মান অর্জনের জন্য আপনাকে আরও কিছু পদ্ধতি খুঁজে বের করতে হবে, যেমন সিমুলেশন দ্বারা।"

Dgof আর প্যাকেজ ( আর্টিকেল , ক্র্যান ) এর ks.test () সংস্করণটি স্ট্যাটাস প্যাকেজে ks.test () এর ডিফল্ট সংস্করণে উপস্থিত না থাকা কিছু ক্ষমতা যুক্ত করে। অন্যান্য জিনিসের মধ্যে, ডিজিওফ :: কেএস.টেস্টে এই প্যারামিটারটি অন্তর্ভুক্ত থাকে:

সিমুলেট.পি.ভ্যালু: একটি যুক্তিসঙ্গত নির্দেশ যা কেবল মন্টি কার্লো সিমুলেশন দ্বারা পি-ভ্যালুগুলি গণনা করা যায় কিনা, কেবলমাত্র পৃথক পৃথকীকরণের জন্য - good

সিমুলেট.পি.ভ্যালু = টি এর উদ্দেশ্য কি ডেভিডের পরামর্শ অনুসারে কাজটি সম্পাদন করবে?

এমনকি তা সত্ত্বেও, আমি নিশ্চিত নই যে আমি দ্বি-নমুনা পরীক্ষার জন্য আমি সত্যিই ডিজিফ :: কেএস.স্টেস্ট ব্যবহার করতে পারি কিনা। দেখে মনে হচ্ছে এটি কেবল অবিচ্ছিন্ন বিতরণের জন্য একটি দুটি-নমুনা পরীক্ষা সরবরাহ করে:

যদি y সংখ্যাসূচক হয় তবে এক্স এবং y একই ধ্রুবক বিতরণ থেকে আঁকা নাল অনুমানের একটি দ্বি-নমুনা পরীক্ষা করা হয়।

বিকল্পভাবে, y একটি অক্ষরযুক্ত স্ট্রিং হতে পারে যা ধারাবাহিক (ক্রমবর্ধমান) বিতরণ ফাংশন (বা এই জাতীয় কোনও ফাংশন), বা একটি ইসিডিএফ ফাংশন (বা শ্রেণি স্টেপফানের অবজেক্ট) আলাদা বিতরণ দেয় giving এই ক্ষেত্রে, বিতরণ ফাংশন যা এক্স উত্পন্ন করে যে শূন্য থেকে একটি এক-নমুনা পরীক্ষা করা হয় ....

(পটভূমির বিশদ: কড়া কথা বলতে গেলে, আমার অন্তর্নিহিত বিতরণগুলি অবিচ্ছিন্ন, তবে তথ্যগুলি খুব কয়েকটি পয়েন্টের খুব কাছেই থাকে Each প্রতিটি পয়েন্ট একটি সিমুলেশনের ফলাফল এবং -1 এবং 1 এর মধ্যে 10 বা 20 আসল সংখ্যার মধ্য দিয়ে বোঝায় 1. সিমুলেশন শেষে, এই সংখ্যাগুলি প্রায় সর্বদা .9 বা -9-এর খুব কাছাকাছি থাকে Thus সুতরাং কয়েকটি মানগুলির চারপাশে এর অর্থ ক্লাস্টার এবং আমি এগুলিকে বিযুক্ত হিসাবে বিবেচনা করছি The সিমুলেশনটি জটিল এবং আমার কোনও নেই এই ভাবার কারণ যে ডেটা একটি সুপরিচিত বিতরণ অনুসরণ করে)

পরামর্শ?


আমি এখানে ডক্টর জি এর মন্তব্যটি কেবলমাত্র লক্ষ্য করেছি যা পরামর্শ দেয় যে ks.boot আমার যা প্রয়োজন তা কিন্তু আমি এখনও অবাক হই যে dgof :: ks.test এর সিমুলেশন বিকল্পটি কাজ করবে, এবং "রূপান্তরকারী" এর অর্থ কী।
মঙ্গলবার

উত্তর:


16

এটি @ জব্রুকস এক্সটেনশনের একটি উত্তর (তবে মূলটির উত্তরও দেয়)।

2 জন নমুনা একই জনসংখ্যা / বিতরণ থেকে আসে বা কোনও পার্থক্য থাকলে তা পরীক্ষা করার জন্য একটি সাধারণ পরীক্ষা। আগ্রহের একটি পরিসংখ্যান চয়ন করুন, এটি কেএস পরীক্ষার পরিসংখ্যান বা উপায়ের পার্থক্য বা মিডিয়েনসের পার্থক্য বা রূপগুলির অনুপাত হতে পারে বা ... (আপনার প্রশ্নের পক্ষে সবচেয়ে সার্থক যাই হোক না কেন, আপনি সম্ভাব্য অবস্থার অধীনে সিমুলেশনগুলি দেখতে পারেন) যা পরিসংখ্যান আপনাকে সর্বোত্তম ফলাফল দেয়) এবং সেই স্ট্যাটিকে মূল 2 নমুনায় গণনা করুন। তারপরে আপনি এলোমেলোভাবে গ্রুপগুলির মধ্যে থাকা পর্যবেক্ষণগুলিকে অনুমতি দিন (সমস্ত ডেটা পয়েন্টকে একটি বৃহত পুলে গ্রুপ করুন, তারপরে এলোমেলোভাবে তাদের দুটি গ্রুপে মূল নমুনার মতো একই আকারে বিভক্ত করুন) এবং অনুমোদিত নমুনাগুলির উপর আগ্রহের পরিসংখ্যান গণনা করুন। এই কয়েক বার পুনরাবৃত্তি করুন, নমুনা পরিসংখ্যান বিতরণ আপনার নাল বিতরণ গঠন এবং আপনি পরীক্ষার গঠনের জন্য মূল পরিসংখ্যানটিকে এই বিতরণটির সাথে তুলনা করুন। নোট অনুমানটি নোট অনুমানটি হ'ল বিতরণগুলি অভিন্ন, কেবলমাত্র মাধ্যম / মিডিয়ান / ইত্যাদি নয় etc সমান.

আপনি যদি ধরে নিতে না চান যে বিতরণগুলি অভিন্ন তবে অর্থ / মিডিয়ান / ইত্যাদির পার্থক্যের জন্য পরীক্ষা করতে চান। তাহলে আপনি একটি বুটস্ট্র্যাপ করতে পারেন।

যদি আপনি কীভাবে ডেটা বন্টন থেকে আসে তা জানেন (বা কমপক্ষে একটি বিতরণ অনুমান করতে ইচ্ছুক) তবে আপনি প্যারামিটারের সমতার উপর একটি লাইকুইনিটি রেশিও পরীক্ষা করতে পারেন (উভয় গ্রুপের উপর প্যারামিটারগুলির একক সেট দিয়ে মডেলটির সাথে মডেলটির তুলনা করুন) পরামিতিগুলির পৃথক সেট সহ)। লাইকুনিটি রেশিও টেস্টটি সাধারণত চি-স্কোয়ার ডিস্ট্রিবিউশন ব্যবহার করে যা অনেক ক্ষেত্রে জরিমানা (অ্যাসিমেটিক্স), তবে আপনি যদি ছোট নমুনা আকার ব্যবহার করেন বা এর সীমানার নিকটে একটি প্যারামিটার পরীক্ষা করছেন (উদাহরণস্বরূপ একটি বৈকল্পিক 0) তবে অনুমানটি নাও হতে পারে ভাল, আপনি আরও ভাল নাল ডিস্ট্রিবিউশন পেতে পুনরায় অনুমতি পরীক্ষা ব্যবহার করতে পারেন।

এই পরীক্ষাগুলি সমস্ত অবিচ্ছিন্ন বা বিযুক্ত বিতরণে কাজ করে। আপনার অনিশ্চয়তার পরিমাণ বোঝাতে কিছুটা ক্ষমতার শক্তি বা আত্মবিশ্বাসের ব্যবধানও অন্তর্ভুক্ত করা উচিত, তাত্পর্যটির অভাব কম পাওয়ারের কারণে হতে পারে বা একটি পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ এখনও কার্যত অর্থহীন হতে পারে।


গ্রেগ, ধন্যবাদ। এটি জিব্রুকের প্রশ্নের খুব সহায়ক একটি সাধারণ উত্তর এবং এটি আমার পক্ষেও সহায়ক। (আমার প্রশ্ন আরো নির্দিষ্ট ছিল হয়তো খুব উত্তর আশা সংকীর্ণ।।)
মঙ্গল

1
@ মার্স, আমি মনে করি আমার উত্তর অপ্রত্যক্ষভাবে আপনার কমপক্ষে কিছু অংশের উত্তর দেয়। নিয়মিত কেএস পরীক্ষাটি কোনও সম্পর্ক স্থাপন করে না এবং নাল অনুমানের অধীনে পরীক্ষার পরিসংখ্যানগুলির জন্য একটি তাত্ত্বিক মডেল ব্যবহার করে। সংযোগগুলির সাথে তাত্ত্বিক মডেলটি সঠিক নয় তবে আপনি পরিবর্তে নকল বিতরণ গণনা করতে সিমুলেশন (ক্রমশক্তি পরীক্ষা, নাল ডিস্ট থেকে অনুকরণ ইত্যাদি) ব্যবহার করতে পারেন এবং তাই পি-মান ইত্যাদি অর্জন করতে পারেন I আমি অনুমান করব যে এটিই অনুকরণ আপনি যে যুক্তিটি উল্লেখ করেছেন তা করে।
গ্রেগ স্নো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.