কলমোগোরভ-স্মারনভ পরীক্ষার (পাইথন) পি-মান কীভাবে ব্যাখ্যা করবেন?


30

আমার কাছে দুটি নমুনা রয়েছে যা আমি পরীক্ষা করতে চাই (পাইথন ব্যবহার করে) যদি সেগুলি একই বিতরণ থেকে আঁকা হয়। এটি করার জন্য আমি স্কিপি.স্ট্যাটস থেকে পরিসংখ্যান ফাংশন ks_2 স্যাম্প ব্যবহার করি। এটি 2 টি মান দেয় এবং আমি তাদের কীভাবে ব্যাখ্যা করতে পারি তা অসুবিধা পেতে পারি। অনুগ্রহ করে সাহায্য করবেন!

উত্তর:


23

স্টিজন যেমন উল্লেখ করেছেন, কেএস পরীক্ষাটি একটি ডি পরিসংখ্যান এবং ডি স্ট্যাটিস্টিকের সাথে সম্পর্কিত একটি পি-মান প্রদান করে। ডি পরিসংখ্যান দুটি নমুনার সিডিএফগুলির মধ্যে পরম সর্বোচ্চ দূরত্ব (সুপ্রিমাম)। এই সংখ্যাটি 0 এর কাছাকাছি হওয়ার সম্ভাবনা বেশি হ'ল দুটি নমুনা একই বন্টন থেকে আঁকা হয়েছিল। কেএস পরীক্ষার জন্য উইকিপিডিয়া পৃষ্ঠাটি দেখুন। এটি একটি ভাল ব্যাখ্যা সরবরাহ করে: https://en.m.wikedia.org/wiki/Kolmogorov%E2%80%93 স্মারনভ_টেষ্ট

কেএস পরীক্ষায় ফিরে আসা পি-মানটির অন্যান্য পি-মানগুলির মতোই ব্যাখ্যা রয়েছে। আপনি নাল অনুমানটিকে প্রত্যাখ্যান করেন যে পি-মানটি আপনার তাত্পর্য স্তরের চেয়ে কম হলে দুটি নমুনা একই বিতরণ থেকে আঁকা হয়েছিল। আপনি যদি পদ্ধতিটিতে আগ্রহী হন তবে ডি স্ট্যাটিস্টিককে পি-ভ্যালুতে রূপান্তর করার জন্য আপনি অনলাইনে সারণীগুলি সন্ধান করতে পারেন।


আপনার উত্তর করার জন্য আপনাকে ধন্যবাদ। আসলে, আমি 2 টি মান ডি এবং পি-মানটির অর্থ জানি কিন্তু আমি তাদের মধ্যে সম্পর্ক দেখতে পাচ্ছি না। আমি কীভাবে তাৎপর্য স্তরের সংজ্ঞা দিতে পারি? আপনি কি আমাকে ডি স্ট্যাটিস্টিককে পি-ভ্যালুতে রূপান্তর করার জন্য একটি লিঙ্ক দিতে পারেন?
মেরি

অবশ্যই, ডি স্ট্যাটাকে পি-মান হিসাবে রূপান্তর করার জন্য সারণী: soest.hawaii.edu/wessel/courses/gg313/Critical_KS.pdf
ক্রসভিলেটেড ট্রেডিং

@ ক্রসভিলেটেড ট্রেডিং: ডি-স্ট্যাট-টু-পি-মান সারণীতে আপনার লিঙ্কটি এখন 404
জেমস.গারিস

@ ক্রসভিলেটেড ট্রেডিংয়ের কি দ্বি-পার্শ্বযুক্ত কেএস পরীক্ষা থেকে পি-ভ্যালু এবং ডি-মানগুলির মধ্যে কোনও সম্পর্ক থাকা উচিত? কিছু ক্ষেত্রে, আমি একটি আনুপাতিক সম্পর্ক দেখেছি, যেখানে ডি-স্ট্যাটিস্টিক পি-মান দিয়ে বৃদ্ধি পায়। এটি দেখে মনে হচ্ছে এটি বিপরীত হবে: বৃহত্তর পার্থক্যের (বৃহত্তর ডি-স্ট্যাটিস্টিকস) সহ দুটি বক্ররেখার তুলনায় আরও আলাদা (কম পি-মান) হবে ...
টমাস ম্যাথিউ

যদি পি মানটি ০.০৫ হয় তবে আপনার দুটি নমুনা অভিন্ন এবং ভারসাম্যপূর্ণ হওয়া উচিত।
ব্যবহারকারী 798719

5

Ks_2 স্যাম্পের জন্য গুগল অনুসন্ধান করার সময়, প্রথম হিট এই ওয়েবসাইটটি। এটিতে, আপনি ফাংশনটির স্পেসিফিকেশন দেখতে পাবেন:

This is a two-sided test for the null hypothesis that 2 independent samples are drawn from the same continuous distribution.

Parameters : 
  a, b : sequence of 1-D ndarrays
  two arrays of sample observations assumed to be drawn from a continuous distribution, sample sizes can be different

Returns :   
  D : float,  KS statistic
  p-value : float, two-tailed p-value

A এবং b প্যারামিটারগুলি আমার ডেটাগুলির ক্রম বা ks_2smp ব্যবহার করার জন্য আমার সিডিএফ গণনা করা উচিত?
মেরি

@ ম্যারি: আমি যে পৃষ্ঠাটিতে লিঙ্ক করেছি তার একটি উদাহরণ আছে।
স্টিজন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.