কোলমোগোরভ-স্মারনভ পরীক্ষা কেন কাজ করে?


25

2-নমুনা কেএস পরীক্ষা সম্পর্কে পড়তে, আমি ঠিক বুঝতে পেরেছি এটি কী করছে তবে কেন এটি কাজ করে তা আমি বুঝতে পারি না ।

অন্য কথায়, আমি অভিজ্ঞতাগত বিতরণ ফাংশনগুলি গণনা করার জন্য সমস্ত পদক্ষেপগুলি অনুসরণ করতে পারি, ডি-পরিসংখ্যান খুঁজে বের করতে, সমালোচনামূলক মানগুলি গণনা করতে, ডি-স্ট্যাটিস্টিককে পি-ভ্যালুতে রূপান্তরকরণ ইত্যাদির জন্য উভয়ের মধ্যে সর্বাধিক পার্থক্য খুঁজে পেতে পারি can

তবে, আমার কোনও ধারণা নেই যে এগুলির মধ্যে কেন আমাকে দুটি বিতরণ সম্পর্কে আসলে কিছু জানায়।

কেউ আমাকে খুব সহজেই বলতে পারত যে আমার গাধাটির উপরে ঝাঁপিয়ে পড়ার দরকার আছে এবং এটি গতিতে গতিতে গতিতে গতিতে চলে যায় এবং যদি গতিবেগটি 2 কিমি / ঘন্টা থেকে কম হয় তবে আমি নাল-কল্পনাটিকে প্রত্যাখ্যান করি। অবশ্যই আপনি আমাকে যা করতে বলেছিলেন আমি তা করতে পারি তবে এর কোনওটির নাল-হাইপোথিসিসের সাথে কী করার আছে?

2-নমুনা কেএস পরীক্ষা কেন কাজ করে? দুটি বিতরণ কীভাবে পৃথক হয়েছে তার সাথে ইসিডিএফগুলির মধ্যে সর্বাধিক পার্থক্য গণনা করার কী আছে?

কোন সাহায্য প্রশংসা করা হয়। আমি কোনও পরিসংখ্যানবিদ নই, সুতরাং ধরে নিও যে সম্ভব হলে আমি একজন বোকা।


4
সিভি, ডারসি স্বাগতম! দুর্দান্ত প্রশ্ন!
অ্যালেক্সিস

1
একটি গাধা উপর লাফিয়ে ... :)
রিচার্ড হার্ডি

উত্তর:


9

মূলত, পরীক্ষাটি গ্লিভেনকো ক্যান্তেল্লি উপপাদ্যের প্রত্যক্ষ ফলাফল হিসাবে সামঞ্জস্যপূর্ণ, যা অভিজ্ঞতা অভিজ্ঞতা এবং সম্ভবত পরিসংখ্যানগুলির অন্যতম গুরুত্বপূর্ণ ফলাফল।

জিসি আমাদের বলেছেন যে কোলমোগোরভ স্মারনভ পরীক্ষার পরিসংখ্যান নাল অনুমানের অধীনে 0 হিসাবে চলে গেছে । আপনি বাস্তব বিশ্লেষণ এবং তত্ত্বগুলি সীমাবদ্ধ না করা পর্যন্ত এটি স্বজ্ঞাত মনে হতে পারে। এটি একটি উদ্ঘাটন কারণ প্রক্রিয়াটি এলোমেলোভাবে অসংখ্য সীমাহীন প্রক্রিয়া হিসাবে বিবেচনা করা যেতে পারে, সুতরাং আইন বা সম্ভাব্যতা একজনকে বিশ্বাস করতে পরিচালিত করবে যে সর্বদা একটি পয়েন্ট থাকে যা কোনও অ্যাপসিলন সীমানা ছাড়িয়ে যেতে পারে তবে না, সর্বোপরি রূপান্তরিত হবে দীর্ঘমেয়াদে.n

কতক্ষণ? মাইমিয়া আমি জানি না। পরীক্ষার শক্তি এক ধরণের সন্দেহজনক। আমি বাস্তবে কখনও এটি ব্যবহার করব না।

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf


2
+1 হাই আদম! "একধরণের সন্দেহজনক" হওয়ার ক্ষমতাটি কি এক থেকে দুটি বাক্যে নেওয়া উচিত? আমি সেই দৃষ্টিকোণটি পছন্দ করব (আমি জড়ো হয়েছি যে পরীক্ষাটি সহজেই "অতিশক্তিযুক্ত" হিসাবে বিবেচিত হয়)।
অ্যালেক্সিস

1
@Alexis পরীক্ষা পরাভূত করা হয় না, IRL আমরা প্রায় আশা কখনোই নাল সত্য হতে পারে, বরং আমরা শুধু পরোয়া করি না কিনা মধ্যে 0.1 দ্বারা পৃথক শতকরা 99.999 তম এবং ।, তাই যখনই আমি দেখতে থেকে কে এস পরীক্ষা, আমি মনে করি, "একটি মিথ্যা নেতিবাচক যে" এবং যখনই আমি দেখতে আমি মনে করি "উচ্চ চিৎকার করা-Dee-do তাই কি আপনার সম্পর্কে বলতে পারেন যে ?"। শক্তিশালী নাল অনুমানের পরীক্ষাগুলি বৈজ্ঞানিক প্রমাণ উপস্থাপনের জন্য বাধ্যতামূলক উপায় নয়। F1F2p>0.05p<0.05F1=F2
অ্যাডামো

1
ঠিক আছে. পার্থক্যের জন্য হাইপোথিসিস টেস্টগুলির সাথে আমি ইয়ার উদ্বেগ পাই। তবে ক্ষমতার বিষয়ে আপনার উদ্বেগ কি সাধারণ অনটোলজিকাল বিশ্বাস থেকে উঠে আসে যে প্রায় অবশ্যই ? বা অ্যাসিম্পটিকস সম্পর্কে আরও কিছু ম্যাথিক আছে বা সেখানে অন্য কিছু আছে? F1F2
অ্যালেক্সিস

2
@ অ্যালেক্সিস না, পরীক্ষার গণিত নিয়ে আমার কোনও উদ্বেগ নেই। আসলে, আমি মনে করি এটি বেশ মার্জিত এবং সীমাবদ্ধ তাত্ত্বিক ফলাফলটি খুব চিত্তাকর্ষক।
অ্যাডামো

2
@Alexis আমি বলব, সেটিংস যেখানে এটা হয় সম্ভব জন্য ঠিক সমান হতে , পরীক্ষা চমত্কার কুশলী হতে পারে। আমি সম্মত হই যে প্রচুর পরিমাণে বৈজ্ঞানিক অ্যাপ্লিকেশন সেই বিলের সাথে খাপ খায় না, তবে একটি পরিসংখ্যানগত কম্পিউটিং প্রসঙ্গে যেখানে আপনি যাচাই করতে চান যে আপনার লেখা কিছু সফ্টওয়্যার কিছু পরিচিত বিতরণ থেকে সিউডো এলোমেলো সংখ্যা তৈরি করছে, এটি বেশ কার্যকর। এটি সম্ভাব্যতা প্লটগুলি দেখে আপনি যে অন্তর্দৃষ্টিটি পেয়েছেন তা কার্যকরভাবে কোড করে। F1F2
jcz

9

আমাদের দুটি স্বতন্ত্র, অবিচ্ছিন্ন নমুনা রয়েছে:

X1,X2,...,XNiidFY1,Y2,...,YMiidG,
যেখানে এবং ক্রমাগত ক্রম বিতরণ ফাংশন। পরীক্ষাটি যদি নাল অনুমানটি সত্য হয় তবে এবং একই বন্টন থেকে প্রাপ্ত নমুনা। সকল এটির জন্য লাগে এবং হতে বিভিন্ন ডিস্ট্রিবিউশন থেকে স্বপক্ষে জন্য এবংGF
H0:F(x)=G(x)for all xRH1:F(x)G(x)for some xR.
{Xi}i=1N{Yj}j=1MXiYjFGকমপক্ষে একটি মানের যে কোনও পরিমাণে পৃথক করতে । সুতরাং কেএস পরীক্ষাটি প্রতিটি নমুনার অনুশীলনীয় সিডিএফ দিয়ে এবং অনুমান করে, দুজনের মধ্যে সবচেয়ে বড় পয়েন্টওয়াইজ পার্থক্যকে সম্মান করে এবং জিজ্ঞাসা করে যে এই পার্থক্যটি "বড় যথেষ্ট" কিনা উপসংহারে? কিছু ।xFGF(x)G(x)xR


8

একটি স্বজ্ঞাত গ্রহণ:

কোলমোগোরভ-স্মারনভ পরীক্ষা বিতরণের মাধ্যমে পর্যবেক্ষণের আদেশের উপর বেশিরভাগ মৌলিকভাবে নির্ভর করে। যুক্তিটি হ'ল যদি দুটি অন্তর্নিহিত বিতরণ একই হয় তবে sample নমুনা আকারের উপর নির্ভরশীল — ক্রমটি দুজনের মধ্যে বেশ ভালভাবে বদলানো উচিত।

নমুনা ক্রম "unshuffled" একটি চরম যথেষ্ট ফ্যাশন (যেমন, সকল বা অধিকাংশ বিতরণে পর্যবেক্ষণ থাকে আসা সামনে বিতরণে পর্যবেক্ষণ , যা করতে হবে , যে নাল প্রমাণ হিসাবে নেওয়া হয় পরিসংখ্যাত অনেক বড়) অনুমান যে অন্তর্নিহিত বিতরণ এক নয়।Yএক্স ডিXD

যদি দুটি নমুনা বিতরণ ভালভাবে পরিবর্তিত হয় তবে খুব বড় হওয়ার সুযোগ পাবেন না কারণ এবং মানগুলি একে অপরের সাথে ট্র্যাক করবে এবং আপনার নালটিকে প্রত্যাখ্যান করার পক্ষে পর্যাপ্ত প্রমাণ থাকবে না ।DXY

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.