কোনটি বিশ্বাস করবেন: কোলমোগোরভ-স্মারনভ পরীক্ষা বা কিউকিউ প্লট?


16

আমি নির্ধারণ করার চেষ্টা করছি যে আমার অবিচ্ছিন্ন ডেটাसेट প্যারামিটার আকার 1.7 এবং হার = 0.000063 সহ গামা বিতরণ অনুসরণ করে কিনা।==

সমস্যাটি যখন আমি তাত্ত্বিক বিতরণ গ্যামার (1.7, 0.000063) বিপরীতে আমার ডেটাসেট একটি কিউকিউ প্লট তৈরি করতে আর ব্যবহার করি, তখন আমি এমন একটি প্লট পেয়েছি যা দেখায় যে অভিজ্ঞতাবাদী ডেটা মোটামুটি গামা বিতরণের সাথে একমত হয়। ইসিডিএফ প্লটের ক্ষেত্রেও একই ঘটনা ঘটে।x

তবে আমি যখন কোলমোগোরভ-স্মারনভ পরীক্ষা চালাচ্ছি, তখন এটি আমাকে < 1 % এর অযৌক্তিকভাবে ছোট ভ্যালু দেয় ।p<1%

আমার কোনটি বিশ্বাস করা উচিত? গ্রাফিকাল আউটপুট বা কেএস-পরীক্ষার ফলাফল?

কিউকিপ্লট এবং ইসিডিএফ প্লট


আপনি প্রাপ্ত ঘনত্ব বিতরণ প্লটগুলিও সরবরাহ করতে পারেন?
স্ক্র্যাচ

13
পরীক্ষা এবং ডায়াগনস্টিক প্লটটি বেমানান নয়। বিতরণটি তাত্ত্বিকের মতো, যেমন কিউকিউ প্লটটি দেখায়। নমুনার আকারটি যথেষ্ট বড় যে আপনি তাত্ত্বিক দিক থেকে এমনকি সামান্যতম পার্থক্য তুলতে পারবেন।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


18

আমি কিউকিউ প্লটকে "বিশ্বাস" না করার কোনও ধারণা দেখছি না (যদি আপনি এটি সঠিকভাবে উত্পাদন করেছেন); এটি আপনার ডেটার বাস্তবতার কেবল একটি গ্রাফিকাল উপস্থাপনা, সংজ্ঞাযুক্ত বিতরণের সাথে জুড়ে দেওয়া। স্পষ্টতই এটি একটি নিখুঁত মিল নয়, তবে এটি যদি আপনার উদ্দেশ্যগুলির পক্ষে যথেষ্ট ভাল হয় তবে এটি গল্পের কমবেশি শেষ হতে পারে। আপনি এই সম্পর্কিত প্রশ্নটি দেখতে চাইতে পারেন: স্বাভাবিকতা পরীক্ষাটি কি 'মূলত অকেজো'?

দ্য পি

আপনার ডেটা আপনার উদ্দেশ্যযুক্ত উদ্দেশ্যে গামা বিতরণ থেকে খুব আলাদা কিনা তা অন্য প্রশ্ন। কেবলমাত্র কেএস পরীক্ষা আপনার পক্ষে উত্তর দিতে পারে না (কারণ এর ফলাফলটি আপনার নমুনার আকারের উপর নির্ভর করবে, অন্যান্য কারণগুলির মধ্যেও), তবে কিউকিউ প্লট আপনাকে সিদ্ধান্ত নিতে সহায়তা করতে পারে। আপনি যে অন্য চালনার পরিকল্পনা করছেন তার শক্তিশালী বিকল্পগুলিও সন্ধান করতে পারেন, এবং যদি আপনি গামা বন্টন থেকে বিচ্যুতি সম্পর্কে পরবর্তী কোনও বিশ্লেষণের সংবেদনশীলতা বিবেচনা করতে বিশেষত গুরত্ব বোধ করেন তবে আপনি কিছু সিমুলেশন টেস্টিংও বিবেচনা করতে চাইতে পারেন ।


15

আপনি যা করতে পারেন তা হল আপনার তাত্ত্বিক বিতরণ থেকে একাধিক নমুনা তৈরি করা এবং আপনার কিউকিউ-প্লটের পটভূমিতে প্লট করা। এটি আপনাকে কেবল নমুনা দেওয়ার মাধ্যমে যুক্তিসঙ্গতভাবে কী ধরনের পরিবর্তনশীলতা আশা করতে পারে তার একটি ধারণা দেবে।

তাত্ত্বিক লাইনের চারপাশে একটি খাম তৈরি করতে আপনি এই ধারণাটি প্রসারিত করতে পারেন, এর 86-89 পৃষ্ঠাগুলি থেকে উদাহরণটি ব্যবহার করে:

ভেনেবলস, ডাব্লুএন এবং রিপলি, বিডি 2002. এস নিউ ইয়র্ক: স্প্রিংজার সহ আধুনিক প্রয়োগিত পরিসংখ্যান।

এটি একটি পয়েন্ট-ভিত্তিক খাম হবে। এর 151-154 পৃষ্ঠাগুলি থেকে ধারণাগুলি ব্যবহার করে সামগ্রিক খাম তৈরি করতে আপনি এই ধারণাটি আরও বাড়িয়ে দিতে পারেন:

ডেভিসন, এসি এবং হিঙ্কলি, ডিভি 1997 Boot বুটস্ট্র্যাপ পদ্ধতি এবং তাদের প্রয়োগ। কেমব্রিজ: কেমব্রিজ বিশ্ববিদ্যালয় প্রেস।

তবে বুনিয়াদি অন্বেষণের জন্য আমি মনে করি আপনার কিউকিউ-প্লটের পটভূমিতে কয়েকটি রেফারেন্স নমুনা প্লট করা যথেষ্ট পরিমাণে বেশি হবে।


ভাল ধারণা! 11 ঘন্টা (আমার সমস্ত ভোট কার্টুনগুলিতে ব্যবহার করা হয়েছে ) এটিকে উত্তোলনের জন্য আমাকে স্মরণ করিয়ে দিন ... আমি বিশেষত এই ধরণের প্লট সমৃদ্ধ করার উপায় হিসাবে ইসিডিএফ বুটস্ট্র্যাপ করা পছন্দ করি।
নিক স্টাওনার

1
এছাড়াও সিআরএএন প্যাকেজ sfsmisc দেখুন, যার মধ্যে রয়েছে ecdf.ksCI ফাংশনটি ইসিডিএফ প্লটের উপর একটি আত্মবিশ্বাস ব্যান্ড আঁকছে। একই ধারণাটি কিউকিউ প্লটের উপর একটি আস্থা ব্যান্ড আঁকতে ব্যবহার করা যেতে পারে ...
kjetil b halvorsen

2

কেএস পরীক্ষাটি আপনার বিতরণের নির্দিষ্ট প্যারামিটার ধরে নিয়েছে। এটি অনুমানটি পরীক্ষা করে "এই নির্দিষ্ট বিতরণ অনুযায়ী ডেটা বিতরণ করা হয়"। আপনি এই প্যারামিটারগুলি কোথাও নির্দিষ্ট করে থাকতে পারেন। যদি তা না হয় তবে কিছু না মেলে ডিফল্ট ব্যবহার করা যেতে পারে। নোট করুন যে অনুমানিত পরামিতিগুলি অনুমানের মধ্যে প্লাগ করা থাকলে কেএস পরীক্ষাটি রক্ষণশীল হয়ে উঠবে।

তবে বেশিরভাগ ধার্মিকতা-ফিট-টেস্টগুলি ভুল উপায়ে ব্যবহার করা হয়। যদি কেএস পরীক্ষার তাত্পর্য না দেখানো হত, এর অর্থ এই নয় যে আপনি যে মডেলটি প্রমাণ করতে চেয়েছিলেন তা উপযুক্ত। @ নিক স্টাওনার খুব ছোট নমুনার আকার সম্পর্কে এটি বলেছিলেন। এই ইস্যুটি হাইপোথিসিস টেস্ট এবং সমতুল্য পরীক্ষাগুলির সমান।

সুতরাং শেষ পর্যন্ত: কেবল কিউকিউ-প্লটগুলি বিবেচনা করুন।


-1

কিউকিউ প্লট একটি অনুসন্ধানের ডেটা বিশ্লেষণ কৌশল এবং এরূপ হিসাবে বিবেচনা করা উচিত - অন্য সমস্ত ইডিএ প্লটগুলি। এগুলি কেবল আপনাকে হাতের ডেটাতে প্রাথমিক অন্তর্দৃষ্টি দেওয়ার উদ্দেশ্যে। আপনার কখনই কিউকিউ প্লটের মতো ইডিএ প্লটের ভিত্তিতে আপনার বিশ্লেষণ সিদ্ধান্ত নেওয়া বা থামানো উচিত নয়। কেবল কিউকিউ প্লট বিবেচনা করা একটি ভুল পরামর্শ। আপনার অবশ্যই স্পষ্টভাবে কেএস টেস্টের মতো কোয়ান্টেটিভ কৌশলগুলি অনুসরণ করা উচিত। ধরুন আপনার কাছে অনুরূপ ডেটা সেট করার জন্য আরও কিউকিউ প্লট রয়েছে, আপনি একটি মাত্রিক সরঞ্জাম ছাড়া কীভাবে দুটিটির তুলনা করবেন? আপনার জন্য ঠিক পরবর্তী পদক্ষেপ, ইডিএ এবং কেএস পরীক্ষার পরে কেএস পরীক্ষা কেন কম পি-মান দিচ্ছে তা খুঁজে বের করা (আপনার ক্ষেত্রে এটি কিছুটা ত্রুটির কারণেও হতে পারে)।

ইডিএ কৌশলগুলি সিদ্ধান্ত গ্রহণের সরঞ্জাম হিসাবে পরিবেশন করার উদ্দেশ্যে নয়। প্রকৃতপক্ষে, আমি বলব এমনকি অনুমানমূলক পরিসংখ্যান কেবলমাত্র অনুসন্ধানের জন্য বোঝানো হয়। আপনার পরিসংখ্যানগত বিশ্লেষণটি কোন দিকে এগিয়ে যেতে হবে সে সম্পর্কে তারা আপনাকে নির্দেশ দেয়। উদাহরণস্বরূপ, কোনও নমুনার উপর একটি টি-পরীক্ষা আপনাকে কেবল একটি আস্থা স্তর দেয় যে নমুনা জনসংখ্যার অন্তর্ভুক্ত হতে পারে (বা নাও থাকতে পারে), আপনি এখনও সেই তথ্য অন্তর্নিহিতের ভিত্তিতে আরও এগিয়ে যেতে পারেন যা আপনার ডেটা বন্টন সম্পর্কিত এবং কোনটি এর প্যারামিটারগুলি ইত্যাদি। আসলে, যখন কেউ কেউ বলে যে এমনকি মেশিন লার্নিং লাইব্রেরির অংশ হিসাবে প্রয়োগ করা কৌশলগুলিও প্রকৃতির অন্বেষণে রয়েছে !!! আমি আশা করি তারা এই অর্থে এটি বোঝায় ...!

প্লট বা ভিজ্যুয়ালাইজেশন কৌশলের ভিত্তিতে পরিসংখ্যানগত সিদ্ধান্তের সমাপ্তি পরিসংখ্যান বিজ্ঞানে অগ্রগতির উপহাস করা হচ্ছে। আপনি যদি আমাকে জিজ্ঞাসা করেন তবে আপনার পরিমাণগত পরিসংখ্যানগত বিশ্লেষণের ভিত্তিতে চূড়ান্ত সিদ্ধান্তে যোগাযোগের জন্য এই প্লটগুলি আপনার সরঞ্জাম হিসাবে ব্যবহার করা উচিত।


এটি আমাকে এমন কিছু করতে নিষেধ করে যা আমি প্রায়শই করি এবং বোধগম্য হিসাবে বিবেচনা করি, কোনও অনুসন্ধানের প্লট দেওয়া সিদ্ধান্ত গ্রহণ করুন এবং আরও আনুষ্ঠানিক তাত্পর্য পরীক্ষার আগে থামিয়ে দিন। কোন বিদ্রূপ করা হয় না। এটি একটি পুনরাবৃত্তিমূলক এবং কৌতূহলোদ্দীপক মন্তব্য যা বিদ্যমান চমত্কার, এবং আরও অনেক সংখ্যক উত্তরগুলির জন্য দরকারী কিছু যুক্ত করে না। কিউকিউ প্লটগুলির তুলনা করা খুব সহজ ...
নিক কক্স

আমি অন্য উত্তরগুলি পড়িনি তবে তারা যদি পরিমাণগত পদ্ধতিগুলিকেও উত্সাহ দেয় তবে আমি ভাল আছি। জিজ্ঞাসিত প্রশ্নের জন্য, আমি আমার উত্তর দিয়েছিলাম। তবে, আমি কৌতূহলী, এখন আর এর মতো উপলভ্য প্যাকেজগুলির সাথে ফর্মাল কোয়ান্ট পরীক্ষা করতে (কেএস পরীক্ষা করতে আরও কয়েক মিনিট সময় নিতে) বেশি সময় লাগে না, তবে কেন কেউ ইডিএ প্লটগুলিতে থামবে? বুটস্ট্র্যাপিংয়ের মাধ্যমে আর এর কেএস পরীক্ষার ফলাফলগুলি যাচাই করার পরে, আমি বেশ কয়েকটি স্থানে লক্ষ্য করেছি যেখানে এটি ব্যবহার করা ভাল নয় বলে উল্লেখ করা হয়েছিল। .. এটি কি traditionalতিহ্যবাহী স্ট্যাটাস পদ্ধতি সম্পর্কে সাধারণ সন্দেহের কারণে? এটি আমার
দৃ

পোস্ট করার আগে আপনার অবশ্যই অন্য উত্তরগুলি পড়া উচিত। পোস্টিং এর নিহিততাটি হ'ল আপনার বলার মতো আলাদা কিছু রয়েছে (পাশাপাশি প্রতিরক্ষামূলক)। আপনার মন্তব্য কিউকিউ প্লটগুলি "পরিমাণগত পদ্ধতি" নয় এমন ইঙ্গিত দিয়ে আশ্চর্য হয়ে উঠছে। একটি কিউকিউ প্লট বিতরণ ফিটকে মূল্যায়নের ক্ষেত্রে প্রমিত সমস্ত পরিমাণগত তথ্য নীতিগতভাবে দেখায়। বিপরীতে কোলমোগোরভ-স্মারনভের মতো একটি পরীক্ষা এক-মাত্রিক হ্রাস দেয় এবং এরপরে কী করা যায় সে সম্পর্কে সামান্য সহায়তা দেয়।
নিক কক্স

কিউকিউ প্লট প্রদত্ত পরীক্ষার ডেটার সাথে তাত্ত্বিক বিতরণের তুলনা করে এবং একটি চাক্ষুষ প্রতিনিধিত্ব সরবরাহ করে তবে কেএস পরীক্ষা স্ট্যাটিস্টিকাল ধারণাগুলি ব্যবহার করে আরও কঠোর উপায়ে একই কাজ করে এবং শেষ পর্যন্ত সম্ভাবনার মান দেয়। আপনি দুটি কিউকিউ প্লটের তুলনা করতে পারবেন না তবে আপনি যখন কেএস পরীক্ষা ব্যবহার করবেন তখন আপনি একটি পরিমাণগত পার্থক্য পাবেন। এটি মিসনোমার যে কেএস পরীক্ষার পি-ভ্যালুটি ভুল। এটি এও ভুল যে পরীক্ষামূলক ডেটা সেট বিতরণ পরামিতিগুলি নিষ্কাশন করতে ব্যবহার করা যায় না। আমি ব্যক্তিগতভাবে বুটস্ট্র্যাপিং করেছি এবং উভয় টেবিল এবং ম্যানুয়ালি গণনা করা কলমোগ্রভ বিতরণ দিয়ে পি মানগুলি যাচাই করেছি।
মুরুগেসন নারায়ণস্বামী

আপনার মন্তব্যে অনেক ছায়া বক্সিং রয়েছে, কে যুক্তি দিচ্ছে যেখানে আপনি প্যারামিটারের অনুমানের জন্য এমিরিকাল ডেটা ব্যবহার করতে পারবেন না? আমাদের সবার একমত হওয়া উচিত এখানেই করা হচ্ছে। কোনও আলোচনা অনুসরণ না করার জন্য আপনাকে আমাকে ক্ষমা করতে হবে। আমি আপনার জবাব আমার প্রতিক্রিয়া দ্বারা দাঁড়িয়ে।
নিক কক্স
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.