আমি 'ক্ষতিকারক' বিশেষত উচ্চ স্কু বলব না। উদাহরণস্বরূপ এটির লগটি বাম-স্কিউ স্পষ্টভাবে রয়েছে এবং এর মুহুর্তের স্কিউনেস মাত্র 2।
1) ক্ষুদ্রতর ডেটা এবং 500 এর নিকট এন সাথে টি-পরীক্ষা ব্যবহার করা ভাল :
ক) পরীক্ষার পরিসংখ্যানগুলির অঙ্কটি সূক্ষ্ম হওয়া উচিত: যদি ডেটাগুলি সাধারণ স্কেল (এবং এর চেয়ে যথেষ্ট ভারী-লেজযুক্ত নয়) দিয়ে স্বতঃস্ফূর্ত হয় তবে তাদের গড় পর্যবেক্ষণের সংখ্যার সমান আকারের প্যারামিটার দিয়ে গামা-বিতরণ করা হয়। প্রায় 40 বা তার বেশি আকারের আকারের প্যারামিটারের জন্য এর বিতরণটি খুব স্বাভাবিক দেখাচ্ছে (আপনার যথার্থতার জন্য লেজটির মধ্যে কতটা দূরে রয়েছে তার উপর নির্ভর করে)।
এটি গাণিতিক প্রমাণের পক্ষে সক্ষম তবে গণিত বিজ্ঞান নয়। আপনি অবশ্যই অনুকরণের মাধ্যমে অনুকরণীয়ভাবে এটি পরীক্ষা করতে পারেন, অবশ্যই, তবে আপনি ঘনিষ্ঠতা সম্পর্কে ভুল হলে আপনার আরও বড় নমুনার প্রয়োজন হতে পারে। ক্ষতিকারক ডেটাগুলির নমুনার অঙ্কগুলি (এবং তাই, নমুনার অর্থ) এর বিতরণটি যখন এন = 40:
খুব সামান্য স্কিউ। নমুনা আকারের বর্গমূল হিসাবে এই স্কিউনেস হ্রাস পায়। সুতরাং এন = 160 এ, এটি স্কু হিসাবে অর্ধেক এন = 640 এ এটি স্কিউ হিসাবে এক চতুর্থাংশ:
এটি কার্যকরভাবে প্রতিসাম্যপূর্ণ তা গড়ের দিকে ঝাপটানো এবং এটি শীর্ষে প্লট করে দেখা যায়:
নীল মূল, লাল উল্টানো হয়। আপনি দেখতে যেমন এগুলি প্রায় কাকতালীয়।
-
n = 40
n = 500
-
গ) আসলে যা গুরুত্বপূর্ণ তা হ'ল শূন্যের নীচে সম্পূর্ণ পরিসংখ্যান বিতরণ। সংখ্যার স্বাভাবিকতা টি-স্ট্যাটিস্টিককে টি-বিতরণ করতে যথেষ্ট নয়। তবে তাত্পর্যপূর্ণ-ডেটা ক্ষেত্রে, এটিও খুব একটা সমস্যা নয়:
n = 40n = 500n = 500
তবে নোট করুন, তবে বাস্তবে ক্ষতিকারক ডেটার জন্য, স্ট্যান্ডার্ড বিচ্যুতি কেবল তখন ভিন্ন হবে যদি উপায়গুলি আলাদা হয়। যদি সূচকীয় অনুমানের ঘটনাটি হয় তবে নালীর নীচে, বিভিন্ন জনসংখ্যার বৈচিত্রগুলি সম্পর্কে চিন্তা করার কোনও বিশেষ দরকার নেই, কারণ সেগুলি কেবল বিকল্পের অধীনে ঘটে। সুতরাং একটি সমতুল্য টি-টেস্টটি এখনও ঠিক থাকা উচিত (এক্ষেত্রে আপনি হিস্টগ্রামে উপরের ভাল অনুমানটি দেখতে কিছুটা ভালও হতে পারেন)।
2) লগগুলি গ্রহণ করা আপনাকে এখনও এটি উপলব্ধি করার অনুমতি দিতে পারে
লগλ1≠ লগλ2λ1≠ λ2
[আপনি যদি লগগুলিতে এই পরীক্ষাটি করেন তবে আমি সেই ক্ষেত্রে একটি সমতুল্য পরীক্ষা করার পরামর্শ দিতে চাইব]]
সুতরাং - সংযোগকে ন্যায্যতা প্রমাণের জন্য কেবল একটি বাক্য বা দু'জনের নিছক হস্তক্ষেপের সাথে, আমার উপরে যেমন রয়েছে - আপনার অংশগ্রহণের মেট্রিকের লগ সম্পর্কে নয়, অংশগ্রহন মেট্রিক সম্পর্কেই আপনার সিদ্ধান্তগুলি লিখতে সক্ষম হওয়া উচিত।
3) আপনি করতে পারেন প্রচুর পরিমাণে আছে!
ক) আপনি ক্ষতিকারক ডেটা জন্য উপযুক্ত একটি পরীক্ষা করতে পারেন। সম্ভাবনা অনুপাত ভিত্তিক পরীক্ষা নেওয়া সহজ। যেমনটি ঘটে, তাত্পর্যপূর্ণ ডেটার জন্য আপনি একটি লেজযুক্ত ক্ষেত্রে এই পরিস্থিতির জন্য একটি ছোট-নমুনা এফ-পরীক্ষা (উপায়ের অনুপাতের ভিত্তিতে) পান; দুটি লেজযুক্ত LRT সাধারণত ছোট আকারের নমুনার আকারের জন্য প্রতিটি লেজের সমান অনুপাত রাখে না। (এটি টি-টেস্টের চেয়ে ভাল শক্তি থাকা উচিত, তবে টি-পরীক্ষার শক্তিটি বেশ যুক্তিসঙ্গত হওয়া উচিত এবং আমি আশা করব যে আপনার নমুনা আকারে খুব বেশি পার্থক্য না ঘটে))
খ) আপনি একটি ক্রম-পরীক্ষা করতে পারেন - এমনকি যদি এটি চান তবে এটি টি-টেস্টের ভিত্তিতেও করুন। সুতরাং পরিবর্তন যে একমাত্র জিনিস হ'ল পি-মান গণনা। অথবা আপনি বুটস্ট্র্যাপ-ভিত্তিক পরীক্ষার মতো আরও কিছু পুনরায় মডেলিং পরীক্ষা করতে পারেন। এটিতে ভাল শক্তি থাকা উচিত, যদিও এটি আপনার বিতরণের তুলনায় আপনি কোন পরীক্ষার পরিসংখ্যান পছন্দ করেন তার উপর আংশিকভাবে নির্ভর করবে।
গ) আপনি র্যাঙ্ক ভিত্তিক ননপ্যারামেট্রিক পরীক্ষা (যেমন উইলকক্সন-মান-হুইটনি) করতে পারেন। যদি আপনি ধরে নেন যে যদি বিতরণগুলি পৃথক হয়, তবে সেগুলি কেবলমাত্র স্কেল ফ্যাক্টর দ্বারা পৃথক হয় (এক্সপোনেনশিয়াল সহ বিভিন্ন স্কিউ বিতরণের জন্য উপযুক্ত) তবে আপনি এমনকি স্কেল পরামিতিগুলির অনুপাতের জন্য একটি আত্মবিশ্বাসের ব্যবধানও পেতে পারেন।
[এই উদ্দেশ্যে, আমি লগ-স্কেলে কাজ করার পরামর্শ দেব (লগগুলিতে লোকেশন শিফট স্কেল শিফটের লগ হ'ল)। এটি পি-মান পরিবর্তন করবে না, তবে এটি আপনাকে স্কেল শিফ্টের জন্য একটি বিরতি পেতে পয়েন্টের প্রাক্কলনটি এবং সিআইয়ের সীমাবদ্ধতা আরও বাড়িয়ে তুলবে]]
এটিরও খুব ভাল শক্তি থাকতে হবে যদি আপনি ক্ষতিকারক পরিস্থিতিতে থাকেন তবে সম্ভবত টি-টেস্ট ব্যবহারের মতো ভাল নয়।
একটি রেফারেন্স যা লোকেশন শিফট বিকল্পের ক্ষেত্রে উদাহরণগুলির জন্য যথেষ্ট বিস্তৃত সেট বিবেচনা করে (উদাহরণস্বরূপ নূরের নীচে ভেরিয়েন্স এবং স্কিউনেস বিজাতীয়ত্ব উভয় সহ)
ফাগারল্যান্ড, এমডাব্লু এবং এল স্যান্ডভিক (২০০৯),
"অসম বৈকল্পিকের সাথে স্কিউ বিতরণের জন্য পাঁচটি দ্বি-নমুনা অবস্থানের পরীক্ষার পারফরম্যান্স,"
সমকালীন ক্লিনিকাল ট্রায়ালস , 30 , 490-496
এটি সাধারণত ওয়েলচ ইউ-টেস্টের প্রস্তাব দেয় (ওয়েলচ বিবেচিত বেশ কয়েকটি পরীক্ষার মধ্যে একটি বিশেষ এবং কেবলমাত্র তারা পরীক্ষা করেছিল) recommend আপনি যদি ঠিক একই ওয়েলচের পরিসংখ্যান ব্যবহার না করেন তবে প্রস্তাবনাগুলি কিছুটা ভিন্ন হতে পারে (যদিও সম্ভবত এটি খুব বেশি নয়)। [দ্রষ্টব্য যে যদি আপনার বিতরণগুলি ক্ষতিকারক হয় তবে আপনি লগ না নেওয়া যদি আপনি স্কেল বিকল্পে আগ্রহী হন ... তবে আপনার ক্ষেত্রে অসম বৈকল্পিকতা থাকবে না]]