ডেটা সূচকীয় বা সাধারণ বিতরণ অনুসরণ করে কিনা তা দেখতে স্ট্যান্ডার্ড স্ট্যাটিস্টিকাল টেস্টগুলি কী কী?
ডেটা সূচকীয় বা সাধারণ বিতরণ অনুসরণ করে কিনা তা দেখতে স্ট্যান্ডার্ড স্ট্যাটিস্টিকাল টেস্টগুলি কী কী?
উত্তর:
দেখে মনে হচ্ছে আপনি সাধারণ বা ঘনিষ্ঠ বিতরণ ব্যবহার করে আপনার ডেটা মডেল করবেন কিনা তা সিদ্ধান্ত নেওয়ার চেষ্টা করছেন। এটি আমার কাছে কিছুটা অদ্ভুত বলে মনে হচ্ছে, কারণ এই বিতরণগুলি একে অপরের থেকে খুব আলাদা।
সাধারণ বিতরণটি প্রতিসম হয় যেখানে ঘৃণ্য বিতরণটি ভারীভাবে ডান দিকে আঁকা থাকে, কোনও নেতিবাচক মান নেই। সাধারণত সূচকীয় বণ্টনের থেকে একটি নমুনা অপেক্ষাকৃত পাসে অনেক পর্যবেক্ষণ উপস্থিত থাকবে এবং কয়েক obervations থেকে ডানদিকে পর্যন্ত পথভ্রষ্ট । এই পার্থক্যটি গ্রাফিকভাবে দেখতে প্রায়শই সহজ।
এখানে একটি উদাহরণ যেখানে আমি কৃত্রিম করেছি গড় সঙ্গে একটি স্বাভাবিক বন্টন থেকে পর্যবেক্ষণ এবং ভ্যারিয়েন্স এবং গড় সঙ্গে একটি সূচকীয় বণ্টনের এবং ভ্যারিয়েন্স :
উপরের চিত্রটিতে চিত্রিত হিসাবে হিস্টোগ্রাম, বক্সপ্লটস এবং স্ক্রেটারপ্লটগুলি ব্যবহার করে সাধারণ বিতরণের প্রতিসাম্যতা এবং ঘনিষ্ঠতার ঘনত্বকে দেখা যায়
আর একটি খুব দরকারী সরঞ্জাম একটি QQ- প্লট । নীচের উদাহরণে, নমুনাটি যদি সাধারণ বিতরণ থেকে আসে তবে পয়েন্টগুলি প্রায় লাইনটি অনুসরণ করা উচিত। আপনি দেখতে পাচ্ছেন যে এটি সাধারণ ডেটার ক্ষেত্রে, তবে তাত্পর্যপূর্ণ ডেটা নয়।
যদি কোনও কারণে গ্রাফিকাল পরীক্ষা আপনার পক্ষে পর্যাপ্ত না হয় তবে আপনি বিতরণটি স্বাভাবিক বা ঘৃণ্য কিনা তা নির্ধারণের জন্য আপনি এখনও পরীক্ষা ব্যবহার করতে পারেন। যেহেতু সাধারণ বিতরণ একটি স্কেল এবং অবস্থানের পরিবার, আপনি স্কেল এবং অবস্থানের পরিবর্তনের অধীনে অবিচ্ছিন্ন একটি পরীক্ষা ব্যবহার করতে চান (যেমন আপনি যদি পরিমাপটি ইঞ্চি থেকে সেন্টিমিটারে পরিবর্তন করেন বা যোগ করেন তবে পরীক্ষার ফলাফল পরিবর্তন করা উচিত নয়) আপনার সমস্ত পর্যবেক্ষণ )।
নাল অনুমানটি যখন বিতরণটি স্বাভাবিক হয় এবং বিকল্প অনুমানটি হ'ল এটি সূচকীয় হয়, সর্বাধিক শক্তিশালী অবস্থান এবং স্কেল ইনগ্রেন্ট পরীক্ষাটি স্ট্যাটিস্টিক যেখানে নমুনা গড় করা হয়, নমুনা ক্ষুদ্রতম পর্যবেক্ষণ এবং নমুনা স্ট্যানডার্ড ডেভিয়েশন হয়। too খুব বড় হলে পক্ষে প্রত্যাখ্যান করা হয় ।
এই পরীক্ষাটি প্রকৃতপক্ষে বিদেশীদের জন্য গ্রুবসের পরীক্ষার একতরফা সংস্করণ । আপনি এটি বেশিরভাগ পরিসংখ্যান সংক্রান্ত সফ্টওয়্যারটিতে প্রয়োগ করা দেখতে পাবেন (তবে নিশ্চিত করুন যে আপনি সঠিক সংস্করণটি ব্যবহার করেছেন - বহিরাগত পরীক্ষার জন্য বেশ কয়েকটি বিকল্প পরীক্ষার পরিসংখ্যান ব্যবহার করা হয়েছে!)।
for এর সর্বাধিক শক্তিশালী পরীক্ষা হ'ল রেফারেন্স : এইচ সি থোড দ্বারা সাধারনতার জন্য টেস্টিংয়ের বিভাগ 4.2.4 ।
ইঞ্জিনিয়ারিং ডিজাইনে কেসি কাপুর এবং এলআর ল্যাম্বারসন নির্ভরযোগ্যতা দেখুন । উইলে 1977।
স্বাভাবিকতার জন্য অ্যান্ডারসন-ডার্লিং এবং শাপিরো-উইলককে সেরা বিবেচনা করা হয়। ঘনিষ্ঠ Lillerfors পরীক্ষা জন্য এটি বিশেষভাবে ডিজাইন করা হয়েছে।
আপনি কীভাবে ডেটা ব্যবহার করে তা গ্রাফিকাল পদ্ধতিগুলি বিবেচনা করেছেন?
সম্ভাব্যতা গ্রাফ কৌশলগুলিতে সাধারণত ডেটা র্যাঙ্কিং করা হয়, বিপরীত সিডিএফ প্রয়োগ করা হয় এবং তারপরে কার্টেসিয়ান বিমানটিতে ফলাফলের পরিকল্পনা করা হয়। এটি আপনাকে দেখতে দেয় যে বেশ কয়েকটি মান অনুমান করা বিতরণ থেকে বিচ্যুত হয় এবং সম্ভবত বিচরণের কারণ হিসাবে অ্যাকাউন্ট হয়।