ডেটা সূচকীয় বা সাধারণ বিতরণ অনুসরণ করে কিনা তা দেখতে স্ট্যান্ডার্ড স্ট্যাটিস্টিকাল টেস্টগুলি কী কী?


12

ডেটা সূচকীয় বা সাধারণ বিতরণ অনুসরণ করে কিনা তা দেখতে স্ট্যান্ডার্ড স্ট্যাটিস্টিকাল টেস্টগুলি কী কী?


2
সেরা পরীক্ষা সম্ভবত নির্ভর করে আপনি স্বাভাবিকতা / ঘাতক হিসাবে পরীক্ষা করছেন কেন (তাই কিছু পটভূমি সহায়ক হবে) তার উপর নির্ভর করে তবে প্রদত্ত ডেটা সেটটি কোনও পূর্বনির্ধারিত বিতরণে ফিট করে কিনা তা পরীক্ষা করার জন্য আপনি সর্বদা কোলমোগোরভ স্মারনভ পরীক্ষাটি ব্যবহার করতে পারেন ( এন। উইকিপিডিয়া .org / উইকি / কলমোগোরভ% ই 2% 80% 93 স্মারনভ_তম )। সাধারণত সাধারণ বিতরণের জন্য প্রচুর পদ্ধতি ব্যবহার করা হয়: en.wikedia.org/wiki/Normality_test
ম্যাক্রো

আমি যে ভেরিয়েবলগুলির সাথে ডিল করছি তা স্বাভাবিক বা ঘৃণ্য বিতরণ অনুসরণ করতে পারে। এছাড়াও, আমার একটি কারণ রয়েছে যা আমি যত্ন করি না। তবে এটি আমার ডেটাতে কিছু পরিবর্তনশীলতা আরোপ করে। সুতরাং, আমি এই উপদ্রব ফ্যাক্টরের প্রভাবকে দমন করতে পরিবর্তনগুলি স্বাভাবিক করতে চাই ize সুতরাং, আমি ভেবেছিলাম প্রতিটি ভেরিয়েবলকে তাদের অন্তর্নিহিত বিতরণের ভিত্তিতে স্বাভাবিক করা ভাল। এই কারণেই এই দুটি বিতরণের মধ্যে সিদ্ধান্ত নেওয়ার জন্য আমার একটি পরীক্ষা দরকার।
Smo

1
এই বাক্যটির সাধারণকরণটির অর্থ কী: আমি ভেবেছিলাম প্রতিটি ভেরিয়েবলের অন্তর্নিহিত বিতরণের ভিত্তিতে এটি স্বাভাবিক করা ভাল ?
ম্যাক্রো

2
পরীক্ষা না হয়েও কিউকিউ প্লটগুলি আপনার ডেটা বন্টনের সাথে মেলে কিনা তাড়াতাড়ি স্বজ্ঞাত পরিদর্শন করার জন্য দুর্দান্ত।
nnot101

উত্তর:


13

দেখে মনে হচ্ছে আপনি সাধারণ বা ঘনিষ্ঠ বিতরণ ব্যবহার করে আপনার ডেটা মডেল করবেন কিনা তা সিদ্ধান্ত নেওয়ার চেষ্টা করছেন। এটি আমার কাছে কিছুটা অদ্ভুত বলে মনে হচ্ছে, কারণ এই বিতরণগুলি একে অপরের থেকে খুব আলাদা।

সাধারণ বিতরণটি প্রতিসম হয় যেখানে ঘৃণ্য বিতরণটি ভারীভাবে ডান দিকে আঁকা থাকে, কোনও নেতিবাচক মান নেই। সাধারণত সূচকীয় বণ্টনের থেকে একটি নমুনা অপেক্ষাকৃত পাসে অনেক পর্যবেক্ষণ উপস্থিত থাকবে এবং কয়েক obervations থেকে ডানদিকে পর্যন্ত পথভ্রষ্ট । এই পার্থক্যটি গ্রাফিকভাবে দেখতে প্রায়শই সহজ।00

এখানে একটি উদাহরণ যেখানে আমি কৃত্রিম করেছি গড় সঙ্গে একটি স্বাভাবিক বন্টন থেকে পর্যবেক্ষণ এবং ভ্যারিয়েন্স এবং গড় সঙ্গে একটি সূচকীয় বণ্টনের এবং ভ্যারিয়েন্স :এন=1002424

সাধারণ বনাম সূচকীয়: সিমুলেটেড ডেটা

উপরের চিত্রটিতে চিত্রিত হিসাবে হিস্টোগ্রাম, বক্সপ্লটস এবং স্ক্রেটারপ্লটগুলি ব্যবহার করে সাধারণ বিতরণের প্রতিসাম্যতা এবং ঘনিষ্ঠতার ঘনত্বকে দেখা যায়

আর একটি খুব দরকারী সরঞ্জাম একটি QQ- প্লট । নীচের উদাহরণে, নমুনাটি যদি সাধারণ বিতরণ থেকে আসে তবে পয়েন্টগুলি প্রায় লাইনটি অনুসরণ করা উচিত। আপনি দেখতে পাচ্ছেন যে এটি সাধারণ ডেটার ক্ষেত্রে, তবে তাত্পর্যপূর্ণ ডেটা নয়।

সিমুলেটেড ডেটার জন্য কিউকিউ-প্লট

যদি কোনও কারণে গ্রাফিকাল পরীক্ষা আপনার পক্ষে পর্যাপ্ত না হয় তবে আপনি বিতরণটি স্বাভাবিক বা ঘৃণ্য কিনা তা নির্ধারণের জন্য আপনি এখনও পরীক্ষা ব্যবহার করতে পারেন। যেহেতু সাধারণ বিতরণ একটি স্কেল এবং অবস্থানের পরিবার, আপনি স্কেল এবং অবস্থানের পরিবর্তনের অধীনে অবিচ্ছিন্ন একটি পরীক্ষা ব্যবহার করতে চান (যেমন আপনি যদি পরিমাপটি ইঞ্চি থেকে সেন্টিমিটারে পরিবর্তন করেন বা যোগ করেন তবে পরীক্ষার ফলাফল পরিবর্তন করা উচিত নয়) আপনার সমস্ত পর্যবেক্ষণ )।+ +1

নাল অনুমানটি যখন বিতরণটি স্বাভাবিক হয় এবং বিকল্প অনুমানটি হ'ল এটি সূচকীয় হয়, সর্বাধিক শক্তিশালী অবস্থান এবং স্কেল ইনগ্রেন্ট পরীক্ষাটি স্ট্যাটিস্টিক যেখানে নমুনা গড় করা হয়, নমুনা ক্ষুদ্রতম পর্যবেক্ষণ এবং নমুনা স্ট্যানডার্ড ডেভিয়েশন হয়। too খুব বড় হলে পক্ষে প্রত্যাখ্যান করা হয় ।

টি,এন=এক্স¯-এক্স(1)গুলি
এক্স¯এক্স(1)গুলিটি,এন

এই পরীক্ষাটি প্রকৃতপক্ষে বিদেশীদের জন্য গ্রুবসের পরীক্ষার একতরফা সংস্করণ । আপনি এটি বেশিরভাগ পরিসংখ্যান সংক্রান্ত সফ্টওয়্যারটিতে প্রয়োগ করা দেখতে পাবেন (তবে নিশ্চিত করুন যে আপনি সঠিক সংস্করণটি ব্যবহার করেছেন - বহিরাগত পরীক্ষার জন্য বেশ কয়েকটি বিকল্প পরীক্ষার পরিসংখ্যান ব্যবহার করা হয়েছে!)।

for এর সর্বাধিক শক্তিশালী পরীক্ষা হ'ল রেফারেন্স :টি,এন এইচ সি থোড দ্বারা সাধারনতার জন্য টেস্টিংয়ের বিভাগ 4.2.4 ।


ওপিতে জিজ্ঞাসা করা হয়েছিল যে আপনি যদি স্বাভাবিকতার জন্য পরীক্ষা করেন তবে আপনি কোন পরীক্ষাটি কোন পরীক্ষামূলক ব্যবহারের জন্য ক্ষতিকারক হয়ে পরীক্ষা করেন আপনি কোন পৃথক পরিস্থিতিতে অ্যাডন বেছে নেবেন। আমি ইনোট স্টেটমেন্টটি পড়িনি যে তিনি একই ডেটা সেটটিতে উভয় পরীক্ষার চেষ্টা করার পরামর্শ দিচ্ছিলেন।
মাইকেল আর চেরনিক

আমি সেভাবে এটি ব্যাখ্যা করেছি, যেহেতু প্রশ্নটির ফলো-আপ মন্তব্যে, ওপি লিখেছেন "আমি যে চলকগুলি নিয়ে কাজ করছি তা সম্ভবত স্বাভাবিক বা ঘৃণ্য বিতরণগুলি অনুসরণ করতে পারে [[...] সে কারণেই আমার একটি পরীক্ষা দরকার এই দুটি বিতরণের মধ্যে সিদ্ধান্ত নিন। "
MånsT

আমি তা খেয়াল করিনি। সেক্ষেত্রে আপনার উত্তরটি খুব উপযুক্ত। আমি উত্তর দিচ্ছিলাম যেন সে একবারে একজনের জন্য পরীক্ষা করছে।
মাইকেল আর চেরনিক

@ মিশেল: আমি যখন মূল প্রশ্নটি পড়ি তখন আমি সেভাবে এটি ব্যাখ্যা করেছিলাম, তবে মন্তব্যটি পড়ে আমার উত্তর লেখার সিদ্ধান্ত নিয়েছিলাম। অন্যথায়, আমি মনে করি না যে আপনার (+1) উত্তরে (সেখানে একটি মন্তব্যে করা ছোট মন্তব্য ছাড়া অন্য) যোগ করার মতো অনেক কিছুই থাকবে।
MånsT

5

বিএনওয়াই¯লগওয়াই¯ওয়াইআমি

বিএন=এন×{লগওয়াই¯-লগওয়াই¯}এন=2এন×{1+ +(এন+ +1)/(6এন)}-1
বিএন~χ2(এন-1)

ইঞ্জিনিয়ারিং ডিজাইনে কেসি কাপুর এবং এলআর ল্যাম্বারসন নির্ভরযোগ্যতা দেখুন । উইলে 1977।


2
তাত্পর্যতা পরীক্ষার জন্য আমি আরও কিছু সাম্প্রতিক এবং বিস্তৃত রিসোর্সগুলি পেয়েছি। 1) একটি নিবন্ধ: একটি হেনজে, এন এবং মিন্টানিস, এসজি (2005): 'ক্ষতিকারকতার জন্য সাম্প্রতিক এবং শাস্ত্রীয় পরীক্ষা: তুলনা সহ একটি আংশিক পর্যালোচনা'। মেট্রিকা, খণ্ড 61, পিপি 29-45। 2) উল্লিখিত নিবন্ধের পরীক্ষাগুলি বাস্তবায়নের জন্য 'এক্সপ্রেস্ট' নামে একটি সিআরএন আর প্যাকেজ।
ইয়ভেস

বি_এন বিতরণ খুব পরিষ্কার নয়। এটি কি এন -1 ডিএফ সহ চি স্কোয়ার, বা এন -1 ডিএফ দিয়ে চি স্কোয়ারটি এন -1 দ্বারা গুণিত?
ডোভিনী জয়সিংহে

লিখিত হিসাবে কাজ করে। আপনি আর কোডের কয়েকটি লাইন ব্যবহার করে এটি পরীক্ষা করতে পারেন।
ইয়ভেস

ধন্যবাদ। সুতরাং আমি দেখতে পেলাম এটির গুণক হওয়া উচিত। অর্থে, স্বাধীনতার ডিগ্রিগুলি এন -1 হওয়া উচিত?
দোভিনি জয়সিংহে

বিএনএন-1

4

স্বাভাবিকতার জন্য অ্যান্ডারসন-ডার্লিং এবং শাপিরো-উইলককে সেরা বিবেচনা করা হয়। ঘনিষ্ঠ Lillerfors পরীক্ষা জন্য এটি বিশেষভাবে ডিজাইন করা হয়েছে।


5
প্রতিটি পরীক্ষাকে অন্যের চেয়ে কেন ভাল / ভাল বলে বিবেচনা করা হয় সে সম্পর্কে কিছুটা বিশদ সহ এই উত্তরটির উন্নতি করা যেতে পারে।
nnot101

এই পরীক্ষাগুলি সেই অর্থে আরও ভাল যা সাধারণ (অ্যান্ডারসন-ডার্লিং) এবং এক্সফোনেনশিয়াল (লিলিফোর্স) থেকে ছেড়ে যাওয়ার পক্ষে সবচেয়ে শক্তিশালী। আমি মনে করি না যে তিনি পরীক্ষার ফর্মটির উপর ভিত্তি করে এটির কোনও ব্যাখ্যা দেওয়ার পক্ষে এটি সহজ।
মাইকেল আর চেরনিক

3
@ মিশেল: স্বাভাবিকতার জন্য অ্যান্ডারসন-ডার্লিং পরীক্ষার (শাপিরো-উইল্ক ডিটোর মতো) বিভিন্ন বিকল্পের বিপরীতে সম্মানজনক শক্তি রয়েছে, তবে এটি অবশ্যই সবচেয়ে শক্তিশালী নয় (সাধারণভাবে বা গড়পড়তাও নয়)। পরীক্ষার পছন্দটি হাতের বিকল্পের উপর নির্ভর করে। আমি লিলারফর্স পরীক্ষাটি কখনও শুনিনি - আপনি কি লিলিফর্স পরীক্ষাটি বোঝাতে চেয়েছিলেন (যা আসলে স্বাভাবিকের জন্য পরীক্ষা এবং এক্সফেনশিয়ালিটির জন্য পরীক্ষা নয়)?
MånsT

অবশ্যই আমি এক্সফেনশিয়ালিটির জন্য লিলফার্স পরীক্ষার কথা উল্লেখ করছিলাম কারণ এটি হ'ল তাত্পর্যপূর্ণ বিতরণ অনুমানের জন্য আমি প্রস্তাব দিচ্ছিলাম। আমি শাপিরো-উইলক অ্যাডন অ্যান্ডারসন-ডার্লিংকে তালিকাভুক্ত করেছি কারণ আমার জ্ঞানের সেরা দিক থেকে তারা স্বাভাবিকতার জন্য পরীক্ষাগুলির মধ্যে সবচেয়ে শক্তিশালী। আপনি আরও শক্তিশালী পরীক্ষা যা উল্লেখ করছেন?
মাইকেল আর চেরনিক

1
এটি নির্ভর করে আপনার কী ধরণের বিকল্প রয়েছে। স্কিউ বিকল্পগুলির বিরুদ্ধে, উদাহরণস্বরূপ, নমুনা স্কিউনেস প্রায়শই এসডাব্লু এবং এডি এর চেয়ে বেশি শক্তিশালী। পরেরটি হ'ল সর্বজনীন পরীক্ষা যা গড়পড়তাভাবে বেশ ভাল, তবে আপনি কী ধরণের অ-স্বাভাবিকতা নিয়ে উদ্বিগ্ন তা জানেন তবে নির্দেশিত পরীক্ষাটি ব্যবহার করা আরও ভাল (যেমন নমুনা স্কিউনেস টেস্ট, যা স্কিউ বিকল্পগুলিতে নির্দেশিত হয়) ।
MånsT

4

আপনি কীভাবে ডেটা ব্যবহার করে তা গ্রাফিকাল পদ্ধতিগুলি বিবেচনা করেছেন?

সম্ভাব্যতা গ্রাফ কৌশলগুলিতে সাধারণত ডেটা র‍্যাঙ্কিং করা হয়, বিপরীত সিডিএফ প্রয়োগ করা হয় এবং তারপরে কার্টেসিয়ান বিমানটিতে ফলাফলের পরিকল্পনা করা হয়। এটি আপনাকে দেখতে দেয় যে বেশ কয়েকটি মান অনুমান করা বিতরণ থেকে বিচ্যুত হয় এবং সম্ভবত বিচরণের কারণ হিসাবে অ্যাকাউন্ট হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.