স্বাভাবিকতা জন্য আমার কী পরীক্ষা করা উচিত: কাঁচা ডেটা বা অবশিষ্টাংশ?


27

আমি শিখেছি যে স্বাভাবিকের জন্য আমার অবশ্যই কাঁচা ডেটা নয় বরং তাদের অবশিষ্টাংশের জন্য পরীক্ষা করতে হবে। আমার কি অবশিষ্টাংশ গণনা করা উচিত এবং তারপরে শাপিরো – উইলকের ডাব্লু পরীক্ষা করা উচিত?

অবশিষ্টাংশগুলি কি হিসাবে গণনা করা হয়: ?Ximean

আমার ডেটা এবং ডিজাইনের জন্য দয়া করে এই পূর্ববর্তী প্রশ্নটি দেখুন ।


আপনি কি এটি সফ্টওয়্যার ব্যবহার করে করছেন (এবং যদি তাই কোন সফ্টওয়্যার) বা আপনি হাতে হাতে গণনা করার চেষ্টা করছেন?
ক্রিস সিমোকট

@Chris Simokat: আমি R ও Statistica সঙ্গে এই কাজ করার চেষ্টা করছি ...
স্ট্যান

3
এই প্রশ্নটি আগ্রহী হতে পারে: কি-যদি-অবশিষ্টাংশগুলি-সাধারণত-বিতরণ-তবে-y-হয় না ; এটি কাঁচা ডেটা বা অবশিষ্টাংশের জন্য স্বাভাবিকতা প্রয়োজন কিনা এই বিষয়টিও কভার করে।
গুং - মনিকা পুনরায়

1
দুঃখিত, আমি বিভিন্ন পরিস্থিতিতে স্বয়ংক্রিয়ভাবে এটি কীভাবে এটি করতে পারি তা জানার জন্য আমি যথেষ্ট ডাব্লু / এসএএসকে বুঝতে পারি না। তবে, আপনি যখন কোনও রিগ্রেশন চালান, তখন আপনার অবশিষ্টাংশগুলিকে একটি আউটপুট ডেটাসেটে সংরক্ষণ করতে সক্ষম হওয়া উচিত এবং এরপরে একটি কিউকিউ প্লট তৈরি করা যায়।
গুং - মনিকা পুনরায়

1
কারেন গ্রেস-মার্টিন ভাল তথ্য: এই এবং এই
স্ট্যান

উত্তর:


37

কেন আপনি স্বাভাবিকতার জন্য পরীক্ষা করতে হবে?

লিনিয়ার রিগ্রেশন এর স্ট্যান্ডার্ড অনুমান হ'ল তাত্ত্বিক অবশিষ্টাংশগুলি স্বতন্ত্র এবং সাধারণত বিতরণ করা হয়। পর্যবেক্ষণকৃত অবশিষ্টাংশগুলি তাত্ত্বিক অবশিষ্টাংশগুলির একটি অনুমান, তবে স্বতন্ত্র নয় (কিছু অবশিষ্টাংশের উপর নির্ভরশীলতাগুলি সরিয়ে দেয়, তবে তারা সত্যিকারের অবশিষ্টাংশগুলির কেবলমাত্র একটি আনুমানিক মূল্য দেয়)। সুতরাং পর্যবেক্ষিত অবশিষ্টাংশগুলির উপর একটি পরীক্ষা গ্যারান্টি দেয় না যে তাত্ত্বিক অবশিষ্টাংশগুলি মেলে।

যদি তাত্ত্বিক অবশিষ্টগুলি যথাযথভাবে বিতরণ না করা হয় তবে নমুনার আকার যথেষ্ট পরিমাণে বড় হয় তবে কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি বলে যে স্বাভাবিকতা অনুমানের ভিত্তিতে স্বাভাবিক অনুমিতি (পরীক্ষাগুলি এবং আত্মবিশ্বাসের অন্তর, তবে প্রয়োজনীয়তার পূর্বে ভবিষ্যদ্বাণী অন্তর) এখনও প্রায় সঠিক হবে ।

এছাড়াও নোট করুন যে স্বাভাবিকতার পরীক্ষাগুলি পরীক্ষা বাতিল করে দেয়, তারা আপনাকে বলতে পারে যে কোনও সাধারণ বিতরণ থেকে ডেটা আসার সম্ভাবনা নেই। তবে যদি পরীক্ষাটি তাৎপর্যপূর্ণ না হয় তবে এর অর্থ এই নয় যে ডেটাটি একটি সাধারণ বিতরণ থেকে এসেছে তবে এর অর্থ এইও হতে পারে যে আপনার কাছে পার্থক্যটি দেখার যথেষ্ট ক্ষমতা নেই। বৃহত্তর নমুনার আকারগুলি অ-স্বাভাবিকতা সনাক্ত করতে আরও শক্তি দেয়, তবে বৃহত্তর নমুনাগুলি এবং সিএলটি এর অর্থ হ'ল অস্বাভাবিকতা কমপক্ষে গুরুত্বপূর্ণ। সুতরাং ছোট নমুনা আকারের জন্য স্বাভাবিকতার ধারণা অনুধাবন করা গুরুত্বপূর্ণ তবে পরীক্ষাগুলি অর্থহীন, কারণ বড় আকারের নমুনা মাপগুলির জন্য পরীক্ষাগুলি আরও সঠিক হতে পারে তবে সঠিক স্বাভাবিকতার প্রশ্নটি অর্থহীন হয়ে যায়।

সুতরাং উপরের সমস্তটি সমন্বিত করে, সঠিক স্বাভাবিকতার পরীক্ষার চেয়ে আরও গুরুত্বপূর্ণ বিষয়টি কি জনসংখ্যার স্বাভাবিকের চেয়ে যথেষ্ট পরিমাণে কাছাকাছি রয়েছে তা দেখার জন্য তথ্যগুলির পিছনে বিজ্ঞানের একটি বোঝা। কিউকিপ্লটসের মতো গ্রাফগুলি ভাল ডায়াগনস্টিক হতে পারে তবে বিজ্ঞানের পাশাপাশি বোঝারও প্রয়োজন। যদি উদ্বেগ থাকে যে বহিরাগতদের পক্ষে খুব বেশি স্কিউনেস বা সম্ভাবনা রয়েছে তবে নন-প্যারাম্যাট্রিক পদ্ধতিগুলি পাওয়া যায় যা স্বাভাবিকতা অনুমানের প্রয়োজন হয় না।


6
প্রথম লাইনে প্রশ্নের উত্তর দেওয়ার জন্য: আনোভাতে এফ-টেস্ট প্রয়োগ করার জন্য এবং বৈকল্পিকতার চারপাশে আত্মবিশ্বাসের সীমা তৈরি করার জন্য আনুমানিক স্বাভাবিকতা অত্যন্ত গুরুত্বপূর্ণ। (+1) ভাল ধারণা জন্য।
হোবার

4
@ হ্যাঁ, হ্যাঁ আনুমানিক স্বাভাবিকতা গুরুত্বপূর্ণ, তবে পরীক্ষাগুলি নির্ভুল স্বাভাবিকতা পরীক্ষা করে, আনুমানিক নয়। এবং বৃহত নমুনা আকারের জন্য যে আনুমানিক খুব কাছাকাছি থাকতে হবে না (যেখানে পরীক্ষাগুলি প্রত্যাখ্যান করার সম্ভাবনা সবচেয়ে বেশি)। আপনি যদি এফ-টেস্টগুলি (বা অন্যান্য সাধারণ ভিত্তিক অনুমান) ব্যবহার করে ন্যায়সঙ্গত হন তবে বিজ্ঞানের একটি ভাল প্লট এবং তথ্য যা তথ্য তৈরি করে তা স্বাভাবিকতার একটি আনুষ্ঠানিক পরীক্ষার চেয়ে অনেক বেশি কার্যকর।
গ্রেগ স্নো

গ্রেগ, ঠিক আছে আমি বিতরণ ফিটিং করি এবং দেখুন আমার ডেটা কোথা থেকে এসেছে, বলুন, বিটা বা গামা বিতরণ এবং তখন আমার কী করা উচিত? আনোভা যে গাউসিয়ান আইন অনুমান করে?
stan

2
(+1) শেষটি ব্যতীত এটি ভাল হয়েছে। আপনাকে (ক) একটি স্বাভাবিকতা অনুমান এবং (খ) ননপ্যারমেট্রিক পদ্ধতির উপর ভিত্তি করে (ক) রিগ্রেশন বাছাই করতে হবে না। রিগ্রেশন এবং / বা সাধারণীকরণীয় রৈখিক মডেলের আগে রূপান্তরগুলি কেবল দুটি প্রধান বিকল্প are আমি স্বীকার করেছি যে আপনি এখানে পরিসংখ্যানের মডেলিং সম্পর্কে সমস্ত সংক্ষিপ্ত করার চেষ্টা করছেন না, তবে শেষ অংশটি সামান্য প্রশস্ত করা যেতে পারে।
নিক কক্স

সুতরাং শেষে, লিনিয়ার প্রতিরোধের মধ্যে, আমাদের কাঁচা ডেটার স্বাভাবিকতা বা অবশিষ্টাংশের স্বাভাবিকতার জন্য পরীক্ষা করা উচিত?
vasili111

7

গাউসীয় অ্যাসুম্পশনগুলি মডেল থেকে প্রাপ্ত অবশিষ্টাংশগুলিকে উল্লেখ করে। মূল ডেটা সম্পর্কে কোনও অনুমানের প্রয়োজন নেই। দৈনিক বিয়ার বিক্রয় বিতরণের ক্ষেত্রে এখানে চিত্র বর্ণনা লিখুনএটির ক্ষেত্রে case সপ্তাহের মধ্যে একটি যুক্তিসঙ্গত মডেল গ্রহণের পরে, ছুটির দিন / ইভেন্টগুলির প্রভাবগুলি, স্তরের শিফ্টগুলি / সময় ট্রেন্ডগুলি আমরা পাইএখানে চিত্র বর্ণনা লিখুন


আপনার উত্তর দেওয়ার জন্য ধন্যবাদ. আপনি বলতে চান যে আমরা আমাদের ডেটাগুলি গাউসির বিতরণে রূপান্তর করতে পারি ...?
stan

3
স্ট্যান, মডেলিংয়ের ভূমিকাটি হ'ল তাই করা যাতে অনুমিতি তৈরি করা যায় এবং অনুমান পরীক্ষা করা যায় tested
আইরিশস্ট্যাট

6

প্রথমে আপনি কিউকিউ-প্লটটি ব্যবহার করে সাধারণ জ্ঞান অর্জনের জন্য "আইট্রব্যাট ইট" করতে পারেন এখানে কীভাবে আর এর মধ্যে একটি উত্পন্ন করা যায় তা is

আর ম্যানুয়াল অনুসারে আপনি আপনার ডেটা ভেক্টরকে সরাসরি শ্যাপিরো.স্টেস্ট () ফাংশনে ফিড করতে পারেন।

আপনি যদি নিজেই অবশিষ্টাংশগুলি গণনা করতে চান তবে হ্যাঁ প্রতিটি অবশিষ্টাংশ আপনার পর্যবেক্ষণের সেটগুলি ধরে সেভাবেই গণনা করা হয়। আপনি এটি সম্পর্কে এখানে আরও দেখতে পারেন ।


সুতরাং, যতদূর আমি সাধারনতার জন্য পদ্ধতিগুলি বুঝতে পেরেছি আমাদের প্রকৃত ডেটার অবশিষ্টাংশের স্বাভাবিকতা পরীক্ষা করে। তারা এটি স্বয়ংক্রিয়ভাবে করে এবং আমাদের অবশিষ্টাংশগুলি গণনা করা এবং তাদের পরীক্ষার অধীন করা উচিত নয়। এবং প্রতিদিনের বক্তৃতাতে আমরা সাধারণত "আমার ডেটাগুলি সাধারণত বিতরণ করা হয়" ধরে আমার ডেটাগুলির অবশিষ্টাংশগুলি "স্বাভাবিক" বলে ধরে নিই। দয়া করে আমাকে সংশোধন করুন
stan

6
আমি আপনার শেষ বিষয়টির সাথে একমত নই। আমার ডেটাগুলি সাধারণত বিতরণ করা হয় এমন লোকেরা সাধারণত অবশিষ্টাংশগুলিকে উল্লেখ করে না। আমি মনে করি লোকেরা এটি বলে কারণ তারা মনে করে যে প্রতিটি পরিসংখ্যান পদ্ধতিতে সমস্ত ডেটা স্বাভাবিক হওয়া দরকার।
গ্লেন

@ গ্লেন অকপটে বললে আমি (মিথ্যা) এতক্ষণ একই কথা ভাবি ... আমি বুঝতে পারি না (এটি আমার সমস্যা) যদি আমার গামা বা বিটা থাকে বা বিতরণ করা ডেটা আমার কাছে থাকা উচিত যা তারা সাধারণত একইভাবে করে থাকে তাদের সত্য / প্রাকৃতিক বিতরণ সত্ত্বেও বিতরণ? এবং বিতরণের ঘটনা কি কেবল ইঙ্গিতের জন্য? আমি এই সাইট আগে শুধুমাত্র গসিয়ান বন্টন চিনি ...
স্ট্যান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.