"বিপরীত" শাপিরো – উইলক


11

উইকিপিডিয়া অনুসারে শারিপো-উইলক পরীক্ষা নাল-হাইপোথিসিস ( ) "জনসংখ্যাকে সাধারণত বিতরণ করা হয়" পরীক্ষা করে।H0

আমি "জনসংখ্যার সাধারণত বিতরণ করা হয় না " এর সাথে একই ধরণের স্বাভাবিকতা পরীক্ষাটি খুঁজছি ।H0

এরকম পরীক্ষা করার পরে, আমি এইচটি তাত্পর্যপূর্ণ স্তরে প্রত্যাখ্যানের জন্য ভ্যালু গণনা করতে চাই iff ; প্রমাণ করে যে আমার জনসংখ্যা সাধারণত বিতরণ করা হয়।এইচ 0 αpH0αp<α

অনুগ্রহ করে নোট করুন যে শারিপো-উইলক পরীক্ষাটি ব্যবহার করা এবং iff গ্রহণ করা একটি ভুল পদ্ধতির কারণ এর আক্ষরিক অর্থ "H0 টি ধারণ করে না তা প্রমাণ করার মতো পর্যাপ্ত প্রমাণ আমাদের কাছে নেই"। পি > αH0p>α

সম্পর্কিত থ্রেড - মূল্য অর্থp , স্বাভাবিকতা পরীক্ষা নিরর্থক? , তবে আমি আমার সমস্যার সমাধান দেখতে পাচ্ছি না।

প্রশ্নগুলি: আমার কোন পরীক্ষাটি ব্যবহার করা উচিত? এটি কি আর-তে বাস্তবায়িত হয়?


6
"সাধারণভাবে বিতরণ করা হয় না" এর একটি নাল অনুমান ব্যবহারযোগ্য নয়। এই স্থানটিতে সমস্ত বিতরণ যথেচ্ছভাবে কাছাকাছি হলেও অন্তর্ভুক্ত থাকবে সাধারণ বিতরণে নয়। আপনি আমাকে কোনও সীমাবদ্ধ ডেটা সেট করুন। আমি অভিজ্ঞতাগত বিতরণটি নির্বাচন করি যা সাধারণ নয় এবং তাই নালাগুলির অন্তর্গত। প্রত্যাখ্যান করা যায় না।
উ। ওয়েব

5
এই প্রশ্নটি, যা আপনার আগের মত একই, অসম্ভবকে জিজ্ঞাসা করে। একটি যথাযথ উত্তরণ ব্যাখ্যা করবে যে পরিসংখ্যান অনুমানের পরীক্ষাগুলি কীভাবে কাজ করে, সে কারণেই আমি আপনাকে আপনার অন্যান্য প্রশ্নের একটি মন্তব্যে stats.stackexchange.com/questions/31 দেখিয়েছি ।
হোবল

5
যদিও একটি নাল অনুমান "সাধারণভাবে বিতরণ করা হয় না" অসম্ভব, একটি নাল হাইপোথিসিসটি সাধারণ ধার্মিকতার সাথে পরিপূর্ণ পরিসংখ্যানের একটি নিখুঁত মান সহ বিতরণ করা হয় যা সমপরিমাণ পরীক্ষার লাইনের সাথে কমপক্ষে " " হিসাবে পৃথক । অন্য কথায় একজনের নালীর বিরুদ্ধে পরীক্ষা করতে সক্ষম হওয়া উচিত "কমপক্ষে এটির দ্বারা অনেকটা স্বাভাবিক "। @ গুং তার উত্তরে সুনির্দিষ্টভাবে এই পরামর্শ দিয়েছে। ε
অ্যালেক্সিস

উত্তর:


10

একটা পরীক্ষা যে আপনার ডেটা যেমন জিনিস নেই করছে স্বাভাবিকভাবে বিতরণ করেন। কেবলমাত্র এমন পরীক্ষা রয়েছে যেগুলি আপনার ডেটা সাধারণত বিতরণ করা হয় না । সুতরাং, শাপিরো-উইলকের মতো পরীক্ষাগুলি রয়েছে যেখানে (আরও অনেকগুলি রয়েছে), তবে জনসংখ্যা স্বাভাবিক নয় এবং বিকল্প অনুমানটি এই যে জনসংখ্যা স্বাভাবিক। H0:normal

আপনারা যা কিছু করতে পারেন তা হ'ল আপনি যে স্বাভাবিকতা থেকে উদার হন (যেমন, স্কিউনেস) এবং এটি আপনাকে বিরক্ত করার আগে সেই বিচ্যুতি কতটা বড় হতে পারে তা থেকে কী ধরণের বিচ্যুতি ঘটে। তারপরে আপনি এটি পরীক্ষা করে দেখতে পারেন যে আপনার ডেটাতে নিখুঁত স্বাভাবিকতা থেকে বিচ্যুতি সমালোচনামূলক পরিমাণের চেয়ে কম ছিল কিনা। সাধারণ ধারণা সম্পর্কে আরও তথ্যের জন্য এটি আমার উত্তরটি পড়তে এখানে সহায়তা করতে পারে: পরিসংখ্যানবিদরা কেন নন-তাত্পর্যপূর্ণ ফলাফলের অর্থ নাল অনুমানকে গ্রহণ করার বিরোধিতা করে "আপনি নালকে প্রত্যাখ্যান করতে পারবেন না"?


5

আমি তাত্পর্যপূর্ণ স্তরে H0 প্রত্যাখ্যান করার জন্য একটি পি-মান গণনা করতে চাই α iff p <α; প্রমাণ করে যে আমার জনসংখ্যা সাধারণত বিতরণ করা হয়।

সাধারণ বিতরণটি ঘটে যখন ডেটাটি অ্যাডেটিভ আইড ইভেন্টগুলির একটি সিরিজ দ্বারা উত্পন্ন হয় (নীচে কুইঙ্কংস চিত্রটি দেখুন)। তার মানে কোনও ফিডব্যাক এবং কোনও সম্পর্ক নেই, এই শব্দটি কী এমন প্রক্রিয়াটির মতো লাগে যা আপনার ডেটাকে নেতৃত্ব দেয়? যদি না হয় তবে এটি সম্ভবত স্বাভাবিক নয়।

আপনার ক্ষেত্রে ধরণের প্রক্রিয়া হওয়ার সম্ভাবনা রয়েছে। আপনি "প্রমাণ" দিতে সবচেয়ে কাছাকাছি আসতে পারেন লোকেরা যে কোনও বিতরণ প্রকাশ করতে পারে (যা সম্ভবত ব্যবহারিক নয়) তা বাতিল করার জন্য পর্যাপ্ত তথ্য সংগ্রহ করা। অন্য উপায়টি হ'ল কিছু বিতরণ এবং কিছু ভবিষ্যদ্বাণী সহ কিছু সাধারণ তত্ত্ব থেকে সাধারণ বন্টন হ্রাস করা। ডেটা যদি এই সমস্তটির সাথে সামঞ্জস্যপূর্ণ হয় এবং কেউ অন্য ব্যাখ্যা সম্পর্কে চিন্তা করতে না পারে তবে এটি স্বাভাবিক বিতরণের পক্ষে ভাল প্রমাণ হবে।

https://upload.wikimedia.org/wikipedia/commons/7/7f/Quincunx_%28Galton_Box%29_-_Galton_1889_diagram.png https://en.wikipedia.org/wiki/Bean_machine

এখন আপনি যদি কোনও নির্দিষ্ট বিতরণ অগ্রাধিকারের প্রত্যাশা না করেন তবে তথ্যের সংক্ষিপ্তসারের জন্য সাধারণ বিতরণটি ব্যবহার করা এখনও যুক্তিসঙ্গত হতে পারে তবে স্বীকার করুন যে এটি মূলত অজ্ঞতার বাইরে একটি পছন্দ ( https://en.wikedia.org/wiki/ নীতিমালা_মোম্যাক্সিমাম_এন্ট্রপি )। এক্ষেত্রে আপনি জনসংখ্যার সাধারণত বিতরণ করা হয় কিনা তা জানতে চান না, বরং আপনি জানতে চান যে আপনার পরবর্তী পদক্ষেপ যা হবে তার সাধারণ বিতরণটি যুক্তিসঙ্গত অনুমান কিনা।

সেক্ষেত্রে আপনার কী কী পরিকল্পনা করা হচ্ছে তার বিবরণ সহ আপনার আপনার ডেটা (বা উত্পন্ন ডেটা যা একই রকম) সরবরাহ করা উচিত, তবে জিজ্ঞাসা করুন "এই ক্ষেত্রে স্বাভাবিকতা ধরে নেওয়া কীভাবে আমাকে বিভ্রান্ত করতে পারে?"


আমি আসলে জানি যে ডেটা স্বাভাবিক (স্বতন্ত্র কম্পিউটারে স্বতন্ত্র পরিমাপ), তবে আমার থিসিসের জন্য আমার কিছুটা ধারণা নেওয়া দরকার .. স্পষ্টতা এবং উদাহরণের জন্য আপনাকে ধন্যবাদ :)
পেট্রেল

1
ঘটনাক্রমে, ক্রিগার ক্রিগার, এন। (2012) এ গ্যালটনের কুইঞ্চংস ব্যবহারের একটি সুন্দর সমালোচনা সরবরাহ করেছেন । কে এবং একটি "জনসংখ্যা" কী? populationতিহাসিক বিতর্ক, বর্তমান বিতর্ক এবং "জনসংখ্যার স্বাস্থ্য" বোঝার এবং স্বাস্থ্য বৈষম্যগুলি সংশোধন করার জন্য জড়িত মিলবাঙ্ক ত্রৈমাসিক , 90 (4): 634–681।
অ্যালেক্সিস

@ পেপারবেল সেই পরিস্থিতি উপরে বর্ণিত বিষয়গুলির থেকে সূক্ষ্মতার চেয়ে পৃথক। আপনি একটি পঞ্চম তৈরি করতে পারেন যেখানে প্রতিটি পর্যবেক্ষণ iid হয় তবে প্রক্রিয়াটি ডেটা উত্পন্ন করে না। লগ-সাধারণ উদাহরণের জন্য এখানে দেখুন: লিম্পার্ট এবং অন্যান্য। বিজ্ঞান জুড়ে লগ-সাধারণ বিতরণ: কী এবং ক্লু। মে 2001 / ভলিউম 51 নং 5. বায়োসায়েন্স।
লাইভ

1
@ অ্যালেক্সিস আমি দেখতে পাচ্ছি যে ক্রিগার (২০১২) লিম্পার্ট এট আল থেকে চিত্রটি পুনরুত্পাদন করেছে। (2001) এবং পেট্রবেল দ্বারা বিন্দুটি মিস করেছেন: "কাঠামোগুলি পরিবর্তনের ফলে ফলাফলের সম্ভাবনাগুলি, এমনকি অভিন্ন বস্তুর জন্যও পরিবর্তিত হতে পারে, যার ফলে বিভিন্ন জনসংখ্যার বন্টন তৈরি করা যায়"।
লাইভ

2

আপনি কখনই আপনার ডেটাতে একটি সাধারণ ধারণা অনুধাবন করতে পারবেন না। কেবলমাত্র অনুমান হিসাবে এটির বিরুদ্ধে প্রমাণ উপস্থাপন করুন। শাপিরো-উইলক পরীক্ষাটি এটির একটি উপায় এবং সাধারণতা অনুমানকে ন্যায়সঙ্গত করতে সর্বদা ব্যবহৃত হয়। যুক্তিটি হ'ল আপনি সাধারনতা ধরে ধরে শুরু করেছেন। তারপরে আপনি জিজ্ঞাসা করুন, আমার ডেটা কি আমি নির্বোধ অনুমান করছি বলে পরামর্শ দেয়? সুতরাং আপনি এগিয়ে যান এবং এটি শাপিরো-উইলকের সাথে পরীক্ষা করুন। আপনি যদি নাল অনুমানকে প্রত্যাখ্যান করতে ব্যর্থ হন তবে ডেটা আপনাকে মূর্খ অনুমান করা পরামর্শ দিচ্ছে না।

লক্ষ করুন, লোকেরা অনুশীলনে সর্বদা এই জাতীয় যুক্তি ব্যবহার করে - কেবল শাপিরো-উইলক পরীক্ষার প্রসঙ্গে নয়। তারা লিনিয়ার রিগ্রেশন ব্যবহার করতে চান, একটি স্ক্যাটারপ্লোটের দিকে তাকান এবং দেখতে চান যে লিনিয়ার রিগ্রেশন একটি নির্বোধ ধারণা। অথবা, তারা হিটোরিসেসডাস্টিকটি এবং প্লট ত্রুটির শর্তাদি ধরে নেয় এটি দেখার জন্য এটি নির্বোধ ধারণা।Y,X


যে অনুশীলনটি আপনি বৈষম্য করছেন সেটি হ'ল উল্লিখিত ভুল পদ্ধতির pet পরীক্ষাগুলি সাধারণত সামঞ্জস্যপূর্ণ, তাই নমুনার আকারটি যত বড়, স্বাভাবিকতা অনুমানকে একটি নির্লিপ্ত ধারণা ঘোষণা করার সম্ভাবনা তত বেশি। এটি নিজেই মূর্খ, কারণ বৃহত্তর নমুনা আকারের সাথে, বেশিরভাগ পদ্ধতির অ্যাসেম্পটোটিক দৃust়তার কারণে স্বাভাবিকতা অনুমান কম সমালোচিত হয়।
হোর্স্ট গ্রানবুশ

@ হোর্স্টগ্রনবুশ আপনি কি শপিরো-উইলক পরীক্ষাটি এমন একটি ধারণা যাচাই করেন যে ডেটাটি নরমাল?
ট্রায়নাডোস্ট্যাট

যদি আপনি সম্মত হন যে এটি একটি বৈধ পন্থা তবে আমি নিশ্চিত না যে আপনি আমার উত্তরের সাথে একমত নন।
ট্রাইন্নাডোস্ট্যাট

না। আর্গুমেন্টগুলি এখানে দেখুন: stats.stackexchange.com / Qtions / 2492/… । এছাড়াও, নাল অনুমানটি পরীক্ষা করা অবৈধ যে দুটি নমুনার একই বৈকল্পিকতা রয়েছে এবং স্যাটার্থওয়েট পরীক্ষাটি কেবলমাত্র তখনই পরিবর্তিত হয় যদি ভেরিয়েন্সগুলি উল্লেখযোগ্যভাবে পৃথক হয় এবং অন্যথায় হোমসকেস্টেস্টিক নমুনাগুলির জন্য টি-পরীক্ষা। কেবল নিজের তৈরি করে এই যৌগিক প্রক্রিয়াটি অনুকরণ করুন: আপনি টাইপ-আই-ত্রুটি হার পেতে পারেন । 2α
হোর্স্ট গ্রানবুশ

@ হোর্স্টগ্রনবুশ মনে হচ্ছে আমার উত্তরটির সাথে আপনার সমস্যাটি সাধারণভাবে অনুমানের পরীক্ষার ধারণার সাথে জড়িত। বিশেষত, অনেক পরিস্থিতিতে হাইপোথিসিস টেস্টগুলি নমুনা আকারের অসীমের কাছে যাওয়ার সাথে সাথে সম্ভাব্যতা 1 টি বাতিল করে দেয়।
ট্রায়নাডোস্ট্যাট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.