পরিসংখ্যান পরীক্ষায় পি মান এবং টি মানগুলির অর্থ কী?


246

একটি পরিসংখ্যান কোর্স গ্রহণ এবং তারপরে সহপাঠী শিক্ষার্থীদের সাহায্য করার চেষ্টা করার পরে, আমি একটি বিষয় লক্ষ্য করেছি যা প্রচুর হেড-ডেস্কের বাজকে অনুপ্রাণিত করে যে পরিসংখ্যান অনুমানের পরীক্ষার ফলাফল ব্যাখ্যা করে। দেখে মনে হয় শিক্ষার্থীরা সহজেই কোনও প্রদত্ত পরীক্ষার জন্য প্রয়োজনীয় গণনাগুলি সম্পাদন করতে শিখতে পারে তবে ফলাফলগুলি ব্যাখ্যা করতে গিয়ে স্তব্ধ হয়। অনেক কম্পিউটারাইজড সরঞ্জাম "p মান" বা "টি মান" এর শর্তে পরীক্ষার ফলাফলের প্রতিবেদন করে।

আপনি কলেজ ছাত্রদের পরিসংখ্যানের মধ্যে প্রথম কোর্স গ্রহণ করার জন্য নিম্নলিখিত পয়েন্টগুলি কীভাবে ব্যাখ্যা করবেন:

  • হাইপোথিসিস পরীক্ষা করার সাথে সম্পর্কিত "পি-ভ্যালু" বলতে কী বোঝায়? এমন কোনও মামলা রয়েছে যখন যখন একটি উচ্চ পি-মান বা একটি কম পি-মান সন্ধান করা উচিত?

  • একটি পি-মান এবং টি-মানের মধ্যে সম্পর্ক কী?


11
এর মোটামুটি বিটটি মূলত পি মানগুলিতে উইকিপিডিয়া নিবন্ধের প্রথম বাক্য দ্বারা আচ্ছাদিত , যা পি-মানকে সঠিকভাবে সংজ্ঞায়িত করে। যদি এটি বোঝা যায় তবে অনেক কিছুই পরিষ্কার হয়ে যায়।
Glen_b

1
স্রেফ বইটি পান: স্টিস্টিস্টিকস উইথ ট্রু এটি আপনার বিচক্ষণতা বাঁচাতে পারে !!

7
@ ব্যবহারকারী 48700 আপনি অশ্রু ছাড়া পরিসংখ্যান কীভাবে এটি ব্যাখ্যা করে?
ম্যাট ক্রাউস

5
সময়ের সাথে সাথে কারও পি-মান সম্পর্কিত প্রশ্নগুলির একটি গ্রাফ আঁকতে হবে এবং আমি বাজি ধরছি আমরা কলেজগুলিতে বা কোর্সেরা ডেটা সায়েন্স ক্লাসে একাডেমিক ক্যালেন্ডারে
alityতুরতা

উত্তর এবং মন্তব্যে অন্যান্য সুন্দর এবং প্রাসঙ্গিক বইয়ের সুপারিশের পাশাপাশি আমি অন্য একটি বইয়ের পরামর্শ দিতে চাই, যথাযথভাবে "যাইহোক পি-মান কী?"
আলেকসান্ডার ব্লেক

উত্তর:


150

মূল্য বুঝতেp

মনে করুন, আপনি যে অনুমানটি পরীক্ষা করতে চান যে আপনার বিশ্ববিদ্যালয়ের পুরুষ শিক্ষার্থীদের গড় উচ্চতা ফুট ইঞ্চি। আপনি এলোমেলোভাবে নির্বাচিত জন শিক্ষার্থীর উচ্চতা সংগ্রহ করেন এবং নমুনার গড় গণনা করুন (বলুন এটি ফুট ইঞ্চি পরিণত হয়েছে)। উপযুক্ত সূত্র / পরিসংখ্যানগত রুটিন ব্যবহার করে আপনি আপনার অনুমানের জন্য মূল্য গণনা করুন এবং বলবেন এটি ।7 100 5 9 পি 0.065710059p0.06

যথাযথভাবে ব্যাখ্যা করার জন্য , আমাদের বেশ কয়েকটি বিষয় মাথায় রাখা উচিত:p=0.06

  1. শাস্ত্রীয় অনুমানের পরীক্ষার অধীনে প্রথম পদক্ষেপটি অনুমান করা হয় যে বিবেচনাধীন অনুমানটি সত্য। (আমাদের প্রসঙ্গে, আমরা ধরে নিই যে প্রকৃত গড় উচ্চতা ফুট ইঞ্চি)757

  2. নিম্নলিখিত গণনাটি করার জন্য কল্পনা করুন: আমাদের অনুমানটি বাস্তবে সঠিক বলে ধরে নিলে নমুনাটির অর্থ ফুট ইঞ্চির চেয়ে বেশি হওয়ার সম্ভাবনাটি গণনা করুন (পয়েন্ট 1 দেখুন)।959

অন্য কথায়, আমরা জানতে চাই

P(Samplemean5ft9inches|Truevalue=5ft7inches).

দ্বিতীয় ধাপে গণনা যা ভ্যালু বলা হয় । সুতরাং, ভ্যালুটির অর্থ হ'ল যদি আমরা আমাদের পরীক্ষাকে অনেকগুলি, বহুবার পুনরাবৃত্তি করি (প্রতিবার আমরা যখন জন শিক্ষার্থীকে এলোমেলোভাবে নির্বাচন করি এবং নমুনার গড় গণনা করি) তবে বার আমরা একটি নমুনা দেখার আশা করতে পারি ফুট ইঞ্চির চেয়ে বড় বা সমান ।পি 0.06 100 6 100 5 9pp0.06100610059

উপরোক্ত বোঝাপড়া দেওয়া, আমাদের অনুমানটি সত্য যে এখনও অনুমান করা উচিত (পদক্ষেপ 1 দেখুন)? ভাল, একটি ইঙ্গিত দেয় যে দুটি জিনিসের মধ্যে একটি ঘটেছে:p=0.06

  • (ক) হয় আমাদের অনুমানটি সঠিক এবং একটি অত্যন্ত সম্ভাবনাময় ঘটনা ঘটেছে (উদাহরণস্বরূপ, সমস্ত ছাত্র ছাত্র ক্রীড়াবিদ)100

অথবা

  • (খ) আমাদের অনুমানটি ভুল এবং আমরা যে নমুনা পেয়েছি তা অস্বাভাবিক নয়।

(এ) এবং (বি) এর মধ্যে চয়ন করার traditionalতিহ্যগত উপায় হ'ল জন্য একটি স্বেচ্ছাসেবী কাট অফ বেছে নেওয়া । আমরা এবং (খ) হলে (এ) চয়ন করি ।পি > 0.05 পি < 0.05pp>0.05p<0.05


3
আপনার সময় নিন! আমি এক সপ্তাহ বা তার বেশি সময় ধরে "সেরা উত্তর" নির্বাচন করার বিষয়ে চিন্তা করব না।
শার্পি

1
এখন যেহেতু আমার কাছে ফিরে আসার এবং পুরো উত্তরটি পড়ার সুযোগ হয়েছিল - শিক্ষার্থীর উচ্চতার উদাহরণের জন্য একটি বড় +1। খুব পরিষ্কার এবং ভালভাবে ছড়িয়ে দেওয়া।
শার্পি

3
দুর্দান্ত কাজ ... তবে আমাদের (সি) আমাদের মডেল যুক্ত করতে হবে (সূত্র / পরিসংখ্যানের রুটিনে সংযুক্ত) ভুল is
অ্যান্ড্রু রবিনসন

6
একটি টি-মান (বা অন্য কোনও পরীক্ষার পরিসংখ্যান) বেশিরভাগই একটি মধ্যবর্তী পদক্ষেপ। এটি মূলত কিছু পরিসংখ্যান যা একটি সুপরিচিত বিতরণ করার জন্য কিছু অনুমানের অধীনে প্রমাণিত হয়েছিল। যেহেতু আমরা শূন্যের অধীনে পরীক্ষার পরিসংখ্যানগুলির বিতরণ জানি, তাই আমরা পি-মান অর্জনের জন্য স্ট্যান্ডার্ড টেবিলগুলি (বর্তমানে বেশিরভাগ সফ্টওয়্যার) ব্যবহার করতে পারি।
গালা

1
চি-স্কোয়ার পরীক্ষা করার পরে এবং পি-স্কোয়ার টেবিল থেকে পি-মানটি প্রাপ্ত হয় না? আমি ভাবছি যে উপরে গণনা করা সম্ভাব্যতা কীভাবে পি-মানটি নির্দেশ করে ?!
লন্ডনের লোক

123

শিক্ষক এবং চিন্তাশীল শিক্ষার্থীর মধ্যে একটি সংলাপ

এই থ্রেডটিতে এখনও পর্যন্ত পর্যাপ্ত ক্রাইওন ব্যবহার করা হয়নি বলে বিশ্বাসের সাথে নম্রভাবে জমা দেওয়া হয়েছে। একটি সংক্ষিপ্ত চিত্রিত সংক্ষিপ্তসার শেষে প্রদর্শিত হবে।


ছাত্র : পি-মান বলতে কী বোঝায়? অনেক লোক এটির একমত বলে মনে হয় যে " আমরা একটি পরিসংখ্যানের চেয়ে বড় বা সমান" একটি নমুনা দেখতে পাব " এই ফলাফলটি পর্যালোচনা করার সম্ভাবনাটি ... নাল অনুমানটি সত্য" বা যেখানে "আমার নমুনার পরিসংখ্যান সত্য" এ [একটি কৃত্রিম] বন্টন "হিংস্র এবং এমনকি " একটি পরীক্ষার পরিসংখ্যান অভিমানী নাল হাইপোথিসিস সত্য "গণনা করা এক হিসাবে অন্তত মত বৃহৎ দেখে সম্ভাবনা

শিক্ষক : যথাযথভাবে বোঝা গেছে, সেই সমস্ত বক্তব্য অনেক পরিস্থিতিতেই সঠিক।

ছাত্র : আমি দেখতে পাচ্ছি না যে তাদের বেশিরভাগ কীভাবে প্রাসঙ্গিক। আপনি কি আমাদের শিখিয়েছিলেন নি যে আমাদের একটি নাল হাইপোথিসিস এবং বিকল্প হাইপোথিসিস ? তারা "এর চেয়ে বড় বা সমান" বা "কমপক্ষে বৃহত্তর" বা খুব জনপ্রিয় "আরও চরম" এই ধারণাগুলিতে কীভাবে জড়িত?এইচ একজনH0HA

শিক্ষক : যেহেতু এটি সাধারণভাবে জটিল বলে মনে হতে পারে, তবে এটি কি আমাদের একটি দৃ concrete় উদাহরণ আবিষ্কার করতে সহায়তা করবে?

ছাত্র : অবশ্যই তবে দয়া করে এটিকে বাস্তববাদী তবে সহজ করে তুলুন you

শিক্ষক : হাইপোথিসিস পরীক্ষার এই তত্ত্বটি historতিহাসিকভাবে পর্যবেক্ষণ ত্রুটি বিশ্লেষণ করার জন্য জ্যোতির্বিদদের প্রয়োজনের সাথে শুরু হয়েছিল, সুতরাং সেখানে কীভাবে শুরু হবে। আমি একদিন কিছু পুরানো নথির মধ্য দিয়ে যাচ্ছিলাম যেখানে একজন বিজ্ঞানী তার যন্ত্রের পরিমাপের ত্রুটি হ্রাস করার জন্য তার প্রচেষ্টা বর্ণনা করেছিলেন। তিনি একটি ज्ञিত অবস্থানে তারার প্রচুর পরিমাপ নিয়েছিলেন এবং সেই স্থানের সামনে বা পিছনে তাদের স্থানচ্যুতি রেকর্ড করেছিলেন। এই স্থানচ্যুতিগুলি কল্পনা করতে, তিনি একটি হিস্টোগ্রাম এঁকেছিলেন - যখন কিছুটা ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে ছড়িয়ে দেওয়া হয় this এটির মতো দেখতে।

চিত্র 1: স্থানচ্যুতির ইতিহাস

ছাত্র : আমার মনে আছে হিস্টোগ্রামগুলি কীভাবে কাজ করে: উলম্ব অক্ষটি "ঘনত্ব" হিসাবে লেবেলযুক্ত আমাকে মনে করিয়ে দেওয়ার জন্য যে পরিমাপের আপেক্ষিক ফ্রিকোয়েন্সিগুলি দৈর্ঘ্যের চেয়ে অঞ্চল দ্বারা প্রতিনিধিত্ব করা হয়

শিক্ষক : ঠিক বলেছেন। একটি "অস্বাভাবিক" বা "চরম" মানটি খুব ছোট অঞ্চল সহ একটি অঞ্চলে অবস্থিত। এখানে একটি crayon। আপনি কি ভাবেন যে আপনি এমন একটি অঞ্চলে রঙিন করতে পারেন যার ক্ষেত্রফল মোট এক দশমাংশ?

ছাত্র : অবশ্যই; এটা সহজ. [চিত্রের রং।]

চিত্র 2: শিক্ষার্থীর প্রথম রঙিন।

শিক্ষক : খুব ভাল! এটি আমার কাছে প্রায় 10% অঞ্চল মত দেখাচ্ছে। তবে মনে রাখবেন যে হিস্টোগ্রামের একমাত্র ক্ষেত্রগুলি উল্লম্ব রেখার মধ্যবর্তী অঞ্চলগুলি: তারা সেই সুযোগ বা সম্ভাবনার প্রতিনিধিত্ব করে যে স্থানান্তরটি অনুভূমিক অক্ষের উপরের এই লাইনের মধ্যে অবস্থান করবে তার মানে আপনার নীচে সমস্ত দিকে রঙ করা দরকার এবং এটি অর্ধেক অঞ্চল জুড়ে হবে, তাই না?

ছাত্র : ওহ, দেখছি। আমাকে আবার করতে দাও. আমি রঙ করতে চাই যেখানে বাঁক সত্যিই কম, আমি করব না? এটি দুই প্রান্তে সর্বনিম্ন। আমাকে কি কেবল একটি জায়গায় রঙ করতে হবে বা এটি বেশ কয়েকটি অংশে ভাঙা ঠিক হবে?

শিক্ষক : বেশ কয়েকটি অংশ ব্যবহার করা একটি স্মার্ট ধারণা। তারা কোথায় থাকবে?

ছাত্র (পয়েন্টিং): এখানে এবং এখানে। কারণ এই ক্রাইওনটি খুব তীক্ষ্ণ নয়, আমি যে লাইনগুলি ব্যবহার করছি সেগুলি দেখানোর জন্য আমি একটি কলম ব্যবহার করেছি।

চিত্র 3: শিক্ষার্থীর দ্বিতীয় রঙিন

শিক্ষক : খুব সুন্দর! বাকি গল্পটি বলি। বিজ্ঞানী তার ডিভাইসে কিছু উন্নতি করেছিলেন এবং তারপরে তিনি অতিরিক্ত পরিমাপ নেন। তিনি লিখেছেন যে প্রথমটির স্থানচ্যুতি কেবলমাত্র ছিল , যা তিনি মনে করেছিলেন এটি একটি ভাল লক্ষণ, তবে একজন সতর্ক বিজ্ঞানী হিসাবে তিনি আরও একটি চেক হিসাবে আরও পরিমাপ গ্রহণ করেন। দুর্ভাগ্যক্রমে, এই অন্যান্য পরিমাপগুলি হারিয়ে গেছে - পান্ডুলিপিটি এই মুহুর্তে বিচ্ছিন্ন হয়ে যায় - এবং আমাদের সমস্ত কিছুই সেই একক সংখ্যা, ।0.10.10.1

ছাত্র : এটা খুব খারাপ। তবে কি আপনার চিত্রের বাস্তুচ্যুততার বিস্তারের চেয়ে অনেক বেশি ভাল নয়?

শিক্ষক : এ প্রশ্নেরই উত্তর আমি আপনার কাছে চাই। শুরু করার জন্য, আমাদের হিসাবে কী উচিত ?H0

ছাত্র : আচ্ছা, একজন সন্দেহবাদী ভাববেন যে ডিভাইসটিতে করা উন্নতিগুলি আদৌ কোনও প্রভাব ফেলেছিল কিনা। প্রমাণের বোঝা বিজ্ঞানীর উপরে: তিনি সন্দেহ দেখাতে ভুল করেছেন তা দেখাতে চাইবেন। এটি আমাকে ভাবায় যে নাল হাইপোথিসিসটি বিজ্ঞানীর পক্ষে একরকম খারাপ এটি বলে যে সমস্ত নতুন পরিমাপ - যার সম্পর্কে আমরা জানি এর মান সহ - প্রথম হিস্টোগ্রামের বর্ণনা অনুযায়ী আচরণ করা উচিত। বা এর থেকেও খারাপ হতে পারে: এগুলি আরও বেশি ছড়িয়ে পড়ে থাকতে পারে।0.1

শিক্ষক : যাও, আপনি ভাল করছেন।

ছাত্র : এবং তাই বিকল্পটি হ'ল নতুন পরিমাপ কম ছড়িয়ে পড়বে , তাই না?

শিক্ষক : খুব ভাল! আপনি কি আমাকে কম ছবি ছড়িয়ে একটি হিস্টগ্রাম দেখতে দেখতে একটি ছবি আঁকতে পারেন? এখানে প্রথম হিস্টোগ্রামের আরও একটি অনুলিপি দেওয়া হয়েছে; আপনি এটির উপরে একটি রেফারেন্স হিসাবে আঁকতে পারেন।

শিক্ষার্থী (অঙ্কন): আমি নতুন হিস্টগ্রামের রূপরেখার জন্য একটি কলম ব্যবহার করছি এবং আমি এর নীচের অংশে রঙ করছি। আমি এটিকে তৈরি করেছি যাতে বেশিরভাগ বাঁকগুলি অনুভূমিক অক্ষের সাথে শূন্যের কাছাকাছি থাকে এবং তাই এর বেশিরভাগ অঞ্চল শূন্যের একটি (অনুভূমিক) মানের কাছাকাছি থাকে: এর অর্থ এটি কম ছড়িয়ে পড়ে বা আরও সুনির্দিষ্ট হয়।

চিত্র 4: শিক্ষার্থীর নতুন হিস্টোগ্রাম

শিক্ষক : এটি একটি ভাল শুরু। তবে মনে রাখবেন যে কোনও হিস্টোগ্রামের সম্ভাবনাগুলি দেখায় তার মোট ক্ষেত্রফল হওয়া উচিত । প্রথম হিস্টোগ্রামের মোট ক্ষেত্রফল । আপনার নতুন হিস্টোগ্রামের ভিতরে কতটি অঞ্চল রয়েছে?111

ছাত্র : অর্ধেকেরও কম, আমার মনে হয়। আমি দেখতে পাচ্ছি যে এটি একটি সমস্যা, তবে কীভাবে এটি ঠিক করতে হয় তা আমি জানি না। আমার কি করা উচিৎ?

শিক্ষক : কৌশলটি হ'ল নতুন হিস্টোগ্রামটি পুরানোের চেয়ে উচ্চতর করা যাতে এর মোট ক্ষেত্রফল । এখানে, আমি উদাহরণের জন্য আপনাকে কম্পিউটার দ্বারা তৈরি একটি সংস্করণ দেখাব।1

চিত্র 5: শিক্ষকের নতুন হিস্টোগ্রাম

ছাত্র : আমি দেখতে পেয়েছি: আপনি এটিকে উল্লম্বভাবে প্রসারিত করেছেন যাতে এর আকৃতিটি আসলে পরিবর্তন হয় নি তবে এখন লাল অঞ্চল এবং ধূসর অঞ্চল (লাল নীচের অংশ সহ) সমান পরিমাণ।

শিক্ষক : ঠিক বলেছেন। আপনি নাল অনুমানের একটি ছবি দেখছেন (নীল রঙে, ছড়িয়ে পড়েছে) এবং বিকল্প অনুমানের একটি অংশ (লাল রঙে, কম স্প্রেড সহ)।

ছাত্র : বিকল্পটির "অংশ" বলতে কী বোঝ? এটা ঠিক নয় বিকল্প হাইপোথিসিস?

শিক্ষক : পরিসংখ্যানবিদ এবং ব্যাকরণ মিশ্রিত বলে মনে হয় না। :-) গুরুতরভাবে, তারা একটি "অনুমান" বলতে যা বোঝায় তা হ'ল সম্ভাবনার সম্পূর্ণ সেট set এখানে বিকল্প (যেমন আপনি আগে এত ভাল বলেছিলেন) হ'ল পরিমাপগুলি আগের তুলনায় "কম ছড়িয়ে পড়ে"। তবে কত কম ? অনেক সম্ভাবনা আছে। এখানে, আমি আপনাকে অন্য একটি দেখাতে দিন। আমি এটি হলুদ ছোপ দিয়ে আঁকলাম। এটি আগের দু'জনের মধ্যে।

চিত্র 6: বিকল্পের দুটি উপাদান সহ নাল

শিক্ষার্থী : আমি দেখতে পেয়েছি: আপনার বিভিন্ন পরিমাণে স্প্রেড থাকতে পারে তবে কীভাবে স্প্রেড হবে তা আপনি আগেই জানেন না। তবে আপনি কেন এই ছবিতে মজার ছায়া তৈরি করেছেন?

শিক্ষক : আমি হিস্টোগ্রামগুলি কোথায় এবং কীভাবে আলাদা তা হাইলাইট করতে চেয়েছিলাম। আমি এগুলিকে ধূসর ছায়া দিয়েছিলাম যেখানে বিকল্প হিস্টোগ্রামগুলি শূন্যের চেয়ে কম এবং লাল যেখানে বিকল্পগুলি বেশি

ছাত্র : কেন ব্যাপার হবে?

শিক্ষক : আপনার মনে আছে আপনি উভয় লেজের মধ্যে প্রথম হিস্টোগ্রামটি কীভাবে রঙ করেছিলেন? [কাগজপত্রগুলির মাধ্যমে সন্ধান করছেন]] আহ, এটি এখানে। এই ছবিটি একইভাবে রঙ করুন।

চিত্র 7: নাল এবং বিকল্প, রঙিন।

ছাত্র : আমার মনে আছে: এগুলি চরম মান। নাল ঘনত্ব যতটা সম্ভব ছোট এবং সেখানকার 10% অঞ্চলে রঙিন ছিল এমন জায়গাগুলি আমি খুঁজে পেয়েছি।

শিক্ষক : সেই চরম অঞ্চলের বিকল্পগুলি সম্পর্কে বলুন।

শিক্ষার্থী : এটি দেখতে শক্ত, কারণ ক্রাইওন এটি আবৃত করেছে, তবে দেখে মনে হচ্ছে যে আমি যে অঞ্চলগুলিতে রঙিন হয়েছিল সেগুলিতে কোনও বিকল্প হওয়ার সম্ভাবনা নেই। তাদের হিস্টোগ্রামগুলি মান অক্ষের বিপরীতে রয়েছে এবং তাদের নীচে কোনও জায়গার জন্য কোনও স্থান নেই।

শিক্ষক : আসুন সেই চিন্তাভাবনা অব্যাহত রাখি। যদি আমি আপনাকে অনুমানমূলকভাবে বলেছিলাম যে একটি পরিমাপের স্থানচ্যুতি হয়েছে এবং আপনাকে সম্ভবত এই তিনটি হিস্টোগ্রামটি কোনটি থেকে এসেছে তা বেছে নিতে বলেছিলেন, এটি কী হবে?2

ছাত্র : প্রথমটি - নীল একটি। এটি সর্বাধিক ছড়িয়ে পড়ে এবং এটিই একমাত্র যেখানে কোনও সম্ভাবনা রয়েছে বলে মনে হয়।2

শিক্ষক : এবং পাণ্ডুলিপিতে মান সম্পর্কে কী ?0.1

ছাত্র : হুমমম ... এটি আলাদা গল্প। তিনটিই হিস্টোগ্রামগুলি এর স্থল থেকে বেশ উপরে ।0.1

শিক্ষক : ঠিক আছে, যথেষ্ট ন্যায্য। তবে ধরুন আমি আপনাকে বললাম মানটি কোথাও কাছাকাছি , এবং । এটি আপনাকে এই গ্রাফগুলির বাইরে কিছু সম্ভাবনা পড়তে সহায়তা করে?0 0.20.100.2

ছাত্র : অবশ্যই, কারণ আমি অঞ্চলগুলি ব্যবহার করতে পারি। আমাকে কেবল এবং মধ্যে প্রতিটি বক্ররেখার নীচের অঞ্চলগুলি অনুমান করতে হবে । তবে এটি দেখতে বেশ শক্ত দেখাচ্ছে।0.200.2

শিক্ষক : আপনার এতদূর যাওয়ার দরকার নেই। আপনি কি বলতে পারবেন কোন অঞ্চলটি বৃহত্তম?

ছাত্র : অবশ্যই লম্বা বক্ররেখার নীচে একটি। তিনটি অঞ্চলেরই একই ভিত্তি রয়েছে, তাই বক্ররেখা যত লম্বা হয়, তত বেশি অঞ্চল এটির এবং নীচে থাকে। অর্থাৎ সবচেয়ে লম্বা হিস্টোগ্রাম - একটি আমি লাল ড্যাশ সাথে ড্র, - একটি স্থানচ্যুতি জন্য likeliest এক । আমি মনে করি আপনি কোথায় যাচ্ছেন তা আমি দেখছি, তবে আমি কিছুটা উদ্বিগ্ন: আমাকে এখানে দেখানো এক বা দুটি নয়, সমস্ত বিকল্পের জন্য সমস্ত হিস্টোগ্রামের দিকে নজর দিতে হবে না? আমি কীভাবে এটি করতে পারি?0.1

শিক্ষক : আপনি নিদর্শনগুলি তুলনায় ভাল, তাই আমাকে বলুন: পরিমাপের সরঞ্জামটি আরও সুনির্দিষ্টভাবে তৈরি করা হওয়ায় এর হিস্টোগ্রামের কী হবে?

ছাত্র : এটি সংকীর্ণ হয় - ওহ, এবং এটি আরও লম্বা হতে হবে, সুতরাং এর মোট অঞ্চলটি একই থাকে। এটি হিস্টোগ্রামগুলির তুলনা করা বেশ শক্ত করে তোলে। বিকল্পগুলি শূন্যের চেয়ে সমস্ত বেশি , এটি সুস্পষ্ট। তবে অন্যান্য মানগুলিতে কখনও কখনও বিকল্পগুলি বেশি হয় এবং কখনও কখনও সেগুলি কম হয়! উদাহরণস্বরূপ, [ কাছাকাছি কোনও মানটির দিকে ইঙ্গিত করে ], এই মুহুর্তে আমার লাল হিস্টোগ্রামটি সর্বনিম্ন, হলুদ হিস্টগ্রামটি সর্বাধিক এবং মূল নাল হিস্টোগ্রাম তাদের মধ্যে রয়েছে। তবে ডানদিকে নালটি সর্বোচ্চ।3 / 403/4

শিক্ষক : সাধারণভাবে, হিস্টোগ্রামের তুলনা করা একটি জটিল ব্যবসা। আমাদের এটি করতে সাহায্য করার জন্য, আমি কম্পিউটারকে আরও একটি প্লট তৈরি করতে বলেছি: এটি বিকল্প হিস্টগ্রাম উচ্চতাগুলির প্রতিটি (বা "ঘনত্ব") নাল হিস্টোগ্রাম উচ্চতার দ্বারা বিভক্ত করেছে , "সম্ভাবনা অনুপাত" হিসাবে পরিচিত মানগুলি তৈরি করে। ফলস্বরূপ, চেয়ে বেশি মানের মানে বিকল্প সম্ভাবনা বেশি থাকে, যখন চেয়ে কম মানের মানে বিকল্প সম্ভাবনা কম থাকে। এটি আরও একটি বিকল্প এঁকেছে: এটি অন্য দুটি তুলনায় আরও বেশি ছড়িয়ে গেছে, তবে মূল যন্ত্রপাতিটির চেয়ে এখনও কম ছড়িয়ে গেছে।111

চিত্র 8: সম্ভাবনা অনুপাত

শিক্ষক (অব্যাহত): আপনি কি আমাকে দেখাতে পারবেন যেখানে বিকল্পগুলি শূন্যের চেয়ে বেশি হয়ে থাকে?

শিক্ষার্থী (রঙ করা): এখানে মাঝখানে, স্পষ্টতই। এবং যেহেতু এগুলি আর কোনও হিস্টোগ্রাম নয়, আমি অনুমান করি আমাদের অঞ্চলগুলির চেয়ে উচ্চতাগুলির দিকে নজর দেওয়া উচিত, তাই আমি কেবল অনুভূমিক অক্ষের সাথে বিভিন্ন মানের মান চিহ্নিত করছি। তবে আমি কীভাবে জানব মাঝখানে কতটা রঙ আছে? আমি কোথায় রং করা বন্ধ করব?

চিত্র 9: চিহ্নিত সম্ভাবনা অনুপাত প্লট

শিক্ষক : এর কোন দৃ firm় নিয়ম নেই। এটি আমাদের কীভাবে আমাদের সিদ্ধান্তগুলি ব্যবহার করার পরিকল্পনা করে এবং সংশয়ীরা কতটা মারাত্মক তা নির্ভর করে। কিন্তু বিশ্রাম এবং কি আপনি সম্পন্ন করেছেন আমার মনে হয়: আপনি এখন বুঝতে পারি যে বড় সম্ভাবনা অনুপাত সঙ্গে ফলাফল প্রমাণ হয় জন্য বিকল্প এবং ছোট সম্ভাবনা অনুপাত সঙ্গে ফলাফল প্রমাণ হয় বিরুদ্ধে বিকল্প। আমি আপনাকে যা করতে বলব তা হ'ল এমন একটি অঞ্চলে রঙ করা যা সম্ভব হিসাবে ইনফার, নাল অনুমানের অধীনে ঘটে যাওয়ার একটি ছোট্ট সম্ভাবনা এবং বিকল্পগুলির অধীনে অপেক্ষাকৃত বড় সম্ভাবনা রয়েছে। আপনি রঙিন প্রথম চিত্রটিতে ফিরে গিয়ে আমাদের কথোপকথনের শুরুতেই আপনি নলের দুটি লেজে রঙিন করেছিলেন কারণ তারা ছিল "চরম"। তারা এখনও একটি ভাল কাজ করতে হবে?

3.03.0

চিত্র 10: উন্নত মার্কআপ

শিক্ষক : এটি কি উপস্থাপন করে?

শিক্ষার্থী : আমরা আপনাকে মূল হিস্টোগ্রামের অধীনে মাত্র 10% অঞ্চল আঁকতে বলতে শুরু করেছিলাম - এটি নাল বর্ণনা করে। সুতরাং এখন আমি সেই অঞ্চলে 10% আঁকলাম যেখানে বিকল্পধারার সম্ভাবনা বেশি দেখা যাচ্ছে। আমি মনে করি যে যখন একটি নতুন পরিমাপটি সেই অঞ্চলে হয়, তখন এটি আমাদের বলছে যে বিকল্পটি আমাদের বিশ্বাস করা উচিত।

শিক্ষক : এবং সন্দিপকের কীভাবে এটি করা উচিত?

ছাত্র : একজন সন্দেহবাদী কখনও ভুল স্বীকার করতে হয় না, তাই না? তবে আমি মনে করি তার বিশ্বাসটি কিছুটা নাড়া দেওয়া উচিত। সর্বোপরি, আমরা এটি ব্যবস্থা করেছিলাম যাতে যদিও একটি মাত্রা আমি সরিয়ে নেওয়া অঞ্চলের ভিতরে থাকতে পারে তবে নালটি সত্য হলে এটির কেবল সেখানে উপস্থিত হওয়ার 10% সম্ভাবনা রয়েছে। এবং বিকল্পটি সত্য হলে এটির উপস্থিতির আরও বড় সম্ভাবনা রয়েছে। আমি শুধু তোমাকে বলতে পারবো না কিভাবে , অনেক বড় সেই সুযোগ কারণ এটা কত বিজ্ঞানী যন্ত্রপাতি উন্নত উপর নির্ভর করবে। আমি কেবল জানি এটি আরও বড়। সুতরাং প্রমাণ সংশয়ীদের বিরুদ্ধে হবে।

শিক্ষক : ঠিক আছে। আপনার বোঝার সংক্ষিপ্তসারটি মনে করতে আপনি কি আপত্তি জানাতে পারেন যাতে আপনি যা শিখেছেন সে সম্পর্কে আমরা পুরোপুরি পরিষ্কার?

ছাত্র : আমি শিখেছি যে বিকল্প অনুমানকে নাল অনুমানের সাথে তুলনা করতে আমাদের তাদের হিস্টোগ্রামগুলি তুলনা করা উচিত। আমরা নলের ঘনত্ব দ্বারা বিকল্পগুলির ঘনত্বকে বিভক্ত করি: এটিই আপনি "সম্ভাবনা অনুপাত" বলেছিলেন। একটি ভাল পরীক্ষা করার জন্য, আমার 10% বা একটি সন্দেহজনককে ঝাঁকানোর জন্য পর্যাপ্ত পরিমাণের মতো একটি ছোট সংখ্যা বাছাই করা উচিত। তারপরে আমার এমন মানগুলি খুঁজে পাওয়া উচিত যেখানে সম্ভাবনা অনুপাত যতটা সম্ভব সর্বোচ্চ এবং 10% (বা যাই হোক না কেন) রঙ না হওয়া পর্যন্ত এগুলিতে রঙ করা উচিত।

শিক্ষক : আর আপনি এই রঙটি কীভাবে ব্যবহার করবেন?

শিক্ষার্থী : আপনি যেমন আমাকে আগের কথা মনে করিয়ে দিয়েছিলেন, রঙটি উল্লম্ব লাইনের মধ্যে থাকতে হবে। রঙের নীচে থাকা মানগুলি (অনুভূমিক অক্ষের উপরে) নাল অনুমানের বিরুদ্ধে প্রমাণ। অন্যান্য মান - ভাল, জড়িত সমস্ত হিস্টোগ্রামগুলিতে আরও বিশদ বিবরণ না নিয়ে তারা কী বোঝাতে পারে তা বলা শক্ত।

0.1

ছাত্র : আমি সেই অঞ্চলটির মধ্যেই শেষ রঙিন হয়েছি, তাই আমি মনে করি বিজ্ঞানী সম্ভবত সঠিক ছিলেন এবং যন্ত্রপাতিটি সত্যই উন্নত হয়েছিল।

শিক্ষক : একটি শেষ কথা। আপনার উপসংহারটি পরীক্ষার মানদণ্ড বা "আকার" হিসাবে 10% বাছাইয়ের উপর ভিত্তি করে ছিল। এর পরিবর্তে অনেক লোক 5% ব্যবহার করতে পছন্দ করেন। কেউ কেউ 1% পছন্দ করেন। আপনি তাদের কি বলতে পারেন?

00.10.050.10.080.1। তারা আমার মত একই সিদ্ধান্তে পৌঁছাবে না: তারা বলবে যে আসলে কোনও পরিবর্তন হয়েছে তার পর্যাপ্ত প্রমাণ নেই।

0.08

ছাত্র : আপনাকে ধন্যবাদ। আমি এখনও পুরোপুরি বুঝতে পেরেছি বলে আমি আত্মবিশ্বাসী নই, তবে আপনি আমাকে ভাবতে অনেক কিছু দিয়েছেন।

শিক্ষক : আপনি যদি আরও যেতে চান তবে নেইমন-পিয়ারসন লেমায় একবার দেখুন । আপনি সম্ভবত এটি এখন বুঝতে প্রস্তুত।


সংক্ষিপ্তসার

ztt=0.1

চিত্র 11: অঞ্চল হিসাবে পি-মান।

0t=0.1উপনিত. পি-মানটি নাল হিস্টোগ্রামের অধীনে ছায়াযুক্ত অঞ্চলের ক্ষেত্রফল: এটি সুযোগ, নালকে সত্য বলে ধরে নিলে, এমন একটি ফলাফল পর্যবেক্ষণ করার, যার সম্ভাবনা অনুপাত বড় আকারে নির্বিশেষে কোন বিকল্পটি ঘটেছে তা পর্যবেক্ষণ করার। বিশেষত, এই নির্মাণটি বিকল্প অনুমানের উপর অন্তরঙ্গভাবে নির্ভর করে। সম্ভাব্য বিকল্পগুলি উল্লেখ না করে এটি চালানো যায় না।


4
এটি অন্য জবাব সম্পর্কে আমার মন্তব্যটির সাথে দুর্দান্তভাবে মোকাবেলা করেছে, যে এই প্রশ্নের পূর্বের উত্তরগুলির কোনওটিই সাধারণভাবে শোনা যায়নি "বা এর চেয়ে বেশি চরম" একটি পি- মূল্যের দিকটিই মোকাবেলা করে নি। (যদিও "চা-পরীক্ষার" জবাব একটি ভাল নির্দিষ্ট উদাহরণ অন্তর্ভুক্ত করেছে।) "আরও চরম" অর্থ "বড়" বা "শূন্যের থেকে আরও" বিপরীত হতে পারে তা হাইলাইট করার জন্য এই উদাহরণটি ইচ্ছাকৃতভাবে নির্মিত হয়েছে বলে আমি বিশেষভাবে প্রশংসা করি।
সিলভারফিশ

4
H1H1

3
অনন্য হিসাবে সর্বদাই অন্তর্দৃষ্টিপূর্ণ, এই অবিশ্বাস্য সহায়ক উত্তর লিখতে সময় দেওয়ার জন্য আপনাকে ধন্যবাদ। আমি সত্যিই আশ্চর্য হয়েছি কেন পাঠ্যপুস্তক কখনই এমনভাবে লেখা হয় না যা স্পষ্টতা এবং স্বজ্ঞাততার এই স্তরের কাছাকাছি কোথাও অফার করে।
জেরেমি র‌্যাডক্লিফ

আমি মনে করি এই উদাহরণটির সম্ভাবনা সংজ্ঞায়িত করার একটি সংযোগটি উপকারী হতে পারে
বাক্সেক্স

1
@ বাক্স, একটি মন্তব্যে ব্যঙ্গাত্মক ব্যবহার করা বিপজ্জনক, কারণ সেখানে পর্যাপ্ত জায়গা নেই যে আমাদের বিনয়ের সাথে এবং মার্জিতভাবে তা করার অনুমতি দেয়। অতএব এটি মনে করা ভাল নয় যে কোনও মন্তব্য ব্যঙ্গাত্মক হচ্ছে যদি না এটি পরিষ্কারভাবে আপনাকে না বলে। কেবল ধরে নিন মন্তব্যগুলি আপনাকে সহায়তা করার উদ্দেশ্যে করা হয়েছে। আমি সরবরাহিত অনুসন্ধানে যদি আপনি কেবল প্রথম হিট অনুসরণ করেন তবে আমি মনে করি আপনার প্রশ্নের উত্তর দেওয়া হবে।
whuber

44

এই বিষয়টিকে স্পর্শ করার আগে, আমি সর্বদা নিশ্চিত হয়েছি যে শিক্ষার্থীরা শতকরা দশমিক, দশমিক, প্রতিকূলতা এবং ভগ্নাংশের মধ্যে চলতে খুশি happy তারা যদি এতে পুরোপুরি খুশি না হয় তবে তারা খুব দ্রুত বিভ্রান্ত হতে পারে।

আমি ফিশারের ক্লাসিক চা পরীক্ষার মাধ্যমে প্রথমবারের জন্য হাইপোথিসিস টেস্টিং (এবং তাই পি-মান এবং পরীক্ষার পরিসংখ্যান) ব্যাখ্যা করতে চাই। এর বেশ কয়েকটি কারণ রয়েছে:

(i) আমি মনে করি একটি পরীক্ষার মধ্য দিয়ে কাজ করা এবং শর্তগুলি সংজ্ঞায়িত করার সাথে সাথে আমরা আরও বুদ্ধিমান হয়ে উঠছি যে কেবল এই সমস্ত শর্তটি শুরু করার সাথে সংজ্ঞা দেওয়া হয়েছে। (ii) হাইপোথিসিস পরীক্ষার মূল পয়েন্টগুলি পেতে আপনাকে সম্ভাব্যতা বিতরণ, বক্ররেখার ক্ষেত্রগুলি ইত্যাদির উপর সুস্পষ্টভাবে নির্ভর করতে হবে না। (iii) এটি "যথাযথভাবে বিবেচনা করা ব্যক্তিদের তুলনায় বা তার চেয়ে বেশি চরম" এই হাস্যকর ধারণাটিকে মোটামুটি বুদ্ধিমান উপায়ে ব্যাখ্যা করে (iv) শিক্ষার্থীরা তারা যে বিষয়ে পড়াশোনা করছে তার ইতিহাস, উত্স এবং পিছনের গল্পটি বুঝতে এটি পছন্দ করে যেহেতু এটি আরও বাস্তব করে তোলে কিছু বিমূর্ত তত্ত্ব চেয়ে। (v) শিক্ষার্থীরা কোন শৃঙ্খলা বা বিষয় নিয়ে আসে তা বিবেচনাধীন নয়, তারা চায়ের উদাহরণের সাথে সম্পর্কিত হতে পারে (এনবি কিছু আন্তর্জাতিক শিক্ষার্থীদের দুধের সাথে চায়ের এই অদ্ভুত ব্রিটিশ প্রতিষ্ঠানটি নিয়ে অসুবিধা হয়।)

[দ্রষ্টব্য: আমি ডেনিস লিন্ডলির দুর্দান্ত গবেষণামূলক প্রবন্ধ "পরীক্ষামূলক ডেটার বিশ্লেষণ: চা ও ওয়াইনের প্রশংসা" থেকে এই ধারণাটি পেয়েছি যাতে তিনি দেখিয়েছেন কেন বায়েশিয়ান পদ্ধতিগুলি শাস্ত্রীয় পদ্ধতির চেয়ে উচ্চতর।]

পেছনের গল্পটি হ'ল মুরিয়েল ব্রিস্টল 1920 এর দশকে রোথামস্টেড এক্সপেরিমেন্টাল স্টেশনে এক কাপ চায়ের জন্য ফিশারের সাথে দেখা করে। ফিশার যখন দুধ শেষ রাখে তখন তিনি অভিযোগ করে বলেছিলেন যে দুধ প্রথমে (েলে দেওয়া হয়েছিল কিনা (বা শেষ) এবং তিনি আগেরটিকে পছন্দ করেন কিনা তাও সে বলতে পারত। এটি পরীক্ষা করার জন্য তিনি তাঁর ক্লাসিক চা পরীক্ষার নকশা করেছিলেন যেখানে মুরিয়েলকে এক কাপ চা কাপের সাথে উপস্থাপন করা হয়েছে এবং প্রথমে দুধটি কোনটি যুক্ত করেছে তা তাকে সনাক্ত করতে হবে। এটি ছয় জোড়া চা কাপের সাথে পুনরাবৃত্তি হয়। তার পছন্দগুলি হয় ডান (আর) বা ভুল (ডাব্লু) এবং তার ফলাফলগুলি: আরআরআরআরডাব্লু।

6

(ক) নাল অনুমান (মুরিয়েল অনুমান করছে) সত্য এবং ছোট সম্ভাবনার একটি ঘটনা ঘটেছে বা,

(খ) নাল অনুমানটি মিথ্যা এবং মুরিয়ালের বৈষম্যমূলক ক্ষমতা রয়েছে।

পি-মান (বা সম্ভাব্যতা মান) হ'ল নাল অনুমানটি সত্য হিসাবে এই ফলাফল (আরআরআরআরআরডাব্লু) পর্যবেক্ষণ করার সম্ভাবনা - এটি উপরের (ক) এ উল্লিখিত ছোট সম্ভাবনা। এই উদাহরণে এটি 0.016। যেহেতু ছোট সম্ভাব্যতার সাথে ইভেন্টগুলি খুব কমই ঘটে (সংজ্ঞা অনুসারে) পরিস্থিতি (খ) পরিস্থিতি (ক) এর চেয়ে কী ঘটেছে তার আরও পছন্দনীয় ব্যাখ্যা হতে পারে। যখন আমরা নাল অনুমানকে প্রত্যাখ্যান করি আমরা আসলে বিপরীত অনুমানকে গ্রহণ করি যা আমরা বিকল্প অনুমান বলে আছি। এই উদাহরণে, মুরিয়ালের বৈষম্যমূলক ক্ষমতা হ'ল বিকল্প অনুমান।

একটি গুরুত্বপূর্ণ বিবেচনা হ'ল আমরা "ক্ষুদ্র" সম্ভাবনাটি কী হিসাবে শ্রেণিবদ্ধ করি? যে কাট অফ পয়েন্টে আমরা বলতে চাইছি যে কোনও ঘটনার সম্ভাবনা নেই? স্ট্যান্ডার্ড বেঞ্চমার্কটি 5% (0.05) এবং এটিকে তাত্পর্য স্তর বলা হয়। যখন পি-মানটি তাত্পর্য স্তরের চেয়ে ছোট হয় তখন আমরা নাল অনুমানটিকে মিথ্যা বলে প্রত্যাখ্যান করি এবং আমাদের বিকল্প অনুমানটি গ্রহণ করি। যখন প-মানটি তাত্পর্য স্তরের চেয়ে ছোট হয় তখন ফলাফলটি "তাৎপর্যপূর্ণ" দাবি করা সাধারণ ধারণা, যখন আমরা নাল হাইপোথিসিসটি দিয়ে যা দেখলাম তার সম্ভাবনাটি আমাদের কাট অফের চেয়ে কম। এটি পরিষ্কার হওয়া জরুরী যে 5% ব্যবহার করা সম্পূর্ণরূপে বিষয়গত (যেমন অন্যান্য সাধারণ তাত্পর্য স্তর 1% এবং 10% ব্যবহার করে)।

ফিশার বুঝতে পেরেছিল যে এটি কাজ করে না; একটি ভুল যুগল সহ প্রতিটি সম্ভাব্য ফলাফল বৈষম্যমূলক শক্তির সমান পরামর্শদাতা ছিল। উপরে অবস্থার জন্য (ক) প্রাসঙ্গিক সম্ভাবনা সুতরাং 6 (0.5) ^ 6 = 0.094 (বা 6/64) যা এখন 5% এর তাত্পর্যপূর্ণ পর্যায়ে তাত্পর্যপূর্ণ নয় । এই ফিশারকে কাটিয়ে উঠতে যুক্তি দিয়েছিলেন যে 6 টির মধ্যে 1 টি ত্রুটি যদি বৈষম্যমূলক শক্তির প্রমাণ হিসাবে বিবেচনা করা হয় তবে কোনও ত্রুটি বা ফলাফলগুলি নেই যে পি-ভ্যালু গণনা করার সময় পর্যবেক্ষণকৃত ব্যক্তির চেয়ে বৈষম্যমূলক শক্তিগুলিকে আরও দৃ strongly়ভাবে নির্দেশ করা উচিত। এর ফলে যুক্তিতে নিম্নলিখিত সংশোধনীর ফলস্বরূপ হয়:

(ক) নাল অনুমান (মুরিয়েল অনুমান করছে) সত্য এবং ঘটনার সম্ভাবনা যতটা কম দেখা গেছে তার চেয়ে চূড়ান্ত হিসাবে বা আরও

(খ) নাল অনুমানটি মিথ্যা এবং মুরিয়ালের বৈষম্যমূলক ক্ষমতা রয়েছে।

আমাদের চা পরীক্ষায় ফিরে যান এবং আমরা দেখতে পাই যে এই সেট-আপের অধীনে পি-মানটি 7 (0.5) ^ 6 = 0.109 যা এখনও 5% থ্রেশহোল্ডে তাত্পর্যপূর্ণ নয়।

আমি তখন ছাত্রদের আরও কিছু উদাহরণ যেমন মুদ্রা টসিং দিয়ে মুদ্রা ন্যায্য কিনা তা নির্ধারণের জন্য কাজ করতে পারি। এই নাল / বিকল্প অনুমান, পি-মান এবং তাত্পর্য স্তরগুলির ধারণাগুলি ড্রিল করে। তারপরে আমরা একটি অবিচ্ছিন্ন পরিবর্তনশীল ক্ষেত্রে চলে যাই এবং একটি পরীক্ষা-পরিসংখ্যানের ধারণাটি প্রবর্তন করি। যেহেতু আমরা ইতিমধ্যে সাধারণ বিতরণ, মানক সাধারণ বিতরণ এবং গভীরতার সাথে জেড-ট্রান্সফর্মেশনটি coveredেকে রেখেছি এটি বেশ কয়েকটি ধারণাকে একসাথে বল্ট করার বিষয় মাত্র।

পাশাপাশি পরীক্ষা-পরিসংখ্যান গণনা করার পাশাপাশি, পি-মানগুলি সিদ্ধান্ত নেওয়ার (তাৎপর্যপূর্ণ / তাৎপর্যপূর্ণ নয়) আমি শিক্ষার্থীদের নিখোঁজ ফাঁকা গেমটি পূরণের জন্য প্রকাশিত কাগজপত্রের মাধ্যমে কাজ করতে পাই।


2
আমি জানি আমি কিছুটা পুরানো থ্রেডটি পুনরুদ্ধার করছি, তবে এটি এখানে যায় ... আমি আপনার উত্তরটি সত্যই উপভোগ করছি, তবে এতে টি-মান অংশটি মিস করছি :( আপনি কি দয়া করে আপনার প্রদত্ত উদাহরণগুলি এ সম্পর্কে কথা বলতে চান? টি-পরীক্ষার অংশ সম্পর্কে কেউ উত্তর
দেয়নি

@ সোসি এটি সম্ভবত কারণ টি-মানগুলির চেয়ে পি-মানগুলি বেশি সাধারণ। এটি গাড়ি সম্পর্কে এবং তারপরে ফোর্ড ফিয়েস্টার ব্রেকগুলির বিষয়ে প্রশ্ন জিজ্ঞাসার মতো।
অনুমান

2
ppp

27

মৌখিক ব্যাখ্যা বা গণনার পরিমাণের সত্যই আমাকে পি-ভ্যালুগুলি কী বলে অন্ত্র স্তরে বুঝতে সাহায্য করেছিল , তবে আমি অনুকরণের সাথে জড়িত একটি কোর্সটি গ্রহণ করার পরে এটি সত্যিই আমার জন্য ফোকাসে ফেলেছিল। এটি আমাকে নাল অনুমানের দ্বারা উত্পন্ন ডেটা দেখতে এবং উপায়গুলি / ইত্যাদি প্লট করার ক্ষমতা দিয়েছে actually সিমুলেটেড নমুনাগুলির, তারপরে দেখুন যেখানে আমার নমুনার পরিসংখ্যান সেই বিতরণে পড়েছে।

আমি মনে করি এর মূল সুবিধাটি হ'ল এটি শিক্ষার্থীদের এক মিনিটের জন্য গণিত এবং পরীক্ষার পরিসংখ্যান বিতরণগুলি ভুলে যেতে এবং হাতে ধারণাগুলিতে ফোকাস করতে দেয়। মঞ্জুর, এটি প্রয়োজনীয় ছিল যে আমি কীভাবে সেই জিনিসগুলি সিমুলেট করতে শিখি , যা শিক্ষার্থীদের পুরোপুরি আলাদা সেটগুলির জন্য সমস্যার সৃষ্টি করবে। তবে এটি আমার পক্ষে কাজ করেছিল এবং আমি অনেক সাফল্যের সাথে অন্যদের কাছে পরিসংখ্যান ব্যাখ্যা করতে সহায়তা করার জন্য অসংখ্য সময় সিমুলেশন ব্যবহার করেছি (উদাহরণস্বরূপ, "এটি আপনার ডেটা দেখে মনে হচ্ছে; পোইসন বিতরণটি এটিকে আবৃত দেখায়। আপনি কি নিশ্চিত যে আপনি চান?" পইসন রিগ্রেশন করতে? "))

এটি আপনার উত্থাপিত প্রশ্নগুলির সঠিক উত্তর দেয় না, তবে আমার পক্ষে কমপক্ষে এগুলি তুচ্ছ করে তোলে।


10
আমি এটি ব্যাখ্যা করার জন্য সিমুলেশন ব্যবহার সম্পর্কে আন্তরিকভাবে একমত। তবে শেষে উদাহরণটির জন্য একটি ছোট্ট নোট: আমি দেখতে পেয়েছি যে লোকেরা (কেবলমাত্র শিক্ষার্থীরা নয়) কোনও নির্দিষ্ট বিতরণীয় অনুমানের জন্য যেমন, পোয়েসনকে, সামান্য পোয়েসন বিতরণ করা এবং শর্তসাপেক্ষে পোষন বিতরণ করার মধ্যে পার্থক্য করা কঠিন বলে মনে হয় । যেহেতু কেবলমাত্র পরেরটি একটি রিগ্রেশন মডেলটির জন্য গুরুত্বপূর্ণ, তাই নির্ভরযোগ্য পরিবর্তনশীল মানগুলির একগুচ্ছ যে পোয়েসন নয় তা উদ্বেগের কারণ হওয়ার প্রয়োজন নেই।
কনজুগেটপায়ার

1
আমাকে স্বীকার করতে হবে যে আমি এটি জানতাম না। আমি আপনার সদস্যতার গত কয়েক দিন ধরে এই সাইটের চারপাশে আপনার মন্তব্যগুলির সত্যই প্রশংসা করেছি - আশা করি আপনি আশেপাশে থাকবেন।
ম্যাট পার্কার 18

@ ম্যাটপার্কার কি বোঝেন বিকাশের জন্য সিমুলেশন ব্যবহারের দিকে মনোনিবেশ করা কোনও শেখার সংস্থান সম্পর্কে জানেন? বা এটি কি কিছু পাইথন / আর স্ক্রিপ্ট একসাথে রাখা এবং একগুচ্ছ পরীক্ষা চালানোর ঘটনা?
বাক্সেক্স

1
@ বাক্স দ্য [ড্যানিয়েল কুনিনের তত্ত্বের ওয়েবসাইট দেখে] (শিক্ষার্থী.আরবান.এডু / সিসিঙ-থিওরি /) এর জন্য কিছু আকর্ষণীয় সরঞ্জাম রয়েছে তবে এটি এখনও নির্মাণাধীন। নইলে, হ্যাঁ, আমি বেশিরভাগই সিমুলেশনের জন্য আর এর অন্তর্নির্মিত সরঞ্জামগুলি নিয়ে পরীক্ষা-নিরীক্ষা করেছি - এগুলি ব্যবহার করে কোনও পদ্ধতি কীভাবে কাজ করে তা আমার কাছে প্রমাণ করতে বা কোনও ভবিষ্যদ্বাণীকে এলোমেলো পরিবর্তনশীল দ্বারা প্রতিস্থাপন করা হয় তবে কী ঘটবে তা দেখার জন্য। দুঃখিত, আমি আশা করি আমি এর জন্য আরও ভাল উত্স সম্পর্কে জানতাম!
ম্যাট পার্কার

@ ম্যাটপর্কার দুর্দান্ত ধন্যবাদ হ্যাঁ - এর মধ্যে একটি মুরগি এবং ডিমের বিট, আপনি যে পরীক্ষাগুলি তৈরি করতে চান (আমি ধরে নিই?) তাদের লেখার জন্য কমপক্ষে পর্যাপ্ত পরিমাণে পাওয়া দরকার। যদিও কোনও উদ্বেগ নেই ..... আপনি যে সাইটটি যুক্ত করেছেন ঠিক তা যাচাই করেছেন, এটি দুর্দান্ত, ধন্যবাদ
বেক্সেক্স

16

পি-মানটির একটি দুর্দান্ত সংজ্ঞা হ'ল "নাল অনুমানটি সত্য বলে ধরে নিরূপিত যতটা গণনা করা হয় কমপক্ষে একটি পরীক্ষার পরিসংখ্যান পর্যবেক্ষণের সম্ভাবনা"।

সমস্যাটি হ'ল এর জন্য "পরীক্ষার পরিসংখ্যান" এবং "নাল হাইপোথিসিস" বোঝার প্রয়োজন। তবে, এটি অতিক্রম করা সহজ। যদি নাল অনুমানটি সত্য হয়, সাধারণত "জনসংখ্যা থেকে প্যারামিটার A জনসংখ্যার বি থেকে প্যারামিটার সমান হয়" এর মতো কিছু হয় এবং আপনি সেই পরামিতিগুলি অনুমান করার জন্য পরিসংখ্যান গণনা করেন, পরীক্ষার পরিসংখ্যান দেখার সম্ভাবনা কী বলে যে, "তারা এই বিভিন্ন "?

উদাহরণস্বরূপ, মুদ্রাটি যদি সুষ্ঠু হয় তবে আমি 100 টি টস এর মধ্যে 60 টি মাথা দেখতে পাব তার সম্ভাবনা কত? এটি নাল অনুমানটি পরীক্ষা করছে, "মুদ্রাটি ন্যায্য", বা "পি = .5" যেখানে পি প্রধানের সম্ভাবনা।

সেক্ষেত্রে পরীক্ষার পরিসংখ্যানগুলি প্রধানের সংখ্যা হবে।

এখন, আমি ধরে নিলাম যে আপনি "টি-মান" বলছেন তা একটি জেনেরিক "পরীক্ষার পরিসংখ্যান", "টি বিতরণ" থেকে কোনও মান নয়। এগুলি একই জিনিস নয় এবং "টি-মান" শব্দটি বহুল ব্যবহৃত হয় না এবং এটি বিভ্রান্তিকর হতে পারে।

আপনি যেটিকে "টি-মান" বলছেন তা সম্ভবত আমি "পরীক্ষার পরিসংখ্যান" বলছি। একটি পি-মান গণনা করার জন্য (মনে রাখবেন এটি কেবলমাত্র একটি সম্ভাবনা) আপনার একটি বিতরণ এবং সেই বিতরণে প্লাগ করার জন্য একটি মান দরকার যা সম্ভাব্যতা ফিরিয়ে দেবে। একবার আপনি এটি করেন, আপনি ফিরে আসার সম্ভাবনাটি হ'ল আপনার পি-মান। আপনি দেখতে পাচ্ছেন যে এগুলি সম্পর্কিত কারণ একই বিতরণের অধীনে, বিভিন্ন পরীক্ষা-পরিসংখ্যান বিভিন্ন পি-মানগুলি ফিরিয়ে দিতে চলেছে। আরও চরম পরীক্ষা-পরিসংখ্যানগুলি নাল হাইপোথিসিসটি মিথ্যা বলে বৃহত্তর ইঙ্গিত দিয়ে নিম্ন পি-মানগুলি ফিরিয়ে দেবে।

আমি এখানে একতরফা এবং দ্বিমুখী পি-মানগুলির বিষয়টি উপেক্ষা করেছি।


11

কল্পনা করুন আপনার কাছে 900 টি কালো মার্বেল এবং 100 টি সাদা মার্বেল রয়েছে এমন ব্যাগ রয়েছে, অর্থাৎ মার্বেলগুলির 10% সাদা। এখন কল্পনা করুন যে আপনি 1 মার্বেল বের করেছেন, এটি দেখুন এবং এর রঙটি রেকর্ড করুন, অন্যটি বের করুন, এর রঙ রেকর্ড করুন .. এবং এটি 100 বার করুন। এই প্রক্রিয়াটির শেষে আপনার কাছে সাদা মার্বেলগুলির জন্য একটি সংখ্যা থাকবে যা আদর্শভাবে আমরা 10 হতে 10 বা 10% হওয়ার প্রত্যাশা করব তবে বাস্তবে 8 বা 13 টি হতে পারে বা এলোমেলোতার কারণে যা কিছু হতে পারে। আপনি যদি 100 টি মার্বেল প্রত্যাহারের এই পরীক্ষাটি বহুবার এবং বহুবার পুনরাবৃত্তি করেন এবং তারপরে পরীক্ষায় প্রতি আঁকা শ্বেত মার্বেলের সংখ্যার একটি হিস্টোগ্রাম প্লট করেন তবে আপনি দেখতে পাবেন যে আপনার প্রায় 10 টি কেন্দ্র বেল কার্ভ থাকবে।

এটি আপনার 10% অনুমানকে প্রতিনিধিত্ব করে: 1000 মার্বেলযুক্ত কোনও ব্যাগ যার মধ্যে 10% সাদা আছে, আপনি যদি এলোমেলোভাবে 100 মার্বেল বের করেন তবে আপনি নির্বাচনের ক্ষেত্রে 10 টি সাদা মার্বেল পাবেন, 4 বা তার মতো গ্রহণ করুন। পি-মানটি এই "4 বা ততোধিক দিন বা দিন" এ সম্পর্কে is এর আগে তৈরি বেল বক্ররেখা উল্লেখ করে আপনি নির্ধারণ করতে পারেন যে 5% এরও কম সময়ের মধ্যে আপনি 5 বা তার চেয়ে কম সাদা মার্বেল পাবেন এবং আরও <5% সময় 15 বা ততোধিক সাদা মার্বেল অর্থাৎ> 90% এর জন্য খায় আপনার 100 মার্বেল নির্বাচনের সময় 6 থেকে 14 টি সাদা মার্বেল সহ অন্তর্ভুক্ত থাকবে।

এখন ধরে নেওয়া যে কেউ এর মধ্যে একটি অজানা সংখ্যক সাদা মার্বেল সহ 1000 মার্বেলের একটি ব্যাগ ছুঁড়ে ফেলছে, আমাদের কাছে এই প্রশ্নের উত্তর দেওয়ার সরঞ্জাম রয়েছে

i) 100 টিরও কম সাদা মার্বেল রয়েছে?

ii) 100 টিরও বেশি সাদা মার্বেল রয়েছে?

iii) ব্যাগে কি 100 টি মার্বেল রয়েছে?

কেবল ব্যাগ থেকে 100 টি মার্বেল বের করুন এবং এই নমুনার মধ্যে কতটি সাদা তা গণনা করুন।

ক) নমুনায় 6 থেকে 14 সাদা থাকলে আপনি এই অনুমানটিকে প্রত্যাখ্যান করতে পারবেন না যে ব্যাগে 100 টি সাদা মার্বেল রয়েছে এবং 6 থেকে 14 এর জন্য সম্পর্কিত পি-মানগুলি> 0.05 হবে।

খ) নমুনায় যদি 5 বা তারও কম সাদা হয় তবে আপনি এই অনুমানটিকে প্রত্যাখ্যান করতে পারবেন যে ব্যাগে 100 টি সাদা মার্বেল রয়েছে এবং 5 বা তার কম সংখ্যার জন্য পি-মানগুলি <0.05 হবে। আপনি ব্যাগটিতে <10% সাদা মার্বেল থাকবে বলে আশা করবেন।

গ) নমুনায় যদি 15 বা তার বেশি সাদা হয় তবে আপনি এই অনুমানটিকে প্রত্যাখ্যান করতে পারেন যে ব্যাগে 100 টি সাদা মার্বেল রয়েছে এবং 15 বা তার বেশি সম্পর্কিত পি-মানগুলি <0.05 হবে। আপনি ব্যাগটি> 10% সাদা মার্বেল রাখবেন বলে আশা করবেন।

জবাবে বাল্টিমার্কের মন্তব্যে

উপরের উদাহরণটি দেওয়া, একটি আনুমানিক রয়েছে: -

৫ টি সাদা বল বা তার চেয়ে কম প্রাপ্তির সম্ভাবনা ৪.৮%

4 বা তারও কম সংখ্যার 1.85% সুযোগ

3 বা তার কমের 0.55% সম্ভাবনা

২ বা তার কমের 0.1% সম্ভাবনা

15 বা ততোধিক সম্ভাবনার 6.25% সুযোগ

16 বা ততোধিকের 3.25% সুযোগ

১ 17 বা তারও বেশি 1.5% সম্ভাবনা

18 বা তারও বেশি 0.65% সুযোগ

19 বা তারও বেশি 0.25% সুযোগ

20 বা তারও বেশি 0.1% সুযোগ

২১ বা তারও বেশি 0.05% সুযোগ

এই সংখ্যাগুলি আরে চালিত একটি সাধারণ মন্টি কার্লো রুটিন এবং নমুনা বিতরণের ফলস্বরূপ কোয়ান্টাইলগুলি দ্বারা উত্পন্ন একটি অভিজ্ঞতাগত বিতরণ থেকে অনুমান করা হয়েছিল।

মূল প্রশ্নের উত্তরের উদ্দেশ্যে, ধরুন আপনি 5 টি সাদা বল আঁকেন, কেবলমাত্র প্রায় 4.8% সম্ভাবনা রয়েছে যে 1000 মার্বেল ব্যাগে যদি সত্যিই 10% সাদা বল থাকে তবে আপনি 100 এর নমুনায় কেবল 5 সাদা সাদা টানবেন। এটি এপি মান <0.05 এর সমান। আপনি এখন নির্বাচন করতে হবে

i) ব্যাগটিতে সত্যিই 10% সাদা বল রয়েছে এবং আমি খুব কম অঙ্কিত করতে "দুর্ভাগ্য" হয়েছি

অথবা

ii) আমি এতগুলি সাদা বল টেনেছি যে সেখানে সত্যিই 10% সাদা বল থাকতে পারে না (10% সাদা বলের অনুমানটি প্রত্যাখ্যান করুন)


প্রথমত, এটি কেবলমাত্র একটি বড় উদাহরণ এবং পি-ভ্যালু এবং পরীক্ষা-পরিসংখ্যানের ধারণাটি সত্যই ব্যাখ্যা করে না। দ্বিতীয়ত, আপনি কেবল দাবি করছেন যে যদি আপনি 5 টিরও কম বা 15 টিরও বেশি সাদা মার্বেল পান তবে আপনি নাল অনুমানকে প্রত্যাখ্যান করবেন। আপনার বিতরণটি কী যে আপনি সেইগুলি সম্ভাবনাগুলি গণনা করছেন? এটি একটি সাধারণ ডিস্টের সাথে প্রায় অনুমান করা যায়। 3 এর মানক বিচ্যুতি সহ 10 এ কেন্দ্রিক with আপনার প্রত্যাখ্যানের মানদণ্ডটি যথেষ্ট পর্যাপ্ত নয়।
বাল্টিমার্ক

আমি সম্মত হব যে এটি কেবল একটি উদাহরণ, এবং আমি সত্য যে আমি উদাহরণস্বরূপ উদ্দেশ্যে কেবল বাতাসের বাইরে 5 এবং 15 নম্বর পছন্দ করেছি। আমার যখন সময় থাকবে তখন আমি একটি দ্বিতীয় উত্তর পোস্ট করব, যা আমি আশা করি আরও সম্পূর্ণ হয়ে উঠবে।
ব্যাবেলপ্রুডিংডার

10

পি-ভ্যালু আপনাকে যা বলে না তা হ'ল নাল অনুমানটি সত্য হওয়ার সম্ভাবনা কতটা সম্ভবত। প্রচলিত (ফিশার) তাত্পর্য পরীক্ষার কাঠামোর অধীনে আমরা প্রথমে নাল অনুমানটি সত্য বলে ধরে নেওয়া তথ্য পর্যালোচনা করার সম্ভাবনাটি গণনা করি, এটি পি-মান। এটি নাল অনুমানটি ধরে নেওয়া তত্ক্ষণাত যুক্তিসঙ্গত বলে মনে হয় যদি নাল অনুমানের অধীনে ডেটা পর্যবেক্ষণের যথেষ্ট সম্ভাবনা না থাকে তবে সম্ভবত এটি মিথ্যা। এটি সম্পূর্ণ যুক্তিসঙ্গত। পরিসংখ্যানবিদরা ট্রেন্ডিশনালি ট্রান্সডোলেশন ব্যবহার করেন এবং "95% তাত্পর্যপূর্ণ স্তরের নাল অনুমানকে প্রত্যাখ্যান করুন" যদি (1 - পি)> 0.95; তবে এটি কেবল একটি সম্মেলন যা অনুশীলনে যুক্তিসঙ্গত প্রমাণিত হয়েছে - এর অর্থ এই নয় যে নাল অনুমানটি মিথ্যা বলে এর 5% এরও কম সম্ভাবনা রয়েছে (এবং তাই বিকল্প অনুমানটি সত্য যে 95% এর সম্ভাবনা রয়েছে)।

একটি ফাংশন চিত্র (f) চিত্রায়ন করা যা বিকল্প অনুমানটি সত্য হওয়ার সম্ভাবনাটির উপরে পি-মানটিকে মানচিত্র করে। এটি যুক্তিযুক্ত যুক্তিযুক্ত হবে যে এই ফাংশনটি কঠোরভাবে হ্রাস পাচ্ছে (যেমন নাল অনুমানের অধীনে পর্যবেক্ষণগুলি যতটা সম্ভব সম্ভাব্য বিকল্প অনুমানটি কম সত্য), এবং এটি 0 এবং 1 এর মধ্যে মান দেয় (যেমন এটি একটি অনুমান দেয়) সম্ভাবনা) যাইহোক, এফ () সম্পর্কে আমরা কেবল এটিই জানি, সুতরাং p এবং সম্ভাবনার মধ্যে একটি বিকল্প রয়েছে যে বিকল্প অনুমানটি সত্য হলেও এটি অবাস্তব নয়। এর অর্থ আমরা নাল এবং অল্টারনেটভ অনুমানের কার্যকারিতা সম্পর্কে পরিমাণগত বিবৃতি দিতে পি-মান ব্যবহার করতে পারি না।

ক্যাভেট লেক্টর: কোনও অনুমানটি সত্য হওয়ার সম্ভাবনা সম্পর্কে কথা বলা আসলেই ঘনত্ববাদী কাঠামোর মধ্যে নেই, কারণ এটি কোনও এলোমেলো পরিবর্তনশীল নয় - এটি হয় সত্য বা এটিও নয়। সুতরাং যেখানে আমি একটি অনুমানের সত্যতার সম্ভাবনার কথা বলেছি সেখানে আমি স্পষ্টভাবে একটি বায়সিয়ান ব্যাখ্যায় স্থানান্তরিত করেছি। বায়েশিয়ান এবং ঘন ঘনবাদী মিশ্রিত করা ভুল, তবে আমরা যা করতে চাই তা হ'ল অনুমানের আপেক্ষিক কলুষতা / সম্ভাবনার এক পরিমাণগত ইঙ্গিত হিসাবে সর্বদা প্রলোভন রয়েছে। তবে এটি পি-মানটি সরবরাহ করে না।


7

পরিসংখ্যানগুলিতে আপনি কখনই কিছু একেবারে নির্দিষ্ট বলা যায় না, সুতরাং পরিসংখ্যানবিদরা অনুমানটি সত্য কিনা তা নির্ধারণের জন্য আরও একটি পদ্ধতি ব্যবহার করেন। তারা ডেটা দ্বারা সমর্থিত নয় এমন সমস্ত অন্যান্য অনুমানকে প্রত্যাখ্যান করার চেষ্টা করে।

এটি করার জন্য, পরিসংখ্যান পরীক্ষায় নাল অনুমান এবং একটি বিকল্প অনুমান থাকে hypot একটি পরিসংখ্যান পরীক্ষা থেকে রিপোর্ট করা পি-মান হ'ল নাল অনুমানটি সঠিক ছিল যে ফলাফলের সম্ভাবনা। এজন্য আমরা ছোট পি-মান চাই। তারা যত ছোট, নাল অনুমানটি সঠিক থাকলে ফলাফল কম হবে। যদি পি-মানটি যথেষ্ট পরিমাণে ছোট হয় (যেমন, নাল অনুমানটি সঠিক ছিল তবে ফলাফলটি হওয়া খুব সম্ভব নয়), তবে নাল অনুমানটি প্রত্যাখ্যান করা হয়।

এই ফ্যাশনে, নাল হাইপোথেসিসগুলি তৈরি করা যায় এবং পরে প্রত্যাখ্যান করা যায়। নাল হাইপোথিসিসটি যদি প্রত্যাখ্যান করা হয় তবে আপনি বিকল্প অনুমানটিকে সর্বোত্তম ব্যাখ্যা হিসাবে গ্রহণ করেন। শুধু মনে রাখবেন যে বিকল্প অনুমানটি কখনই নিশ্চিত নয়, যেহেতু নাল অনুমানটি সম্ভাবনামত ফলাফল তৈরি করতে পারে।


Pr(Tt|H0)Pr(T=t|H0)

5

আমি পুরানো বিষয়টিকে পুনরুদ্ধার করতে কিছুটা স্বতন্ত্র, তবে আমি এখান থেকে লাফিয়েছি , তাই লিঙ্কটিতে প্রশ্নের প্রতিক্রিয়া হিসাবে এটি পোস্ট করছি।

পি-ভ্যালু একটি কংক্রিট পদ, ভুল বোঝাবুঝির কোনও জায়গা নেই। তবে, এটি একরকম রহস্যময় যে পি-ভ্যালু সংজ্ঞার বহিরাগত অনুবাদগুলি বিভিন্ন ধরণের ভুল ব্যাখ্যা করে। আমি মনে করি সমস্যার মূলটি "নাল হাইপোথিসিসের কমপক্ষে বিরূপ" বা "আপনার নমুনা ডেটার মধ্যে কমপক্ষে চরম" ইত্যাদি বাক্যাংশের ব্যবহারে রয়েছে in

উদাহরণস্বরূপ, উইকিপিডিয়া বলে

... পি-মান হ'ল নাল অনুমানটি আসলে সত্য হলে পর্যবেক্ষণের নমুনা ফলাফল (বা আরও চরম ফলাফল) প্রাপ্তির সম্ভাবনা।

p

আমি মনে করি পরোক্ষ বক্তৃতা আইনের মতো কিছুতে "আরও চরম ফলাফল" রেখে দেওয়া ভাল । সুতরাং, আমার গ্রহণ করা হয়

পি-ভ্যালু হ'ল নকল অনুমানটি সত্য যেখানে আপনি "কাল্পনিক জগতে" যা দেখেন তা দেখার সম্ভাবনা।

xμ0=20N(20,1)

x
#[1] 20.82600 19.30229 18.74753 18.99071 20.14312 16.76647
#[7] 18.94962 17.99331 19.22598 18.68633

t0=nX¯μ0s

sqrt(10) * (mean(x) - 20) / sd(x)  
#-2.974405

|t0|t0t(9)

pvalue=Pr(|t0|2.97)=0.01559054
2*(1 - pt(2.974405, 9))
#[1] 0.01559054

যেহেতু পি-মানটি ছোট, xতাই অনুমান করা যায় না যে নমুনাটি অনুমান করা বিশ্বে আঁকানো হত। অতএব, আমরা উপসংহারে পৌঁছেছি যে অনুমান করা পৃথিবীটি আসলে আসল বিশ্ব ছিল এটি খুব সম্ভব নয়।


2
+1, কিন্তু যখন আপনি "আপনি যা দেখছেন তা দেখার সম্ভাবনা" লিখেন এবং "আরও চরম" অংশটি বাদ দিলে এই বাক্যটি কঠোরভাবে মিথ্যা বলা হয় (এবং সম্ভবত বিভ্রান্তিকর হলেও, সম্ভবত কম বিভ্রান্তিকর)। আপনি যা দেখছেন তা দেখার সম্ভাবনা নেই (এটি সাধারণত শূন্য)। আপনি "বা আরও চরম" কী দেখছেন তা দেখার সম্ভাবনা। যদিও এটি অনেকের কাছে বিভ্রান্তিকর বিষয় হতে পারে তবে এটি এখনও গুরুত্বপূর্ণ (এবং এই "আরও চরম" শব্দের পিছনে লুকিয়ে থাকা সাবজেক্টিভিটির ডিগ্রি সম্পর্কে অন্তহীনভাবে তর্ক করতে পারে)।
অ্যামিবা

@ অ্যামিবা আমি ভেবেছিলাম, যখন পর্যাপ্ত উদাহরণ সরবরাহ করা হয়, এটি "পর্যবেক্ষণের নমুনা ফলাফল (বা আরও চরম ফলাফল) প্রাপ্তির জন্য প্রক্সি হিসাবে কাজ করতে পারে"। হতে পারে, আরও ভাল শব্দটির প্রয়োজন হয়।
খাসা

1
আমি @ অ্যামিবার মতো একই পর্যবেক্ষণ করতে যাচ্ছিলাম; "বা আরও চরম" অংশটি শিক্ষার্থীর উচ্চতা এবং চা পার্টির জবাবগুলিতে উদাহরণ সহ ভালভাবে পরিচালনা করা হয়, তবে আমি মনে করি না যে এই থ্রেডের কোনও উত্তরই এর স্পষ্ট সাধারণ ব্যাখ্যা পেয়েছে , বিশেষত এমন একটি যা বিভিন্ন বিকল্প অনুমানকে আবৃত করে। আমি এই উত্তরের সাথে একমত হই না যে "বা ততোধিক চরম" অংশটি অনেক শিক্ষার্থীর কাছে ধারণামূলক স্টিকিং পয়েন্ট।
সিলভারফিশ

@ সিলভারফিশ: এবং কেবল শিক্ষার্থীরা নয়। বায়েশিয়ান-বনাম-ঘন ঘন ঘন ঘন ঘন ঘনতান্ত্রিকদের আমি কতটা পড়েছি যে এই "আরও চরম" বিটের সাবজেক্টিভিটি / অবজেক্টিভিটি ইস্যু নিয়ে আলোচনা করে!
অ্যামিবা

1
@ সিলভার আমি আপনার সমালোচনার সাথে একমত এবং এটিকে সমাধান করার চেষ্টা করে একটি উত্তর পোস্ট করেছি। "বা আরও চরম" বিষয়টি খুব জটিল।
শুক্র

4

আমি নিম্নলিখিত ক্রমে আপনি ধারণাগুলি ব্যাখ্যা করে এমন ক্রমটি অনুসরণ করা সহায়ক বলে মনে করি: (1) জেড স্কোরের উপরে এবং নীচে একটি সাধারণ বক্ররেখা ধরে জেড স্কোর এবং অনুপাত। (২) একটি নমুনা বিতরণের ধারণা এবং প্রদত্ত নমুনার জন্য জেড স্কোর বলতে যখন জনসংখ্যার মান বিচ্যুতি জানা যায় (এবং ততক্ষণে একটি নমুনা জেড পরীক্ষা) (3) এক-নমুনা টি-পরীক্ষা এবং সম্ভাবনার সম্ভাবনা নমুনার অর্থ যখন জনসংখ্যার মান বিচ্যুতি অজানা (কোনও নির্দিষ্ট শিল্প পরিসংখ্যানবিদদের গোপন পরিচয় এবং গিনেস কেন স্ট্যাটিস্টিক্সের জন্য ভাল। (4) দ্বি-নমুনা টি-পরীক্ষা এবং গড় পার্থক্যের নমুনা বিতরণ। প্রারম্ভিক শিক্ষার্থীরা যে স্বাচ্ছন্দ্যের সাথে টি-টেস্টটি উপলব্ধি করতে পেরেছেন, এই বিষয়ের প্রস্তুতির ভিত্তিতে যে ভিত্তি রয়েছে তার সাথে অনেক কিছুই রয়েছে।

/ * আতঙ্কিত শিক্ষার্থীদের প্রশিক্ষক মোড বন্ধ করেছেন * /


4

আমি সিমুলেশনগুলিও শেখানোর ক্ষেত্রে দরকারী বলে মনে করেছি।

nN(μ,1)σ2=1H0:μ=μ0

ttstat:=n(X¯μ0)N(0,1)H0pΦ(tstat)pnorm(tstat)

N(μ0,1)μ0=2nullMeans

# p value
set.seed(1)
reps <- 1000
n <- 100      
mu <- 1.85 # true value
mu_0 <- 2 # null value
xaxis <- seq(-3, 3, length = 100)

X <- rnorm(n,mu)

nullMeans <- counter <- rep(NA,reps)

yvals <- jitter(rep(0,reps),2)

for (i in 1:reps)
{  
  tstat <- sqrt(n)*(mean(X)-mu_0) # test statistic, N(0,1) under the given assumptions

  par(mfrow=c(1,3))
  plot(xaxis,dnorm(xaxis),ylab="null distribution",xlab="possible test statistics",type="l")
  points(tstat,0,cex=2,col="salmon",pch=21,bg="salmon")

  X_null <- rnorm(n,mu_0) # generate data under H_0
  nullMeans[i] <- mean(X_null)

  plot(nullMeans[1:i],yvals[1:i],col="blue",pch=21,xlab="actual means and those generated under the null",ylab="", yaxt='n',ylim=c(-1,1),xlim=c(1.5,2.5))
  abline(v=mu_0,lty=2)
  points(mean(X),0,cex=4,col="salmon",pch=21,bg="salmon")

  # counts 1 if sample generated under H_0 is more extreme:
  counter[i] <- (nullMeans[i] < mean(X)) # i.e. we test against H_1: mu < mu_0
  barplot(table(counter[1:i])/i,col=c("green","red"),xlab="more extreme mean under the null than the mean actually observed")

  if(i<10) locator(1)
}
mean(counter)
pnorm(tstat)

0

হাইপোথিসিস পরীক্ষা করার সাথে সম্পর্কিত "পি-ভ্যালু" বলতে কী বোঝায়?

অ্যান্টোলজিকাল অর্থে (সত্য কী?), এর অর্থ কিছুই নেই । যেকোন অনুমানের পরীক্ষা নিরীক্ষিত অনুমানের উপর ভিত্তি করে । এটি সাধারণত পরীক্ষারই একটি অংশ, তবে আপনি যে মডেলটি ব্যবহার করছেন তারও একটি অংশ (যেমন কোনও রিগ্রেশন মডেল)। যেহেতু আমরা কেবল এগুলি ধরে নিচ্ছি, তাই আমরা জানতে পারি না যে পি-মানটি আমাদের প্রান্তিকের নীচে রয়েছে কারণ নালটি মিথ্যা। নিঃশর্তভাবে অনুমান করা এটি একটি নন সিকুইটার যে কম পি-ভ্যালু হওয়ার কারণে আমাদের অবশ্যই নালটিকে প্রত্যাখ্যান করতে হবে। উদাহরণস্বরূপ, মডেলের কিছু ভুল হতে পারে।

জ্ঞানতাত্ত্বিক অর্থে (আমরা কী শিখতে পারি?), এর অর্থ কিছু । সত্যচিহ্নহীন প্রাঙ্গনে আপনি শর্তাধীন জ্ঞান অর্জন করুন। যেহেতু (কমপক্ষে এখন অবধি) আমরা বাস্তবের প্রতিটি প্রাসাদ প্রমাণ করতে পারি না, তাই আমাদের সমস্ত জ্ঞান অগত্যা শর্তযুক্ত হবে। আমরা কখনই "সত্য" তে উঠতে পারব না।


-1

আমি মনে করি যে মার্বেল বা মুদ্রা বা উচ্চতা-পরিমাপের সাথে জড়িত উদাহরণগুলি গণিতের অনুশীলনের জন্য সূক্ষ্ম হতে পারে তবে অন্তর্দৃষ্টি নির্ধারণের জন্য এগুলি ভাল নয়। কলেজের শিক্ষার্থীরা সমাজকে প্রশ্ন করতে পছন্দ করেন, তাই না? কিভাবে একটি রাজনৈতিক উদাহরণ ব্যবহার সম্পর্কে?

বলুন যে কোনও রাজনৈতিক প্রার্থী একটি প্রচার চালিয়েছিল প্রতিশ্রুতি দিয়েছিল যে কিছু নীতি অর্থনীতিতে সহায়তা করবে। তিনি নির্বাচিত হয়েছিলেন, তিনি নীতিমালা কার্যকর করেছিলেন এবং ২ বছর পরে, অর্থনীতি বিকাশ লাভ করছে। তিনি পুনর্নির্বাচনের পক্ষে রয়েছেন এবং দাবি করেছেন যে তাঁর নীতিই সবার সমৃদ্ধির কারণ। আপনি কি তাকে পুনরায় নির্বাচিত করবেন?

চিন্তাশীল নাগরিকের উচিত "ভাল, এটা সত্য যে অর্থনীতি ভাল করছে, তবে আমরা কি সত্যই এটির বিষয়টি আপনার নীতির প্রতিদান দিতে পারি?" সত্যই এর উত্তর দিতে, আমাদের অবশ্যই প্রশ্নটি বিবেচনা করতে হবে "অর্থনীতিটি কি এটি ছাড়া গত 2 বছরে ভাল কাজ করতে পারত?" যদি উত্তর হ্যাঁ হয় (উদাহরণস্বরূপ কিছু নতুন সম্পর্কযুক্ত প্রযুক্তিগত বিকাশের কারণে অর্থনীতি বিকাশমান) তবে আমরা রাজনীতিবিদদের উপাত্ত সম্পর্কিত ব্যাখ্যা প্রত্যাখ্যান করি।

তা হল, একটি হাইপোথিসিস পরীক্ষা করার জন্য (নীতি অর্থনীতিতে সহায়তা করেছিল), আমাদের অবশ্যই বিশ্বের এমন একটি মডেল তৈরি করতে হবে যেখানে এই অনুমানটি বাতিল হয় (নীতিটি কখনই কার্যকর করা হয়নি)। আমরা তখন সেই মডেলের অধীনে একটি ভবিষ্যদ্বাণী করি। আমরা সেই বিকল্প বিশ্বে এই ডেটা পর্যবেক্ষণের সম্ভাবনাটিকে পি-মান বলি । যদি পি-মানটি খুব বেশি হয়, তবে আমরা অনুমান দ্বারা বিশ্বাসী নই - নীতিটি কোনও পার্থক্য তৈরি করে নি। যদি পি-মান কম হয় তবে আমরা অনুমানকে বিশ্বাস করি - নীতিটি প্রয়োজনীয় ছিল।


1
পি হিসাবে সংজ্ঞায়িত হওয়ার সাথে আমি একমত নই "" আমরা এই বিকল্প পৃথিবীতে এই ডেটা পর্যবেক্ষণের সম্ভাবনাটিকে পি-ভ্যালু বলি "এবং উপসংহারের শক্তিও টানা হচ্ছে (বিশেষত নালটিকে প্রত্যাখ্যান করতে ব্যর্থতা)।
সিলভারফিশ

@ সিলভারফিশ আপনি কি বিস্তারিত বর্ণনা করতে পারেন? সম্ভবত পি-ভ্যালুটিকে সেই পর্যবেক্ষণ করার সম্ভাব্যতা বা আরও চূড়ান্ত পর্যবেক্ষণ বলার চেয়ে আরও সঠিক হবে। তবে মনে হচ্ছে আপনার গভীর সমালোচনা রয়েছে।
সিগরিন

1
যেহেতু মূল প্রশ্নটি জিজ্ঞাসা করছে একটি পি-মান কী, তাই আমি ভেবেছিলাম যে স্পষ্টভাবে এই সংজ্ঞাটি পাওয়া গুরুত্বপূর্ণ ছিল। "আরও চরম" বলতে কি কেবল "আরও চরম" অর্থ কী তা ব্যাখ্যা না করে নিজেই খুব কার্যকর নয় - এটি এই থ্রেডের বেশিরভাগ উত্তরের একটি দুর্বলতা। কেবলমাত্র whuber এর উত্তর এবং "চা পরীক্ষা" একটিকে "আরও চরম" বিষয়টি কেন গুরুত্বপূর্ণ তা সত্যই ব্যাখ্যা করে।
সিলভারফিশ

আমি অনুভব করেছি যে আপনার সিদ্ধান্তগুলি খুব দৃ strongly়ভাবে বর্ণিত হয়েছে। আমরা যদি শূন্যটিকে প্রত্যাখ্যান করি তবে এর বিরুদ্ধে আমাদের কাছে উল্লেখযোগ্য প্রমাণ রয়েছে, তবে জানি না যে এটি মিথ্যা। যখন আমরা শূন্যটিকে প্রত্যাখ্যান করতে ব্যর্থ হই, তখন অবশ্যই এর অর্থ নুলটি সত্য নয় (যদিও এটি ভাল হতে পারে)। আরও সাধারণ মন্তব্য হিসাবে আমার যে টেস্টটি আপনি বর্ণনা করছেন তার অনুভূতিটি বোধ করছি, বেশ বিমূর্ত শর্তে, এমন কোন শিক্ষানবিশের কাছে স্পষ্ট হওয়ার সম্ভাবনা নেই যা কেবল একটি পরীক্ষা কীভাবে চালাতে হয় তা শিখছে। সুস্পষ্টভাবে সংজ্ঞায়িত পরীক্ষার পরিসংখ্যানের অভাব মূল প্রশ্নটি কীভাবে টি- স্ট্যাটালিস্টিককে কীভাবে ব্যাখ্যা করা যায় তা জিজ্ঞাসা করে ভালভাবে বসে না।
সিলভারফিশ

এই উত্তরের একটি বৈশিষ্ট্য যা আমি অনেক পছন্দ করি তা হল স্পষ্ট ব্যাখ্যা যে পি-মানগুলি নাল মডেল ব্যবহার করে গণনা করা হয়, এমনকি যদি আমরা (বিষয়বস্তু) বিশ্বাস না করি তবে নাল মডেলটি সত্য। আমি মনে করি যে পরীক্ষার পরিসংখ্যান একটি মডেলের অধীনে গণনা করা হয় এটি একটি মূল বিষয় যা অনেক শিক্ষার্থীর সাথে লড়াই করে।
সিলভারফিশ

-1

আমি এখনও নিম্নলিখিত তর্কটি প্রমাণ করতে পারি যাতে এতে ত্রুটি থাকতে পারে তবে আমি সত্যিই আমার দুটি সেন্টে ফেলে দিতে চাই (আশা করি, আমি খুব শীঘ্রই একটি কঠোর প্রমাণ দিয়ে আপডেট করব)। দেখার অন্য একটি উপায়p

pX

0c1,FX|H0(inf{x:FX|H0(x)c})=c
FX|H0XH0

X

  1. p[0,1]
  2. [0,1]p

p


P

@ শুভ ইনপুট জন্য ধন্যবাদ। আমি সংজ্ঞাটি সম্পাদনা করেছি, এবং এটি এখন আরও অর্থপূর্ণ হওয়া উচিত!
নলজোক

1
X[0,1].

(θ,θ+1)θR,θ=0,X=(X1,,Xn).X(X)=X1.[0,1]H0:n=1X1=2:2

-4

পি-মানটি যত রহস্যজনক নয় তেমনি বেশিরভাগ বিশ্লেষক এটি তৈরি করে। এটি একটি টি-টেস্টের জন্য আত্মবিশ্বাসের ব্যবধান গণনা না করে এমন একটি উপায় যা কেবল নীতি অনুমানকে প্রত্যাখ্যান করা যায় এমন আত্মবিশ্বাসের স্তরটি নির্ধারণ করে।

চিত্রণ. আপনি একটি পরীক্ষা চালান। পি-মানটি কিউ-ভেরিয়েবলের জন্য 0.1866, আর-ভেরিয়েবলের জন্য 0.0023 হিসাবে আসে comes (এগুলি% তে প্রকাশ করা হয়)।

যদি আপনি নাল হাইপো প্রত্যাখ্যান করার জন্য একটি 95% আত্মবিশ্বাসের স্তরে পরীক্ষা করছেন;

প্রশ্ন: 100-18.66 = 81.34%

আর এর জন্য: 100-0.23 = 99.77%।

একটি 95% আত্মবিশ্বাসের স্তরে, প্রশ্ন প্রত্যাখ্যান করার জন্য 81.34% আত্মবিশ্বাস দেয়। এটি 95% এর নিচে পড়ে এবং অগ্রহণযোগ্য। নূন্যতম গ্রহণ করুন।

আর নাল প্রত্যাখ্যান করার জন্য একটি 99.77% আত্মবিশ্বাস দেয়। পরিষ্কারভাবে কাঙ্ক্ষিত 95% এর উপরে। আমরা এইভাবে নাল প্রত্যাখ্যান।

আমি কেবলমাত্র আত্মবিশ্বাসের স্তর পর্যন্ত এটি পরিমাপের একটি 'বিপরীত উপায়ে' মাধ্যমে পি-মানটি পড়ার চিত্রিত করেছি যেখানে আমরা নাল হাইপোকে প্রত্যাখ্যান করি।


6
QR

@ কার্ডিনাল একটি গুরুত্বপূর্ণ বিষয় উল্লেখ করেছে। আপনি নাল গ্রহণ করবেন না।
প্যাট্রিক কৌলম্ব

-8

হাইপোথিসিসের পরীক্ষার জন্য ****** পি মান পরীক্ষার সংবেদনশীলতা পরিমাপ করে The পি মানটি হ'ল সংবেদনশীলতা। যদি তাৎপর্য স্তরটি 0.05 এ সেট করা থাকে তবে 0.0001 এর p মান পরীক্ষার ফলাফলের সঠিক হওয়ার উচ্চ সম্ভাবনা নির্দেশ করে ******


6
-1 এটি স্পষ্টতই ভুল। আপনি প্রথমে উচ্চতর ভোট দেওয়া উত্তরগুলি পড়তে চাইতে পারেন।
মোমো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.