মডেল প্রদত্ত ডেটার সম্ভাব্যতা গণনা করার পরিবর্তে লোকেরা পি-মানগুলি কেন ব্যবহার করবে?


43

মোটামুটি পি-ভ্যালু বললে অনুমান (মডেল) দেওয়া কোনও পরীক্ষার পর্যবেক্ষণের ফলাফলের সম্ভাবনা দেয়। এই সম্ভাবনাটি (পি-মান) থাকার কারণে আমরা আমাদের অনুমানটি বিচার করতে চাই (এটি কতটা সম্ভব)। তবে পর্যবেক্ষণের ফলাফলটি দেখলে অনুমানের সম্ভাবনা গণনা করা কি আরও স্বাভাবিক হবে না?

আরও বিশদ। আমাদের একটা মুদ্রা আছে আমরা এটি 20 বার ফ্লিপ করি এবং আমরা 14 টি মাথা পেয়েছি (20 এর মধ্যে 14 হ'ল আমি "পরীক্ষার ফলাফল")। এখন, আমাদের অনুমানটি মুদ্রাটি ন্যায্য (মাথা এবং লেজের সম্ভাবনা একে অপরের সমান)। এখন আমরা পি-মানটি গণনা করি, এটি মুদ্রার 20 ফ্লিপে 14 বা আরও বেশি মাথা পাওয়ার সম্ভাবনার সমান। ঠিক আছে, এখন আমাদের এই সম্ভাবনা রয়েছে (0.058) এবং আমরা আমাদের মডেলটি বিচার করার জন্য এই সম্ভাবনাটি ব্যবহার করতে চাই (এটি সম্ভবত কীভাবে আমাদের মুখ্য মুদ্রা আছে)।

তবে আমরা যদি মডেলের সম্ভাব্যতাটি অনুমান করতে চাই, তবে আমরা কেন পরীক্ষায় দেওয়া মডেলের সম্ভাব্যতা গণনা করব না? আমরা কেন মডেলের (পি-মান) প্রদত্ত পরীক্ষার সম্ভাবনা গণনা করব?


সম্ভাবনা-ফাংশনটি গণনা করতে সক্ষম হতে আপনাকে এখনও কোনওভাবে আপনার পরীক্ষাটি মডেল করতে হবে।
রাসক্লানিকভ

11
পিট ডিকসন ১৯৯৮ সালে ফিরে একটি নিবন্ধ লিখেছিলেন "বিজ্ঞানীরা পি-ভ্যালুগুলিকে কেন মূল্য দেয়" ( সাইকোনমিক.আর / বিবিসিউস / ১63৩১ / আর 382.pdf ) যা তথ্যবহুল পাঠ হতে পারে called প্রতিস্থাপন মেট্রিক হিসাবে সম্ভাবনা অনুপাত সম্পর্কে গ্লোভার অ্যান্ড ডিকসনের 2004-এর একটি ভাল ফলো-আপ হবে ( pbr.psychonomic-journals.org/content/11/5/791.full.pdf )।
মাইক লরেন্স

2
মাইক, এটি সন্দেহজনকভাবে আমার কাছে ভাল উত্তরের মত দেখাচ্ছে। মন্তব্যগুলিতে এটি কী করছে?
ম্যাট পার্কার

: জন ডি কুক খনি একটি প্রশ্ন হল, যা আমি মনে করি আপনি আকর্ষণীয় বলে হবে একটি চমৎকার উত্তর, পোস্ট stats.stackexchange.com/questions/1164/...
ডগ

লোকেরা পি-মান ব্যবহার করে না, পরিসংখ্যানবিদরা করেন। (একথা বলার অপেক্ষা রাখে না যে এটি সত্যিও সত্য course অবশ্যই একবার আপনি প্রতিটি বিশেষ্যকে যথাযথভাবে যোগ্য করে তোলা শুরু করলে তা তার করুণা হারায়))
ওয়েন

উত্তর:


31

হাইপোথিসিসটি সঠিক কিনা এমন সম্ভাবনা গণনা করা একটি সম্ভাবনার (দীর্ঘকালীন ফ্রিকোয়েন্সি) বারবারবাদী সংজ্ঞার মধ্যে ভালভাবে খাপ খায় না, যা কোনও সম্ভাবনার বায়েশিয়ান সংজ্ঞাটির অনুমিত সাবজেক্টিভিটি এড়াতে গৃহীত হয়েছিল। একটি নির্দিষ্ট অনুমানের সত্যটি এলোমেলো পরিবর্তনশীল নয়, হয় হয় সত্য অথবা এটি হয় না এবং এর দীর্ঘকালীন ফ্রিকোয়েন্সিও নেই। হাইপোথিসিসের সত্যতার সম্ভাবনা সম্পর্কে আগ্রহী হওয়া প্রকৃতপক্ষে স্বাভাবিক, এটিই IMHO কেন পি-ভ্যালুগুলি প্রায়শই নাল কল্পনাটি সত্য হওয়ার সম্ভাবনা হিসাবে ভুল ব্যাখ্যা করা হয়। অসুবিধার অংশটি হ'ল বেইস রুল থেকে, আমরা জানি যে অনুমানটি সত্য যে উত্তরোত্তর সম্ভাবনা গণনা করার জন্য আপনাকে পূর্ববর্তী সম্ভাবনাটি শুরু করা উচিত যে অনুমানটি সত্য।

একজন বায়েশিয়ান ডেটা (এবং তার পূর্ব বিশ্বাস) দিয়ে অনুমান করা সত্য যে সম্ভাবনাটি গণনা করবেন

মূলত ঘন ঘন এবং বায়েশিয়ান পদ্ধতির মধ্যে সিদ্ধান্ত নেওয়ার ক্ষেত্রে বায়েসীয় পদ্ধতির অনুমিত সাবজেক্টিভিটি সাধারণত যে প্রশ্নটি আপনি জিজ্ঞাসা করতে চান সেটির সরাসরি উত্তর দেয় না যেটির চেয়ে বেশি ঘৃণিত হয় কিনা তা একটি পছন্দ - তবে এর সুযোগ রয়েছে উভয়।

একটি মুদ্রা ন্যায্য কিনা তা জিজ্ঞাসার ক্ষেত্রে, যেমন একটি মাথার সম্ভাব্যতা একটি লেজের সম্ভাবনার সমান, আমাদের কাছে এমন একটি অনুমানের উদাহরণও রয়েছে যা আমরা বাস্তব বিশ্বে জানি প্রায় শুরু থেকেই মিথ্যা অধিকার right মুদ্রার দুটি পক্ষই অ-প্রতিসাম্যযুক্ত, তাই আমাদের মাথা এবং লেজগুলির সম্ভাব্যতায় কিছুটা অসম্পূর্ণতা আশা করা উচিত, সুতরাং মুদ্রাটি যদি পরীক্ষায় "পাস" হয় তবে এর অর্থ কেবল আমাদের পক্ষে সক্ষম হওয়ার মতো পর্যাপ্ত পর্যবেক্ষণ নেই আমরা ইতিমধ্যে সত্য হতে জানি কি উপসংহার - এই মুদ্রা খুব সামান্য পক্ষপাতদুষ্ট!


4
প্রকৃতপক্ষে, বেশিরভাগ মুদ্রাগুলি ন্যায্যতার খুব কাছাকাছি এবং এগুলি খুব বেশি পক্ষপাতমূলক করার জন্য শারীরিকভাবে প্রশংসনীয় উপায় নিয়ে আসা কঠিন - উদাহরণস্বরূপ দেখুন স্টাটকোলম্বিয়া.এডু
ডাইসরেভ

8
ন্যায্যের খুব কাছাকাছি থাকা ঠিক ন্যায্য হওয়ার মতো জিনিস নয়, যা নাল হাইপোথিসিস। আমি হাইপোথিসিস টেস্টিংয়ের একটি আইডিসিএনক্র্যাসির দিকে ইঙ্গিত করছিলাম, যথা আমরা প্রায়শই জানি যে নাল অনুমানটি মিথ্যা, তবে যাইহোক এটি ব্যবহার করুন। আরও কার্যকর পরীক্ষার মাধ্যমে মুদ্রা পক্ষপাতদুষ্ট যে উল্লেখযোগ্য প্রমাণের চেয়ে মুদ্রাটি উল্লেখযোগ্যভাবে পক্ষপাতদুষ্ট তা প্রমাণ রয়েছে কিনা তা সনাক্ত করা হবে।
ডিকরান মার্শুপিয়াল

1
হাই, সম্ভবত আমি ভুল হয়েছি কিন্তু আমি বিজ্ঞানে ভেবেছিলাম, আপনি কখনই বলতে পারবেন না যে বিকল্প অনুমানটি সত্য, আপনি কেবল এটিই বলতে পারবেন যে নাল হাইপোথিসিসটি প্রত্যাখ্যান করা হয়েছে এবং আপনি বিকল্প অনুমানটি গ্রহণ করেছেন accept আমার কাছে পি মানটি আপনি টাইপ 1 ত্রুটি করার সম্ভাবনাটি প্রতিফলিত করে, অর্থাৎ আপনি বিকল্প অনুমানটিকে প্রত্যাখ্যান করবেন এবং নাল অনুমানটি গ্রহণ করবেন (পি = .05 বা সময়ের 5% বলুন। টাইপ 1 এর মধ্যে পার্থক্য করা গুরুত্বপূর্ণ ত্রুটি এবং প্রকার 2 ত্রুটি, এবং আপনার ইভেন্টগুলির মডেলিংয়ে শক্তি যে ভূমিকা পালন করে।
ব্যবহারকারী 2238

3
ঘনঘনবাদী পরীক্ষার জন্য, আমি একটি এমনকি দুর্বল বক্তব্য ব্যবহার করব, যা হ'ল আপনি "নাল অনুমানকে প্রত্যাখ্যান করুন" বা আপনি "নাল অনুমানকে প্রত্যাখ্যান করতে" ব্যর্থ হন, এবং কিছুই গ্রহণ করেন না। মূল বিষয়টি হ'ল (পক্ষপাতদুষ্ট মুদ্রার ক্ষেত্রে যেমন) কখনও কখনও আপনি জানেন যে নাল অনুমানটি সত্য নয়, আপনার কাছে ঠিক আছে তা প্রমাণ করার জন্য পর্যাপ্ত ডেটা নেই; এই ক্ষেত্রে এটি "গ্রহণ" করা বিজোড় হবে। ঘন ঘন পরীক্ষাগুলিতে টাইপ -1 এবং টাইপ -2 ত্রুটির হার রয়েছে, তবে এর অর্থ এই নয় যে ওপিতে যেমন তারা কোনও নির্দিষ্ট অনুমানের সত্যতা হওয়ার সম্ভাবনা নিয়ে কথা বলতে পারে।
ডিকরান মার্সুপিয়াল

2
@ user2238 P-মান একটি টাইপ আমি ত্রুটির সুযোগ শুধুমাত্র যখন নাল হাইপোথিসিস "সরল" (যৌগিক না) এবং এটা সত্য হতে হবে। উদাহরণস্বরূপ, একটি দিকে পক্ষপাতদুষ্ট কিনা তা একতরফা পরীক্ষায় ( ), দ্বি-মাথাযুক্ত মুদ্রা ব্যবহার করে টাইপ -1 ত্রুটি শূন্যের গ্যারান্টি দেয়, যদিও পি-মান থেকে যে কোনও সীমাবদ্ধ নমুনা ননজারো হবে। H0:p<0.5
হোবার

18

সত্যিকারের পুরানো প্রশ্নের উত্তর দেওয়ার মতো কিছুই নয়, তবে এখানে যায় ...

পি-মানগুলি প্রায় বৈধ অনুমান পরীক্ষা are এটি জেনেসের 2003 এর সম্ভাব্যতা তত্ত্বের বই (পুনরাবৃত্ত পরীক্ষাগুলি: সম্ভাব্যতা এবং ফ্রিকোয়েন্সি) থেকে নেওয়া কিছুটা অভিযোজিত এক্সারপ্ট। ধরুন আমাদের কাছে এমন একটি নাল হাইপোথিসিস যা আমরা পরীক্ষা করতে চাই। আমরা তথ্য আছে এবং পূর্বে তথ্য । মনে করুন যে কিছু অনির্দিষ্ট হাইপোথিসিস যা আমরা বিরুদ্ধে পরীক্ষা । বিপরীতে পূর্ববর্তী প্রতিকূল অনুপাতটি তখন প্রদত্ত: ডি আমি এইচ একটি এইচ 0 এইচ একটি এইচ 0H0DIHAH0HAH0

P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)

এখন ডানদিকে প্রথম শব্দটি ডেটা থেকে স্বতন্ত্র, সুতরাং তথ্যটি কেবল দ্বিতীয় পদটির মাধ্যমে ফলাফলকে প্রভাবিত করতে পারে। এখন, আমরা সর্বদা একটি বিকল্প অনুমান যেমন- - একটি "নিখুঁত ফিট" হাইপোথিসিস আবিষ্কার করতে পারি। সুতরাং আমরা উপরে কোনও বিকল্প অনুমানকে ডেটা কতটা সমর্থন করতে পারে তার পরিমাপ হিসাবে আমরা use ব্যবহার করতে পারি । সেরকম কোন বিকল্প হাইপোথিসিস যে ডেটার উপর সমর্থন পারে তার চেয়ে অনেক বেশী দ্বারা । আমরা বিকল্পগুলির শ্রেণিটিকেও সীমাবদ্ধ করতে পারি, এবং পরিবর্তনটি হ'ল যে সেই শ্রেণীর মধ্যে সর্বাধিক সম্ভাবনা (ধ্রুবককে স্বাভাবিককরণ সহ) দ্বারা প্রতিস্থাপন করা হয়েছে। যদি পি ( ডি | এইচ আই ) = 1 1HAP(D|HAI)=1 এইচ011P(D|H0I)H0 1পি(ডি|এইচ0আমি)এইচ0এইচএকটিটন(ডি)>T0টি(ডি)ডিটি(ডি)1P(D|H0I)1P(D|H0I)খুব ছোট হতে শুরু করে, তারপরে আমরা সন্দেহ করতে শুরু করি, কারণ এবং মধ্যে বিকল্পের সংখ্যা বেড়ে যায় (কিছু না-পূর্বের সম্ভাব্যতা সহ)। তবে পি-ভ্যালু দিয়ে এটি করা প্রায় খুব প্রায়, তবে একটি ব্যতিক্রম সহ: আমরা কিছু পরিসংখ্যান এবং কিছু পরিসংখ্যানের "খারাপ" অঞ্চলের জন্য এর সম্ভাবনা গণনা করি না । আমরা এর সম্ভাব্যতা গণনা করি - তথ্যটি আসলে আমাদের কাছে রয়েছে তার কিছু উপসেটের চেয়ে ।H0HAt(D)>t0t(D)Dt(D)

লোকেরা পি-মানগুলি ব্যবহার করে এমন আরেকটি কারণ হ'ল তারা প্রায়শই একটি "যথাযথ" হাইপোথিসিস পরীক্ষার পরিমাণে থাকে তবে এটি গণনা করা সহজ। আমরা এটি জ্ঞাত বৈকল্পিকের সাথে সাধারণ গড় পরীক্ষা করার খুব সাধারণ উদাহরণ দিয়ে দেখাতে পারি। আমাদের কাছে একটি অনুমিত মডেল (পূর্বের তথ্যের অংশ ) সহ । আমরা পরীক্ষা করতে চাই । তারপরে আমাদের কিছুটা গণনার পরে:x iN o r m a l ( μ , σ 2 ) I H 0 : μ = μ 0D{x1,,xN}xiNormal(μ,σ2)IH0:μ=μ0

P(D|H0I)=(2πσ2)N2exp(N[s2+(x¯μ0)2]2σ2)

যেখানে এবং । এ থেকে জানা যায় এর সর্বোচ্চ মান অর্জন করা হবে যখন । সর্বাধিক মান:এস2=1x¯=1Ni=1Nxiপি(ডি|এইচ0আই)μ0= ¯ xs2=1Ni=1N(xix¯)2P(D|H0I)μ0=x¯

P(D|HAI)=(2πσ2)N2exp(Ns22σ2)

সুতরাং আমরা এই দুটি অনুপাত গ্রহণ করি এবং আমরা পাই:

P(D|HAI)P(D|H0I)=(2πσ2)N2exp(Ns22σ2)(2πσ2)N2exp(Ns2+N(x¯μ0)22σ2)=exp(z22)

যেখানে হ'ল "জেড-স্ট্যাটিস্টিক"। বড় মান নাল অনুমানের উপর সন্দেহ পোষণ করুন, সাধারণ গড় সম্পর্কে যা অনুমানের সাথে ডেটা দ্বারা দৃ supported়ভাবে সমর্থিত সম্পর্কে অনুমানের তুলনায় আপেক্ষিক। আমরা আরও দেখতে পাচ্ছি যে হ'ল প্রয়োজনীয় তথ্যের একমাত্র অংশ এবং এটি পরীক্ষার জন্য পর্যাপ্ত পরিসংখ্যান। | z| Xz=Nx¯μ0σ|z|x¯

এই সমস্যার জন্য পি-মান পদ্ধতির প্রায় একই রকম, তবে বিপরীতে। আমরা পর্যাপ্ত পরিসংখ্যান with দিয়ে শুরু করি এবং আমরা এর নমুনা বিতরণকে ক্যালকুলেট করি, যা সহজেই হিসাবে দেখানো হয় - যেখানে আমি দৈব চলক পার্থক্য করার জন্য একটি বড় হাতের অক্ষর ব্যবহার করেছেন পর্যবেক্ষিত মান থেকে । এখন আমাদের এমন একটি অঞ্চল সন্ধান করা দরকার যা নাল অনুমানের উপর সন্দেহ পোষণ করে: এটি সহজেই সেই অঞ্চলগুলিতে দেখা যায় যেখানেবড়. সুতরাং আমরা সেই সম্ভাবনাটি গণনা করতে পারি যে¯ এক্স ~এনমিএকটি(μ, σ 2x¯X¯Normal(μ,σ2N)X¯x¯|X¯μ0||X¯μ0||x¯μ0|নাল অনুমান থেকে পর্যবেক্ষণ করা ডেটা কতটা দূরে তার পরিমাপ হিসাবে। আগের মত, এটি একটি সাধারণ গণনা, এবং আমরা পাই:

p-value=P(|X¯μ0||x¯μ0||H0)
=1P[N|x¯μ0|σNX¯μ0σN|x¯μ0|σ|H0]
=1P(|z|Z|z||H0)=2[1Φ(|z|)]

এখন, আমরা দেখতে পাচ্ছি যে পি-মানটি একঘেয়েমি হ্রাসকারী ক্রিয়া , যার অর্থ আমরা মূলত "যথাযথ" অনুমান পরীক্ষা হিসাবে একই উত্তর পাই as যখন পি-ভ্যালু নির্দিষ্ট প্রান্তিকের নীচে থাকে তখন প্রত্যাখ্যান করা যখন প্রতিকূল প্রতিকূলগুলি একটি নির্দিষ্ট প্রান্তিকের উপরে থাকে তখন প্রত্যাখ্যান করা একই জিনিস। যাইহোক, নোট করুন যে সঠিক পরীক্ষাটি করার সময়, আমাদের বিকল্পগুলির ক্লাসটি সংজ্ঞায়িত করতে হয়েছিল এবং আমাদের এই শ্রেণীর উপরের সম্ভাবনা সর্বাধিকতর করতে হয়েছিল। পি-মানটির জন্য, আমাদের একটি পরিসংখ্যান খুঁজে বের করতে হবে এবং এর নমুনা বিতরণ গণনা করতে হবে, এবং পর্যবেক্ষণ করা মানটিতে এটি মূল্যায়ন করতে হবে। কিছু অর্থে একটি পরিসংখ্যান নির্বাচন করা বিকল্প বিকল্পটি আপনি যে বিবেচনা করছেন তা সংজ্ঞার সমতুল্য।|z|

যদিও এই উদাহরণে তারা উভয়ই সহজ কাজ, তবে আরও জটিল ক্ষেত্রে এগুলি সবসময় এতো সহজ নয়। কিছু ক্ষেত্রে এর নমুনা বিতরণ ব্যবহার এবং গণনা করার জন্য সঠিক পরিসংখ্যান চয়ন করা আরও সহজ হতে পারে। অন্যদের মধ্যে বিকল্পগুলির শ্রেণিটি সংজ্ঞায়িত করা এবং class শ্রেণীর উপরে সর্বোচ্চ করা সহজ হতে পারে।

এই সাধারণ উদাহরণটি প্রচুর পরিমাণে পি-মান ভিত্তিক পরীক্ষার জন্য অ্যাকাউন্ট করে, কারণ এতগুলি অনুমানের পরীক্ষাগুলি "আনুমানিক স্বাভাবিক" বিভিন্ন প্রকারের। এটি আপনার মুদ্রা সমস্যারও প্রায় দ্বিগুণ উত্তর দেয় (দ্বিপদীটির সাধারণ অনুমান ব্যবহার করে)। এটি আরও দেখায় যে এই ক্ষেত্রে পি-মানগুলি আপনাকে ভুল পথে পরিচালিত করবে না, কমপক্ষে একটি একক অনুমানের পরীক্ষার ক্ষেত্রে। এই ক্ষেত্রে, আমরা বলতে পারি যে একটি পি-মান হল নাল অনুমানের বিরুদ্ধে প্রমাণের একটি পরিমাপ।

তবে বে-ফ্যাক্টরের তুলনায় পি-ভ্যালুগুলির কম ব্যাখ্যামূলক স্কেল রয়েছে - পি-মান এবং নলের বিরুদ্ধে প্রমাণের "পরিমাণ" এর মধ্যে লিঙ্কটি জটিল। পি-মানগুলি খুব দ্রুত খুব ছোট হয়ে যায় - যা তাদের সঠিকভাবে ব্যবহার করা কঠিন করে তোলে। তারা ডেটা দ্বারা সরবরাহিত শূন্যের বিরুদ্ধে সমর্থনকে অত্যুক্তি দেখায়। - আমরা নাল বিরুদ্ধে সম্ভাব্যতা যেমন P-মান ব্যাখ্যা যদি মতভেদ আকারে হয় , যখন প্রকৃত প্রমাণ এবং মতভেদ আকারে হয় যখন প্রকৃত প্রমাণ । অথবা এটি অন্য কোনও উপায়ে বলতে গেলে, পি-মান ব্যবহারের সম্ভাবনা হিসাবে নালটি এখানে মিথ্যা, এটি পূর্ববর্তী প্রতিক্রিয়াগুলি নির্ধারণের সমতুল্য। পি মান হিসাবে0.193.870.05196.830.1শূন্যের বিরুদ্ধে বিহিত পূর্ববর্তী প্রতিক্রিয়াগুলি এবং পি-ভ্যালু এর জন্য বিরুদ্ধে বিহিত পূর্ববর্তী ।2.330.052.78


4
+1 টি। "... একটি পরিসংখ্যান নির্বাচন করা বিকল্প অনুমান যে আপনি বিবেচনা করছেন তা সংজ্ঞার সমতুল্য" আমাকে গভীর অন্তর্দৃষ্টি হিসাবে আঘাত করে।
whuber

ভাল উত্তর. এটি লক্ষণীয় (যদিও স্পষ্ট) মূল্যবান যে কিছু ছোট জন্য চেয়ে বড় বিকল্পগুলির শ্রেণীর সাথে কাজ করা প্রায়শই গণনামূলকভাবে নিষিদ্ধ হতে পারে, যদি কেউ অসীম বা অগণিত বিকল্পের সাথে কাজ করতে হয় তবে তা হতে পারে প্রস্তুতিতে. পি-মান পদ্ধতির একটি বড় প্লাস হ'ল এটি প্রায়শই (সাধারণত?) গণনাগতভাবে সহজ / ট্র্যাকটেবল। কেkk
ফাহিম মিঠা

1
@ ফাহিম্মিথা- আপনি সম্মিলিত বিস্ফোরণ সম্পর্কে ঠিক বলেছেন, তবে আমার বর্ণিত পদ্ধতির জন্য এটি ঘটে না (বাস্তবে আপনি দেখাতে পারেন যে বেইস পদ্ধতির কার্যকরভাবে অবশিষ্টাংশকে সংজ্ঞায়িত করা হচ্ছে)। এটি কারণ আমাদের কেবলমাত্র ক্লাসটি নির্ধারণ করতে হবে তখন সর্বাধিক। আমাদের প্রতিটি বিকল্প মূল্যায়ন করার দরকার নেই, কেবল সেরাটি সন্ধান করুন।
সম্ভাব্যতাব্লোগিক

এই উত্তরটি কেন কমিউনিটি উইকি?
অ্যামিবা বলছেন মনিকাকে

10

প্রাক্তন একাডেমিক হিসাবে যিনি অনুশীলনে চলে এসেছিলেন, আমি একটি শট নেব। লোকেরা পি-মানগুলি ব্যবহার করে কারণ তারা দরকারী। আপনি এটি মুদ্রা ফ্লিপের পাঠ্যপুস্তকের উদাহরণে দেখতে পাচ্ছেন না। নিশ্চিত যে তারা ভিত্তিগতভাবে সত্যই শক্তিশালী নয়, তবে আমরা যখন একাডেমিকভাবে ভাবছি তখন আমরা এটি ভাবতে চাই তেমন প্রয়োজনীয় নয়। তথ্যের জগতে, আমরা পরের দিকে নজর দেওয়ার জন্য আক্ষরিক অসীম সংখ্যক সম্ভাব্য জিনিসগুলি ঘিরে ফেলেছি। পি-ভ্যালু গণনার সাথে আপনার কী প্রয়োজন তা আবিষ্কারের ধারণা এবং কোন ধরণের ডেটা আকর্ষণীয় হতে পারে তার জন্য একটি সংখ্যাসূচক বৌদ্ধিক (ভাল, আরও আনট্রেস্টিংয়ের সম্ভাব্যতা মডেল)। তারপরে স্বতন্ত্র বা সম্মিলিতভাবে আমরা কিছুটা অন্বেষণের বিষয়টি প্রত্যাখ্যান করে খুব সহজ জিনিসগুলি স্ক্যান করতে পারি। পি-মানটি আমাদের বলতে দেয় "যদি আমি অন্যথায় এটির বিষয়ে চিন্তাভাবনাকে বেশি প্রাধান্য না দিই,


10

আপনার প্রশ্নটি ঘন ঘন যুক্তির এক দুর্দান্ত উদাহরণ এবং এটি আসলে বেশ স্বাভাবিক। হাইপোথিসিস পরীক্ষার প্রকৃতিটি প্রদর্শন করতে আমি এই উদাহরণটি আমার ক্লাসে ব্যবহার করেছি। কয়েন ফ্লিপের ফলাফল সম্পর্কে ভবিষ্যদ্বাণী করতে আমি স্বেচ্ছাসেবকের কাছে বলি। ফলাফল যাই হোক না কেন, আমি একটি "সঠিক" অনুমান রেকর্ড করি। ক্লাস সন্দেহজনক না হওয়া পর্যন্ত আমরা বারবার এটি করি।

এখন, তাদের মাথায় একটি নাল মডেল রয়েছে। তারা ধরে নেয় মুদ্রাটি ন্যায্য। সবকিছু ন্যায্য হলে 50% সঠিক ধারণাটি দেওয়া, প্রতিটি ক্রমাগত সঠিক অনুমানটি আরও সন্দেহ জাগিয়ে তোলে যে ন্যায্য মুদ্রার মডেলটি ভুল। কয়েকটি সঠিক অনুমান এবং তারা সুযোগের ভূমিকা গ্রহণ করে। 5 বা 10 সঠিক অনুমানের পরে, ক্লাসটি সর্বদা সন্দেহ করা শুরু করে যে ন্যায্য মুদ্রার সম্ভাবনা কম। এইভাবে ঘন ঘন মডেলটির অধীনে হাইপোথিসিস পরীক্ষার প্রকৃতির সাথে এটি হয়।

এটি অনুমানের পরীক্ষার উপর ঘন ঘনবাদীর গ্রহণের একটি স্পষ্ট এবং স্বজ্ঞাত উপস্থাপনা। নাল সত্য বলে দেওয়া পর্যবেক্ষণের তথ্যের সম্ভাবনা। এই সহজ পরীক্ষা দ্বারা প্রদর্শিত হিসাবে এটি আসলে বেশ প্রাকৃতিক। মডেলটি 50-50 এর মর্যাদাপূর্ণ বলে আমরা গ্রহণ করি তবে প্রমাণ হিসাবে এটি আমি সেই মডেলটিকে প্রত্যাখ্যান করি এবং সন্দেহ করি যে এখানে আরও কিছু আছে play

সুতরাং, আমি যে মডেলটি ধরেছি তার প্রবণতা যদি কম হয় (পি-ভ্যালু) তবে আমার ধরে নেওয়া মডেলটি প্রত্যাখ্যান করার বিষয়ে আমার কিছুটা আস্থা আছে। সুতরাং, পি-ভ্যালু সুযোগের ভূমিকা গ্রহণ করে আমার ধরে নেওয়া মডেলটির বিরুদ্ধে প্রমাণের একটি কার্যকর পরিমাপ।

একটি অস্বীকৃতি: আমি এএসএ জার্নালগুলির মধ্যে একটি, যা আমি স্মরণ করি, একটি দীর্ঘ ভুলে যাওয়া নিবন্ধ থেকে এই অনুশীলনটি নিয়েছি।


ব্রেট, এটি আকর্ষণীয় এবং একটি দুর্দান্ত উদাহরণ। আমার কাছে এখানে মডেলটি মনে হয় যে লোকেদের মাথা এবং লেজগুলির ক্রমটি এলোমেলো ফ্যাশনে ঘটবে বলে লোকেদের প্রত্যাশা। উদাহরণস্বরূপ, আমি যদি সারিতে 5 টি মাথা দেখতে পাই তবে আমি অনুমান করি যে এটি একটি নন-র্যান্ডম প্রক্রিয়াটির একটি উদাহরণ। প্রকৃতপক্ষে, এবং আমি এখানে ভুল হতে পারি, একটি টয়েন কোস সম্ভাবনা (যা এলোমেলোভাবে ধরে) 50% মাথা এবং 50% লেজ থাকে এবং এটি পূর্ববর্তী ফলাফলের তুলনায় সম্পূর্ণ স্বাধীন।
মুল বক্তব্যটি হ'ল

@ ব্যবহারকারী2238: আপনার শেষ বক্তব্যটি সত্য, তবে এটি বাহ্যিকভাবে বিরল হবে। প্রকৃতপক্ষে, 5 টি টসে 5 জন মাথা চালানো মুদ্রাটি ন্যায্য হলে সময়ের মাত্র 3% ঘটবে। এটি সর্বদা সম্ভব যে নালটি সত্য এবং আমরা একটি বিরল ঘটনা প্রত্যক্ষ করেছি।
ব্রেট

6

"মোটামুটিভাবে পি-ভ্যালু বললে অনুমান (মডেল) দেওয়া একটি পরীক্ষার পর্যবেক্ষণের ফলাফলের সম্ভাবনা দেয়।"

তবে তা হয় না। মোটামুটিভাবেও নয় - এটি একটি প্রয়োজনীয় পার্থক্যকে প্রত্যাখ্যান করে।

মডেলটি নির্দিষ্ট করা হয়নি, যেমন রাসকোলনিকভ দেখিয়েছেন, তবে ধরে নেওয়া যাক আপনার বোঝানো দ্বিপদী মডেল (স্বতন্ত্র মুদ্রা টসেস, স্থির অজানা মুদ্রা পক্ষপাত)। হাইপোথিসিসটি দাবি করে যে এই মডেলের প্রাসঙ্গিক প্যারামিটার, পক্ষপাতিত্ব বা মাথার সম্ভাবনা 0.5%।

"এই সম্ভাবনা (পি-মান) থাকাতে আমরা আমাদের অনুমানটি বিচার করতে চাই (এটি কতটা সম্ভব)"

আমরা প্রকৃতপক্ষে এই রায়টি করতে চাইব তবে একটি পি-মান আমাদের এটি করতে সহায়তা করবে না (এবং এটি ডিজাইন করা হয়নি)।

"তবে পর্যবেক্ষণের ফলস্বরূপ অনুমানের সম্ভাবনা গণনা করা কি আরও স্বাভাবিক হবে না?"

সম্ভবত এটি হবে। উপরের বয়েসের সমস্ত আলোচনা দেখুন।

"[...] এখন আমরা পি-মানটি গণনা করি, এটি 20 টি ফ্লপের মুদ্রায় 14 বা তারও বেশি মাথা পাওয়ার সম্ভাবনার সমান OK ঠিক আছে, এখন আমাদের এই সম্ভাবনা রয়েছে (0.058) এবং আমরা এই সম্ভাবনাটি ব্যবহার করতে চাই "আমাদের মডেলটি বিচার করুন (এটি কীভাবে সম্ভব যে আমাদের একটি মুদ্রা মুদ্রা আছে)"।

'আমাদের অনুমানের, আমাদের মডেলটিকে সত্য বলে ধরে নিই', তবে মূলত: হ্যাঁ। বড় পি-মানগুলি ইঙ্গিত দেয় যে মুদ্রার আচরণটি অনুমানের সাথে সামঞ্জস্যপূর্ণ যে এটি ন্যায্য। (এগুলি সাধারণত হাইপোথিসিসটি মিথ্যা হওয়ার সাথেও সামঞ্জস্যপূর্ণ তবে সত্য হওয়ার এত কাছে আমাদের কাছে বলার মতো তথ্য নেই; 'পরিসংখ্যানিক শক্তি' দেখুন।)

"তবে আমরা যদি মডেলটির সম্ভাব্যতা অনুমান করতে চাই, আমরা কেন পরীক্ষায় প্রদত্ত মডেলটির সম্ভাবনা গণনা করি না? কেন আমরা মডেলকে (পি-মান) প্রদত্ত পরীক্ষার সম্ভাবনা গণনা করব?"

আমরা এই সেটআপটিতে অনুমানটি দিয়ে পরীক্ষামূলক ফলাফলগুলির সম্ভাব্যতা গণনা করি না। সর্বোপরি, অনুমানটি সত্য হলে ঠিক 10 মাথা দেখার সম্ভাবনা কেবলমাত্র 0.176 হয় এবং এটিই সবচেয়ে সম্ভাব্য মান। এটি মোটেও আগ্রহের পরিমাণ নয়।

এটিও প্রাসঙ্গিক যে আমরা সাধারণত মডেলটির সম্ভাব্যতা অনুমান করি না। ঘন ঘন এবং বায়সিয়ান উভয় উত্তরই সাধারণত মডেলটি সত্য বলে ধরে নেয় এবং এর পরামিতিগুলি সম্পর্কে তাদের অনুমানগুলি তৈরি করে। বস্তুত, সব Bayesians হবে সম্ভাব্যতা যে সমগ্র পরিস্থিতি ভাল একটি দ্বিপদ বিন্যাস দ্বারা অনুকরণে করা হয়েছে: এমনকি নীতিগতভাবে মডেল সম্ভাবনা, যে হয় আগ্রহী হতে। তারা অনেকগুলি মডেল চেকিং করতে পারে, তবে বাস্তবে কখনই জিজ্ঞাসা করতে পারে না যে সম্ভাব্য অন্যান্য মডেলের জায়গাতে দ্বিপদী কীভাবে ছিল। বেইসিয়ানরা যারা বেয়েস ফ্যাক্টরগুলি সম্পর্কে চিন্তা করে তারা আগ্রহী, অন্যরা এতটা না।


2
হুম, দুই ডাউন ভোট। উত্তরটি যদি খুব খারাপ হয় তবে কিছু মন্তব্য করতে ভাল লাগবে।
কনজুগেটেপায়ার

আমি এই উত্তরটি পছন্দ করেছি। কখনও কখনও লোকেরা ভোটের জবাবগুলি হ্রাস করে কারণ এটি কোনও পাঠ্যপুস্তকের মতো নয় এবং সাধারণ জ্ঞানের দাগযুক্ত বা বর্ণনার মতো সাধারণ লোক সমন্বিত আলোচনার সমস্ত সাইটকে সরিয়ে দেওয়ার চেষ্টা করে।
ভাস

আমি ডাউনভোট করি নি তবে আমি মনে করি একটি সমস্যা হ'ল আপনার বক্তব্য পরিষ্কার নয়।
এলভিস

6

অন্যান্য চমৎকার উত্তরের জন্য একটি পক্ষের নোট: উপলক্ষে এমন সময় রয়েছে যা আমরা না করি। উদাহরণস্বরূপ, খুব সম্প্রতি অবধি, এপিডেমিওলজি জার্নালে এগুলি সম্পূর্ণ নিষিদ্ধ ছিল - এখন তারা নিছক " দৃ disc়ভাবে নিরুৎসাহিত" এবং সম্পাদকীয় বোর্ড তাদের আলোচনার জন্য এখানে প্রচুর পরিমাণে ব্যয় করেছে: http: //journals.lww। কম / epidem / পৃষ্ঠাগুলি / collectiondetails.aspx? TopicalCollectionId = 4



2

সম্ভাবনা সংজ্ঞায়িত করুন । আমি বলতে চাইছি। আমরা আরও কোনও অগ্রগতির আগে, আমাদের শর্তাবলী নিষ্পত্তি করা দরকার।

DM

P(M|D)P(M,D)

106/28109

চিকিত্সা শর্তাবলী এবং তারা যেভাবে কাজ করে তা নিয়ে ব্যবহারিক বিশ্বে সমস্যাগুলির ক্ষেত্রে, আপনি যৌথ বন্টনের এই উপাদানগুলির কোনওটির সাথেই আসতে সক্ষম হবেন না এবং শর্তও পাচ্ছেন না।

P(M,D)p=0.5P(p=0.5)=0B(0.5,0.5)B(1000,1000)0.528109/(28109+106)

সঠিক মডেলগুলি ঠিক কী তা নিয়ে কথা বলার অসুবিধা ছাড়াও, বায়েশিয়ান পদ্ধতিতে মডেলের ভুল বান্ধবীর মোকাবিলার সীমিত উপায় রয়েছে। যদি আপনি গাউসীয় ত্রুটিগুলি পছন্দ করেন না, বা আপনি মুদ্রা টসসের স্বাধীনতায় বিশ্বাস করেন না (আপনার হাত প্রথম 10,000 বা টসসের পরে ক্লান্ত হয়ে যায়, তাই আপনি এটি প্রথম 1000 বা এত বারের মতো টস করবেন না, হ্যাঁ সম্ভাব্যতাগুলিকে প্রভাবিত করতে পারে), আপনি বেইসিয়ান বিশ্বে যা কিছু করতে পারেন তা হ'ল সাধারণ মিশ্রণের জন্য স্টিক ব্রেকিং প্রিয়ারগুলি, সময়ের সাথে সাথে সম্ভাবনাগুলিতে স্প্লিং হয়ে যায় whatever তবে হুবার স্যান্ডউইচ স্ট্যান্ডার্ড ত্রুটির কোনও সরাসরি অ্যানালগ নেই যা স্পষ্টভাবে স্বীকার করে যে মডেলটি ভুল বানানো হতে পারে এবং তার জন্য দায়বদ্ধ হতে প্রস্তুত prepared

<Ω,F,P>ΩFσPAΩAFXt,t[0,1]{Xt>0,t[0,0.5]}{Xt>0,t{t1,t2,,tk}}kσ


1

তবে আমরা যদি মডেলটির সম্ভাবনাটি অনুমান করতে চাই, তবে কেন আমরা পরীক্ষায় দেওয়া মডেলের সম্ভাব্যতা গণনা করব না?

কারণ আমরা কীভাবে জানি না। অসীম সংখ্যক মডেল সম্ভব এবং তাদের সম্ভাবনার স্থানটি সংজ্ঞায়িত করা হয়নি।

এখানে একটি বাস্তব উদাহরণ। ধরা যাক আমি মার্কিন জিডিপি পূর্বাভাস করতে চাই। আমি সময় সিরিজ পেতে, এবং একটি মডেল ফিট। এই মডেলটি সত্য হওয়ার সম্ভাবনা কী?

Δlnyt=μ+et
μet

এখানে চিত্র বর্ণনা লিখুন

lnyt=ct+et
c

μ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.