অনুমান এবং সিদ্ধান্ত তত্ত্বের কাঠামোর ক্ষেত্রে বায়েসিয়ান হাইপোথিসিস পরীক্ষার অর্থ কী?


15

আমার ব্যাকগ্রাউন্ডটি মূলত মেশিন লার্নিংয়ে এবং আমি বায়েশিয়ান হাইপোথেসিস পরীক্ষার অর্থ কী তা জানার চেষ্টা করছিলাম। আমি সম্ভাবনার ব্যায়েশিয়ান ব্যাখ্যার সাথে ঠিক আছি এবং সম্ভাব্য গ্রাফিকাল মডেলগুলির প্রসঙ্গে আমি এর সাথে পরিচিত। যাইহোক, যা আমাকে বিভ্রান্ত করছে তা হল পরিসংখ্যানগত অনুক্রমের প্রসঙ্গে "হাইপোথিসিস" শব্দের অর্থ।

আমি মনে করি যে প্রায়শই পরিসংখ্যান এবং অনুমানের ক্ষেত্রে ব্যবহার করা হয় মেশিন লার্নিংয়ের ক্ষেত্রে আমি যে ভোকাবুলারিটি ব্যবহার করতে অভ্যস্ত তা সম্পর্কে আমি বিভ্রান্ত হয়ে পড়ছি।

প্রসঙ্গে তত্ত্বাবধানে থাকা লার্নিং , আমি সাধারণত ভবিষ্যদ্বাণীপূর্ণ ফাংশন থেকে ম্যাপের অর্থাৎ তার লেবেলে উদাহরণ হিসাবে অনুমান মনে । তবে, আমার কাছে মনে হয় যে হাইপোথিসিস শব্দটি আমি যে পাঠ্যগুলিতে করছি তার একই অর্থ নেই same আমি যে রিডিংগুলি পড়ছি তার একটি নির্যাস আটকে দিন:h:XY

এখানে চিত্র বর্ণনা লিখুন

আপনি মনোযোগ সহকারে পড়লে এটি আরও বলে:

পর্যবেক্ষণ করা তথ্যের জন্য আলাদা মডেল রয়েছে ...

তারা কি শব্দটি মডেল ব্যবহার করেছিল? আমার জন্য শব্দটি মডেলটি আমাকে একটি নির্দিষ্ট ভবিষ্যদ্বাণীপূর্ণ ফাংশনটি নির্বাচন করে ফাংশনের একটি সেট সম্পর্কে ভাবিয়ে তোলে। অর্থাত্ ফাংশনের একটি অনুমান শ্রেণি। উদাহরণস্বরূপ, চতুর্ভুজ ফাংশন (ডিগ্রি 2 এর বহুপদী) অনুমানের শ্রেণি হতে পারে। যাইহোক, আমার কাছে মনে হয় তারা মডেল এবং হাইপোথিসিস শব্দটি এই নিষ্কর্ষের সমার্থক হিসাবে ব্যবহার করেছেন (যেখানে আমার জন্য তারা সম্পূর্ণ আলাদা শব্দ)।Hd2

তারপরে এটি উল্লেখ করা যায় যে আমরা হাইপোথিসিসে প্রিয়ারদের রাখতে পারি (বায়সিয়ান সেটিংয়ে করা সম্পূর্ণ যুক্তিসঙ্গত জিনিস):

pH(Hm),     m={0,1,...,M1}

এছাড়াও আমরা বর্তমান অনুমানের সাথে ডেটাগুলিকে বৈশিষ্ট্যযুক্ত করতে পারি:

py|H(|Hm),     m={0,1,...,M1}

এবং আমাদের বর্তমান বিশ্বাসকে কিছু ডেটা দেওয়া (এবং বেয়ের নিয়ম) আপডেট করুন:

pH|y(Hm|y),     m={0,1,...,M1}

তবে, আমি অনুমান করি যে পুরো অনুমানের শ্রেণীর চেয়ে একটি হাইপোথিসিস ক্লাস থেকে নির্দিষ্ট প্যারামিটারে (বলুন ta ) বায়েসিয়ান অনুমান রাখার ক্ষেত্রে আমি বেশি অভ্যস্ত । মূলত যেহেতু মনে হয় যে এই "হাইপোথিসিস" মেশিন লার্নিং প্রসঙ্গে যে অনুশীলনগুলি ব্যবহার করছি তা একই অনুমান নয়, তাই আমার কাছে মনে হয় যে এই অনুমানগুলি একটি অনুমানক শ্রেণীর চেয়ে নির্দিষ্ট- প্যারামিটারের সাথে বেশি মিল রয়েছে ।θθ

এই মুহুর্তে আমি বিশ্বাস ছিল যে, "হাইপোথিসিস" ভবিষ্যদ্বাণীপূর্ণ ফাংশনে একই জিনিস বোঝানো (ক পরামিতি দ্বারা parametrized , উদাহরণস্বরূপ), কিন্তু আমি মনে করি আমি ভুল ছিল ...θ

আমার বিভ্রান্তিটিকে আরও খারাপ করে তুলতে, পরে এই একই পাঠগুলি প্রতিটি প্রশিক্ষণের উদাহরণে তারা পর্যবেক্ষণ করে একটি নির্দিষ্ট "অনুমান" নির্দিষ্ট করার জন্য এগিয়ে যায়। আমি যা বলতে চাইছি তার একটি এক্সট্রাক্ট আটকানো যাক:

এখানে চিত্র বর্ণনা লিখুন

এটি আমাকে বিভ্রান্ত করার কারণটি হ'ল, যদি আমি অনুমানটিকে পরামিতি হিসাবে ব্যাখ্যা করি তবে আমার জন্য আমাদের প্রতিটি নমুনার মানের জন্য একটি নির্দিষ্ট পরামিতি নির্দিষ্ট করে বোঝা যায় না। এই মুহুর্তে আমি উপসংহারে পৌঁছেছি যে অনুমান দ্বারা তারা কী বোঝায় আমি সত্যিই জানতাম না তাই আমি এই প্রশ্নটি পোস্ট করেছি।

যাইহোক, আমি সম্পূর্ণরূপে ছেড়ে দিতে হবে না, আমি গবেষণা frequentist পরিসংখ্যান কি অনুমান উপায়ে এবং নিম্নলিখিত পাওয়া খান একাডেমী ভিডিও । এই ভিডিওটি আসলে আমার কাছে অনেক কিছু বোঝায় (সম্ভবত আপনি ঘন ঘনবাদী! :)) । তবে মনে হয় যে তারা একগুচ্ছ ডেটা পেয়েছেন (কিছু "নমুনা সেট" এর মতো) এবং নমুনা সেটের বৈশিষ্ট্যের ভিত্তিতে তারা সিদ্ধান্ত নেন যে ডেটা সম্পর্কে নাল হাইপোথিসিটি গ্রহণ করবেন বা প্রত্যাখ্যান করবেন কিনা। যাইহোক, আমি যে বায়েসীয় প্রসঙ্গে পড়ছি, আমার কাছে মনে হয় যে প্রতিটি ডেটা [পয়েন্ট] ভেক্টর পর্যবেক্ষণ করা হয়েছে, তারা "সম্ভাবনা অনুপাতের পরীক্ষা" দিয়ে একটি অনুমান দিয়ে "এটি লেবেল" করেছেন:

এখানে চিত্র বর্ণনা লিখুন

তারা যেভাবে প্রতিটি ডেটা নমুনায় হাইপোথিসিস নির্ধারণ করছে, এমনকি তত্ত্বাবধানের শিক্ষার সেটিংয়ের মতো মনে হয় আমরা প্রতিটি প্রশিক্ষণ সংস্থায় একটি লেবেল সংযুক্ত করছিলাম। তবে আমি মনে করি না যে তারা এই প্রসঙ্গে কী করছে in তারা কি করছে? প্রতিটি ডেটা নমুনায় হাইপোথিসিস নির্ধারণের অর্থ কী? অনুমানের অর্থ কী? মডেল শব্দের অর্থ কী?

মূলত, আমার বিভ্রান্তির দীর্ঘ ব্যাখ্যা করার পরে, কেউ কি জানেন যে এই প্রসঙ্গে বেয়েসিয়ান অনুমানের পরীক্ষার অর্থ কী?


আমার প্রশ্নের উন্নতি করতে আপনার যদি কোনও স্পষ্টতা বা কোনও কিছু প্রয়োজন হয় বা যাতে প্রশ্নটি বোঝা যায় তবে আমি সাহায্য করতে পেরে অনেক বেশি আনন্দিত :)


উত্তরের জন্য অনুসন্ধানে আমি পরিসংখ্যান অনুমানের পরীক্ষার সাথে সম্পর্কিত কিছু দরকারী জিনিস পেয়েছি:

আপনি যদি কোনও সিএস ব্যাকগ্রাউন্ড থেকে আসে (এটি আমার মতো): এটির একটি বিষয়টির একটি ভাল পরিচয় সম্বোধন করে:

কম্পিউটার বিজ্ঞানীদের জন্য পরিসংখ্যান অনুমানের পরীক্ষার একটি ভাল ভূমিকা কী?

এক পর্যায়ে আমি "ডিফল্ট প্যারামিটারগুলি" সম্পর্কে জিজ্ঞাসা করেছি (যা আমি যা বোঝাতে চেয়েছিলাম তা বোঝানো উচিত। আমি মনে করি এটি একটি স্ট্যান্ডার্ড টার্ম তবে এটি নয়, তাই এখানে আমি এটিকে সম্বোধন করব) এবং আমি মনে করি যে আমি কী বোঝাতে চাইছি তা কীভাবে হয় আপনি প্রতিটি অনুমানের জন্য পরামিতি নির্দিষ্ট করে। উদাহরণস্বরূপ, আপনার নাল অনুমানটি কী এবং এর পরামিতিগুলি কীভাবে আপনি তা স্থির করেন। এটি সম্পর্কিত একটি প্রশ্ন রয়েছে:

অনুমানের পরীক্ষায় নাল অনুমানকে কীভাবে নির্দিষ্ট করা যায়


@ শি'আন আমি নীচের উইকিপিডিয়া নিবন্ধটি পড়েছি: en.wikedia.org/wiki/Statistical_model এগুলি কী একটি মডেল এবং একটি অনুমান দ্বারা বোঝায়? আপনার ধৈর্য বিটিডব্লিউ :) এর জন্য THNX :)
পিনোচিও

3
আমি এই আলোচনায় অংশ নিতে দ্বিধাগ্রস্ত, কারণ আমার ধারণা যে আপনার সমস্যাটি হ'ল হাইপোথিসিস টেস্টিংয়ের অর্থ নীতিগতভাবে বোঝার চেয়ে একটি যে বায়সীয় কাঠামোয় বিশেষত হাইপোথিসিস টেস্টিং কী তা বোঝার চেয়ে। এটির জন্য সহায়তা করার জন্য, আমি গিজারের রচনা "মোডেস অফ প্যারাম্যাট্রিক স্ট্যাটিস্টিকাল ইনফারেন্স" বইটি একবার দেখার পরামর্শ দিই। books.google.ca/…
rocinante

@ ক্রিন্যান্তে আমার মনে হয় আমি আপনার সাথে একমত আমি সাধারণভাবে হাইপোথিসিস টেস্টিং সম্পর্কে স্পষ্টতই বিভ্রান্ত হয়ে পড়েছি (এবং বায়সিয়ান ফ্রেমওয়ার্কটি মোটেই সহায়তা করে না)। আমি অবশ্যই এটি এক নজরে নেব। আপনার ধৈর্য এবং বোঝার জন্য ধন্যবাদ, এটির প্রশংসিত
পিনোকিও

এটি বোঝার পক্ষে সহজ জিনিস নয় কারণ সংক্ষিপ্ত উপায়ে উচ্চারণ করা সহজ জিনিস নয়। বিমূর্ত পদগুলিতে (মানচিত্রের মতো) এ সম্পর্কে ভাবার পরিবর্তে, আপনি যদি এটির একটি সহজ উদাহরণ দিয়ে চিন্তা করেন তবে এটি সাহায্য করবে
1/2

1
2/2 ধরুন আপনার একটি মুদ্রা রয়েছে এবং আপনি এটি দেখতে চান কিনা তা সঠিক, সুতরাং আপনি এটি 50 বার ফ্লিপ করুন। আপনার কাছে এখন একটি ডেটা সেট রয়েছে যা সম্পর্কে আপনি কিছুটা অনুমান করতে চান (অর্থাত্ মুদ্রা পক্ষপাতদুষ্ট বা না)। যৌক্তিকভাবে, মুদ্রাটি যদি সুষ্ঠু হয় তবে প্রায় অর্ধেক টসস মাথা হওয়া উচিত। (দ্রষ্টব্য যে এটি একটি পরিসংখ্যানের ব্যয় নয়, তবে আপনার নিজস্ব যৌক্তিক যুক্তি)। এটাই আপনার অনুমান। আপনি এই হাইপোথিসিসটি 2 উপায় পরীক্ষা করতে পারেন: বায়েসিয়ান উপায় এবং ঘন ঘন উপায়।
rocinante

উত্তর:


10

সম্ভাব্যতা বিতরণের পরিবার একটি পরিসংখ্যানগত মডেল দেয় is যখন মডেল স্থিতিমাপ, এই পরিবার একটি অজানা পরামিতি দ্বারা সূচিবদ্ধ : এফ = { ( | θ ) ; θ Θ } এক একটি হাইপোথিসিস পরীক্ষা করতে চায় θ মত এইচ 0 :θ

F={f(|θ); θΘ}
θ , এক বিবেচনা করতে পারেন দুটি মডেল বিরোধিতায় আছেন: এফ বনাম এফ 0 = {( | θ ) ; θ Θ 0 } থেকেআমার Bayesian দৃষ্টিকোণ, আমি ডেটা পিছনে মডেল, সূচক উপর অনুমান আঁকছি এম । অত: পর আমি করা এই সূচক একটি পূর্বে, ρ 0 এবং ρ একটি , সেইসাথে উভয় মডেলের পরামিতি উপর, π 0 ( θ ) উপর Θ 0 এবং πH0:θΘ0F
F0={f(|θ); θΘ0}
Mρ0ρaπ0(θ)Θ0 উপর Θ । এবং তারপরে আমি এই সূচকের উত্তর বিতরণটি হ্রাস করব: π ( m = 0 | x ) = ρ 0 Θ 0 f ( x | θ ) π 0 ( θ ) d θπa(θ)Θ আপনি যে দস্তাবেজটি লিঙ্কঅনেক আরো বিস্তারিত জানার মধ্যে যায় এই দৃষ্টিকোণে এবং অনুমানের পরিসংখ্যানগত পরীক্ষায় আপনার পছন্দের প্রবেশটি হওয়া উচিত, যদি না আপনি পুরো বেইসিয়ান বইয়ের মধ্য দিয়ে যেতে সক্ষম না হন। এমনকি একটি মেশিন লার্নিং বই
π(m=0|x)=ρ0Θ0f(x|θ)π0(θ)dθρ0Θ0f(x|θ)π0(θ)dθ+(1ρ0)Θf(x|θ)πa(θ)dθ
কেভিন মারফি মত 'র।

XN(θ,1)H0:θ=0θ=0N(0,1)θθN(0,10)ρ0=1/2

π(m=0|x)=12πexp{x2/2}12πexp{x2/2}+R12πexp{(xθ)2/2}12π×10exp{θ2/20}dθ=exp{x2/2}exp{x2/2}+111exp{x2/22}

pH(H0)F0θF0py|H(y|H0)H0H0

HmθFmHm=(θ,Fm)θFm

ϱ0H0F0ϱ0=0π0(θ)θH0

সুতরাং যদি অনুমানটি প্রস্তাবিত পরিসংখ্যানের মডেল এবং একটি ডিফল্ট প্যারামিটারের টিপল হয় তবে ডিফল্ট প্যারামিটারটি কীভাবে নির্বাচিত হয়?
পিনোকিও

θ=0

4

দুর্দান্ত প্রশ্ন। আমি মনে করি আপনার বিভ্রান্তির ফলে "ঘনঘনবাদী" এবং "বায়সিয়ান" দৃষ্টিভঙ্গির মধ্যে কিছু প্রাথমিক পার্থক্য দেখা দিতে পারে। আমার প্রাক্তনটির সাথে প্রচুর অভিজ্ঞতা আছে এবং পরবর্তীকালে আমি নতুন তাই কয়েকটি সাধারণ পর্যবেক্ষণ চেষ্টা করার ফলে আমারও খুব উপকার হতে পারে। আমি আপনার প্রশ্নটি কয়েকটি স্বতন্ত্রতা পরিষ্কার করার জন্য সম্পাদনা করেছি - কমপক্ষে, আমি যেমন বুঝতে পারি। আমি আশা করি আপনি কিছু মনে করবেন না! যদি আমার কিছু ভুল হয় তবে আপনি আপনার প্রশ্নটি পুনরায় সম্পাদনা করতে বা এই প্রতিক্রিয়াতে একটি মন্তব্য যুক্ত করতে পারেন।

1) কিছুটা প্রাথমিক শোনার ঝুঁকিতে: একটি মডেল এমন কোনও বিবৃতি যা বাস্তবতার ব্যাখ্যা দেওয়ার চেষ্টা করে যেমন "যদি আমার প্রাতঃরাশের জন্য প্যানকেক থাকে তবে তা মঙ্গলবার হওয়া উচিত।" যেমন একটি মডেল একটি অনুমান হয়। জর্জ বক্সের একটি বিখ্যাত উক্তি: "সমস্ত মডেল ভুল, কিছু মডেল দরকারী।" কোনও মডেলটি কার্যকর হওয়ার জন্য এটির পরীক্ষা করার কিছু উপায় থাকতে হবে। প্রতিযোগিতামূলক অনুমানের ধারণা এবং আপনার একটি প্রশ্নের উত্তর লিখুন। আমি পরামর্শ দেব যে "... পরিসংখ্যানগত অনুক্রমের প্রসঙ্গে" একটি অনুমানটি এমন কোনও মডেল যা কার্যকর হতে পারে এবং গাণিতিকভাবে পরীক্ষা করা যেতে পারে can সুতরাং হাইপোথিসিস টেস্টিং কোনও মডেলটি কার্যকর নয় কিনা সে সম্পর্কে সিদ্ধান্ত নেওয়ার একটি মাধ্যম। সংক্ষেপে, একটি অনুমান বিবেচনাধীন একটি মডেল। এটি একই ফাংশন বা বিভিন্ন ফাংশনের বিভিন্ন পরামিতি মান হতে পারে।

২) আপনার কাহান ভিডিওটি হাইপোথিসিস টেস্টিংয়ের জন্য বাইশিয়ান "ফ্রিকোয়েনসিস্ট" পদ্ধতির কলটির একটি উদাহরণ যার ফলে বায়েসিয়ান আপনার লেকচার নোটগুলিতে এটি প্রয়োগ করার চেষ্টা করার সময় এটি আপনাকে বিভ্রান্ত করতে পারে। আমি দুটি পদ্ধতির প্রয়োগের (যা বিপজ্জনক হতে পারে) এর মধ্যে একটি সাধারণ পার্থক্য নিয়ে আসার চেষ্টা করছি। আমি মনে করি আমি দার্শনিক পার্থক্যটি যুক্তিসঙ্গতভাবে ভালভাবে বুঝতে পারি। আমি যা দেখেছি তা থেকে, "ফ্রিকোয়েন্সিস্ট" ডেটাগুলিতে একটি এলোমেলো উপাদান অনুমান করে এবং পর্যবেক্ষণ করা ডেটাটিকে কীভাবে নন-এলোমেলো পরামিতি দেওয়া হয় তা পরীক্ষা করে। "বয়েসিয়ান" ধরে নেয় ডেটা স্থির এবং এলোমেলো পরামিতিগুলির সর্বাধিক সম্ভাব্য মান নির্ধারণ করে। এই পার্থক্য বিভিন্ন পরীক্ষার পদ্ধতি বাড়ে।

"ফ্রিকোয়েনসিস্ট" হাইপোথিসিস টেস্টিংয়ে, এমন একটি মডেল যা কার্যকর হতে পারে সেগুলি এমন একটি যা কিছু প্রভাব ব্যাখ্যা করে তাই এটি "নাল হাইপোথিসিস" এর সাথে তুলনা করা হয় - কোনও প্রভাবের মডেল। কোনও কার্যকর মডেল স্থাপনের চেষ্টা করা হয় যা কোনও প্রভাব ছাড়াই মডেলটির সাথে পারস্পরিক একচেটিয়া। পরীক্ষাটি তখন কোনও প্রভাবের অনুমানের অধীনে ডেটা পর্যবেক্ষণের সম্ভাবনার উপর। যদি সেই সম্ভাবনা কম থাকে তবে নাল অনুমানটি বাতিল হয়ে যায় এবং বিকল্পটি বাকি রয়েছে is (দ্রষ্টব্য যে একজন পিউরিস্ট কখনও নাল অনুমানকে "গ্রহণ" করতে পারেন না, কেবল একটিটিকে "প্রত্যাখ্যান করতে ব্যর্থ" হন It এটি পিনের মাথায় ফেরেশতাদের মতো নাচের মতো শোনা যায় তবে পার্থক্যটি মূলত দার্শনিক একটি) ইন্ট্রো পরিসংখ্যান সাধারণত সাধারণত যা হতে পারে তার সাথে শুরু হয় সবচেয়ে সহজ উদাহরণ হোন: "দুটি গ্রুপ আলাদা are"এলোমেলো পরীক্ষার দ্বারা পরিমাপ করা যতটা দুর্দান্ত বা তার চেয়ে বড় সেগুলি পৃথক নয় given এটি সাধারণত একটি টি-পরীক্ষা যেখানে নাল অনুমানটি হ'ল মাধ্যমের পার্থক্যটি শূন্য। সুতরাং প্যারামিটারটি শূন্যের একটি নির্দিষ্ট মানের গড় হয়।

Bayesian বলেন, "এক মিনিট ধর, আমরা সেইসব পরিমাপ তৈরি এবং তারা হয় বিভিন্ন, তাই কিভাবে সম্ভবত যে?" তারা (এখন) এলোমেলো প্যারামিটারের প্রতিটি মানের জন্য সম্ভাব্যতা গণনা করে এবং সম্ভবত সবচেয়ে বেশি হিসাবে সর্বোচ্চটিকে বেছে নেয়। সুতরাং এক অর্থে, প্যারামিটারের প্রতিটি সম্ভাব্য মান একটি পৃথক মডেল। তবে এখন সর্বোচ্চ সম্ভাবনার মডেলটি যথেষ্ট গুরুত্বপূর্ণ কিনা তা নিয়ে সিদ্ধান্ত নেওয়ার একটি উপায় তাদের প্রয়োজন। এজন্য আপনার বক্তৃতা নোটগুলি ব্যয়ের কাজটি প্রবর্তন করেছিল। একটি ভাল সিদ্ধান্ত নেওয়ার জন্য, ভুল সিদ্ধান্ত নেওয়ার পরিণতি সম্পর্কে কিছু ধারণা নেওয়া দরকার।

3) "প্রতিটি ডেটা নমুনায় হাইপোথিসিস নির্ধারণের অর্থ কী?" আমি মনে করি না তারা। "স্যাম্পল পয়েন্ট" বলতে কী বোঝায় সে সম্পর্কে সতর্ক থাকুন। আমি বিশ্বাস করি যে তারা একটি নির্দিষ্ট নমুনা ভেক্টরকে উল্লেখ করছে এবং নমুনা স্থানের সমস্ত নমুনা ভেক্টরগুলির জন্য প্রতিটি অনুমানের সম্ভাবনা কতটা তা জানতে চাই। সমীকরণ (14) এবং (15) নির্দিষ্ট নমুনা ভেক্টরের জন্য দুটি অনুমানকে কীভাবে তুলনা করবেন তা দেখায়। সুতরাং তারা কীভাবে মাত্র দুটি তুলনা করতে পারে তা দেখিয়ে একাধিক অনুমানের তুলনা করার একটি সাধারণ যুক্তি সহজ করে দিচ্ছে।


0

বলুন আপনার কাছে একটি সেট বাক্সের ডেটা রয়েছে। ডেটা দৈর্ঘ্য (এল), প্রস্থ (ডাব্লু), উচ্চতা (এইচ) এবং ভলিউম (ভি) নিয়ে গঠিত।

বাক্স / জ্যামিতি সম্পর্কে আমরা যদি বেশি কিছু না জানি তবে আমরা মডেলটি চেষ্টা করতে পারি:

V = a*L + b*W + c*H + e

এই মডেলটিতে তিনটি পরামিতি রয়েছে (ক, খ, সি) যা বিভিন্ন রকম হতে পারে এবং ত্রুটি / ব্যয় শর্ত (ঙ) হাইপোথিসিসটি ডেটা কতটা ফিট করে তা বর্ণনা করে। প্রতিটি প্যারামিটার মানগুলির সংমিশ্রণটি একটি পৃথক অনুমান হিসাবে বিবেচিত হবে। নির্বাচিত "ডিফল্ট" প্যারামিটার মানটি সাধারণত শূন্য হয়, যা উপরের উদাহরণে ভি এবং এল, ডব্লিউ, এইচ এর মধ্যে "কোনও সম্পর্ক নেই" এর সাথে মিলিত হবে would

লোকেরা কী করে তা এই "ডিফল্ট" হাইপোথিসিসটি পরীক্ষা করে পরীক্ষা করে দেখা হয় যে কিছুটা কাট-অফ মানের বাইরে, সাধারণত কোনও পি-ভ্যালু গণনা করে মডেলটির চারপাশের ত্রুটির একটি সাধারণ বিতরণ ধরে। যদি সেই হাইপোথিসিসটি প্রত্যাখ্যান করা হয়, তবে তারা ক, বি, সি পরামিতিগুলির সংমিশ্রণ আবিষ্কার করে যা সম্ভাবনা সর্বাধিক করে এবং এটি সম্ভবত সম্ভবত অনুমান হয়। যদি তারা বায়সিয়ান হয় তবে তারা প্রতিটি প্যারামিটার মানগুলির সেটগুলির পূর্বের দ্বারা সম্ভাবনাটিকে বহুগুণ করে এবং উত্তরটি সম্ভাবনার সর্বাধিকতর করে এমন সমাধান চয়ন করে।

স্পষ্টতই এই কৌশলটি অপ-অনুকূল যে মডেলটি সংযোজন হিসাবে ধরে নিয়েছে এবং মিস করবে যে সঠিক অনুমানটি রয়েছে:

V = L*W*H + e

সম্পাদনা: @ পিনোচিও

সম্ভবত কেউ অসতর্কিত অনেকের মধ্যে থেকে এক / কয়েকটি ফাংশন (বা আপনি যেমন রেখেছেন: "হাইপোথিসিস ক্লাস") বেছে নেওয়ার যৌক্তিক কারণ না থাকলে হাইপোথিসিস টেস্টিংটি অনুকূল নয় এই দাবির সাথে একমত নন। অবশ্যই এটি তুচ্ছ সত্য, এবং "ব্যয় কার্যকারিতা এবং সরবরাহগুলি সরবরাহ করা সর্বোত্তম ফিট" এর সীমাবদ্ধ অর্থে "অনুকূল" ব্যবহার করা যেতে পারে। এই মন্তব্যটি এটিকে আমার উত্তরে পরিণত করেছে কারণ মডেল স্পেসিফিকেশনের বিষয়টি আপনার শ্রেণীর নোটগুলিতে কীভাবে প্রকাশিত হয়েছিল তা আমি পছন্দ করি না। এটি বেশিরভাগ বৈজ্ঞানিক কর্মীদের মুখোমুখি মূল সমস্যা, যার জন্য আফাইক কোনও অ্যালগরিদম নেই।

আরও, আমি পি-মানগুলি, হাইপোথিসিস টেস্টিং ইত্যাদি বুঝতে না পারছি যতক্ষণ না আমি ইতিহাসটি বুঝতে পারি, সুতরাং সম্ভবত এটি আপনাকেও সহায়তা করবে। ঘন ঘন পারমানবিক হাইপোথিসিস পরীক্ষার আশেপাশে বিভ্রান্তির একাধিক উত্স রয়েছে (আমি বায়সিয়ান রূপটির ইতিহাসের সাথে এতটা পরিচিত নই)।

মূলত নেইমন-পিয়ারসন অর্থে "হাইপোথিসিস টেস্টিং" নামে পরিচিত, রোনাল্ড ফিশার দ্বারা বিকাশিত "তাত্পর্য পরীক্ষা" এবং বিজ্ঞানের সর্বত্র ব্যাপকভাবে ব্যবহৃত এই দুটি কৌশলগুলির কোনও দুর্বল সংজ্ঞায়িত, "হাইব্রিড" কখনই যথাযথভাবে ন্যায়সঙ্গত হয়নি which আপত্তিজনকভাবে উপরের শব্দটি ব্যবহার করে বা "নাল অনুমানের তাত্পর্য পরীক্ষা করা") উল্লেখ করা যেতে পারে। যদিও আমি উইকিপিডিয়া পৃষ্ঠাটি অনুমোদনমূলক হিসাবে নেওয়ার পরামর্শ দেব না, এই বিষয়গুলি নিয়ে আলোচনা করা অনেক উত্স এখানে পাওয়া যাবে । কয়েকটি মূল বিষয়:

  1. একটি "ডিফল্ট" হাইপোথিসিসের ব্যবহার মূল অনুমানের পরীক্ষার পদ্ধতির অংশ নয়, বরং ব্যবহারকারীরা বিবেচনাধীন মডেলগুলি নির্ধারণ করতে পূর্বের জ্ঞান ব্যবহার করার কথা। আমি তুলনা করার জন্য অনুমানের একটি নির্দিষ্ট সেট চয়ন করার কোনও বিশেষ কারণ না থাকলে আমাদের করণীয় সম্পর্কে এই মডেলের সমর্থকদের সুস্পষ্ট সুপারিশ আমি কখনই দেখিনি। এটি প্রায়শই বলা হয় যে এই পদ্ধতির মান নিয়ন্ত্রণের জন্য উপযুক্ত, যখন কিছু পরিমাপের সাথে তুলনা করার জন্য পরিচিত সহিষ্ণুতা রয়েছে।

  2. ফিশারের "তাত্পর্যপূর্ণ পরীক্ষা" দৃষ্টান্তের অধীনে কোনও বিকল্প অনুমান নেই, কেবল একটি নাল অনুমান, যা তথ্য প্রদত্ত সম্ভাব্য বলে বিবেচিত হলে তা প্রত্যাখ্যান করা যেতে পারে। আমার পড়া থেকে, ফিশার নিজেই ডিফল্ট নাল হাইপোথেসিস ব্যবহারের ক্ষেত্রে সমকক্ষ ছিলেন। আমি কখনই তাকে এ বিষয়ে স্পষ্টভাবে মন্তব্য করতে পাইনি, তবে তিনি অবশ্যই এই পরামর্শ দেননি যে এটিই কেবল নাল অনুমানের হওয়া উচিত।

  3. ডিফল্ট নাল অনুমানের ব্যবহারকে কখনও কখনও অনুমানের পরীক্ষার "অপব্যবহার" হিসাবে চিহ্নিত করা হয়, তবে এটি উল্লিখিত জনপ্রিয় হাইব্রিড পদ্ধতির কেন্দ্রস্থল। যুক্তি দেখা যায় যে এই অনুশীলনটি প্রায়শই "একটি অকেজো প্রিলিমিনারি":

    "গবেষক একটি তাত্ত্বিক ভবিষ্যদ্বাণী তৈরি করেন, সাধারণত একটি প্রভাবের দিকনির্দেশনা ... যখন তথ্যগুলি উপাত্তের পূর্বাভাসিত দিকনির্দেশক ফলাফলটি দেখায়, তখন এটি অনুমানকে নিশ্চিত করে বলে মনে হয়। গবেষক একটি 'খড়ের ব্যক্তি' নাল অনুমানকে পরীক্ষা করেন যে প্রভাবটি আসলে শূন্য। যদি পরবর্তীটি .05 স্তরে (বা কিছু বৈকল্পিক) প্রত্যাখ্যান করা না যায় তবে তত্ত্বের আপাত নিশ্চিতকরণ দাবি করা যায় না ... এই ধরণের পরীক্ষায় একটি সাধারণ ত্রুটি আসলে তাত্পর্য অর্জনের তাত্পর্যকে বিভ্রান্ত করা হয় (জন্য মূল তত্ত্বের জন্য প্রাপ্ত নিশ্চিতকরণ স্তরটি দিয়ে স্ট্র-ব্যক্তি নালকে প্রত্যাখ্যান করা) ... নিশ্চিতকরণের শক্তি আসলে [কোনও গবেষকের সংখ্যার পূর্বাভাসের তীক্ষ্ণতা] এর উপর নির্ভর করে, খড়-ব্যক্তি শূন্যতার জন্য তাত্পর্যপূর্ণ স্তরের উপর নির্ভর করে না। "

    মনোবিজ্ঞানের নাল কল্পনা পরীক্ষা বিতর্ক। ডেভিড এইচ ক্রান্টজ আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশন জার্নাল; ডিসেম্বর 1999; 94, 448; 1372-1381

খান একাডেমির ভিডিওটি এই হাইব্রিড পদ্ধতির একটি উদাহরণ এবং সেই উদ্ধৃতিতে উল্লিখিত ত্রুটি করার জন্য দোষী। সেই ভিডিওতে উপলভ্য তথ্য থেকে আমরা কেবল এই সিদ্ধান্তে পৌঁছাতে পারি যে ইনজেকশন করা ইঁদুরগুলি ইনজেকশনবিহীন থেকে পৃথক, অন্যদিকে ভিডিওটি দাবি করেছে যে আমরা "ড্রাগটির অবশ্যই কিছু প্রভাব ফেলে" উপসংহারে পৌঁছাতে পারি। কিছুটা প্রতিফলন আমাদের এটি বিবেচনা করতে পরিচালিত করবে যে সম্ভবত পরীক্ষিত ইঁদুরগুলি ইনজেকশনবিহীন ইত্যাদির চেয়ে বেশি পুরানো ছিল ইত্যাদি। আমাদের তত্ত্বের পক্ষে প্রমাণ দাবি করার আগে আমাদের বিচারযোগ্য বিকল্প ব্যাখ্যা বাতিল করতে হবে। তত্ত্বের পূর্বাভাস যত কম সুনির্দিষ্ট হবে , এটি সম্পাদন করা তত বেশি কঠিন।

সম্পাদনা 2:

আপনার চিকিত্সা নির্ণয়ের নোটগুলি থেকে উদাহরণ গ্রহণ করা সাহায্য করবে। বলুন কোনও রোগী হয় "স্বাভাবিক" বা "হাইপারটেনসিভ সংকট" এর মধ্যে থাকতে পারে।

আমাদের কাছে পূর্বের তথ্য ছিল যে মাত্র 1% লোক হাইপারটেনসিভ সংকটে রয়েছে। হাইপারটেনসিভ সংকটে আক্রান্ত ব্যক্তির সিস্টোলিক রক্তচাপ থাকে যা গড় = 180 এবং এসডি = 10 সহ একটি সাধারণ বিতরণ অনুসরণ করে। এদিকে, সাধারণ লোকদের গড় বন্টন থেকে রক্তচাপ থাকে যার গড় পরিমাণ = 120, এসডি = 10 হয়। একজন ব্যক্তির যখন বিচার হয় শূন্য হয় তখন তার মূল্য নির্ধারণের ব্যয় হয় 1, এবং রোগ নির্ণয়ের ব্যয়টি 1 এবং চিকিত্সার কারণে পার্শ্বপ্রতিক্রিয়ার কারণে ব্যয় হয় 0.2 হয় নির্বিশেষে তারা সংকটে রয়েছে কি না। তারপরে নিম্নলিখিত আর কোডটি প্রান্তিক (এটা) এবং সম্ভাবনা অনুপাত গণনা করে। সম্ভাবনার অনুপাত যদি থ্রেশহোল্ডের চেয়ে বেশি হয় আমরা চিকিত্সা করার সিদ্ধান্ত নিই, যদি আমাদের চেয়ে কম না করা হয়:

#Prior probabilities
P0=.99 #Prior probability patient is normal
P1=1-P0 #Prior probability patient is in crisis

#Hypotheses
H0<-dnorm(x=50:250, mean=120, sd=10) #H0: Patient is normal
H1<-dnorm(x=50:250, mean=180, sd=10) #H1: Patient in hypertensive crisis

#Costs
C00=0 #Decide normal when normal
C01=1 #Decide normal when in crisis
C10=.2 #Decide crisis when normal
C11=.2 #Decide crisis when in crisis

#Threshold
eta=P0*(C10-C00)/ P1*(C01-C11)

#Blood Pressure Measurements
y<-rnorm(3, 150, 20)

#Calculate Likelihood of Each Datapoint Given Each Hypothesis
L0vec=dnorm(x=y, mean=120, sd=10) #Vector of Likelihoods under H0
L1vec=dnorm(x=y, mean=180, sd=10) #Vector of Likelihoods under H1

#P(y|H) is the product of the likelihoods under each hypothesis
L0<-prod(L0vec)
L1<-prod(L1vec)

#L(y) is the ratio of the two likelihoods
LikRatio<-L1/L0


#Plot
plot(50:250, H0, type="l", col="Green", lwd=4, 
     xlab=" Systolic Blood Pressure", ylab="Probability Density Given Model",
     main=paste0("L=",signif(LikRatio,3)," eta=", signif(eta,3)))
lines(50:250, H1, col="Red", lwd=4)
abline(v=y)

#Decision
if(LikRatio>eta){
  print("L > eta  ---> Decision: Treat Patient")
}else{
  print("L < eta  ---> Do Not Treat Patient")
}

উপরের দৃশ্যে প্রান্তিকতা = 15.84। যদি আমরা তিনটি রক্তচাপের পরিমাপ গ্রহণ করি এবং 139 139.9237, 125.2278, 190.3765 পাই, তবে হাইপারটেনসিভ সংকটে রোগী এইচ 1 এর পক্ষে সম্ভাবনা অনুপাত 27.6। যেহেতু আমরা চিকিত্সা করতে পছন্দ করি তার প্রান্তিকের চেয়ে 27.6 বৃহত্তর। গ্রাফটি সবুজ বর্ণের স্বাভাবিক অনুমান এবং লালচে হাইপারটেনসিভ দেখায়। উল্লম্ব কালো লাইনগুলি পর্যবেক্ষণের মানগুলি নির্দেশ করে।

এখানে চিত্র বর্ণনা লিখুন


যে নীচে ভোট দিয়েছে সে কি এই ব্যাখ্যা দিতে পারে? এই উত্তর দিয়ে কি ভুল? : এস
পিনোচিও

@ পিনোচিও আমি উত্তরে কিছু ইতিহাসের সাথে বিষয়গুলি পরিষ্কার করার চেষ্টা করেছি, "হাইপোথিসিস টেস্টিং" এর কারণে স্পষ্টভাবে আলোচনা করা একটি কঠিন বিষয়। আমি মনে করি যে মডেল / হাইপোথিসিস শব্দটি কীভাবে ব্যবহৃত হয় তা সম্পর্কিত প্রশ্নের উত্তর আমি দিয়েছি তবে এটি কীভাবে বোঝা যায় না: 'প্রতিটি ডেটা নমুনায় একটি হাইপোথিসিস নির্ধারণের অর্থ কী?'
লাইভ

আমি বুঝতে পারি না কেন এই উত্তরটি নিম্নচালিত হয়েছিল এবং কেন এটি বেশি উত্সাহিত হয়নি। এটা সত্যিই দুর্দান্ত। এটি কিছুটা তাত্ত্বিক সংজ্ঞা ব্যবহার করতে পারে, তবে এটি পরিসংখ্যানবিদদের চেয়ে বিস্তৃত শ্রোতার দিকে স্পষ্টমুখী। জিএলএম ব্যবহারের প্রথম উদাহরণটি ছিল বিশেষ করে আলোকিত এবং সম্পূর্ণ আমার (অসংখ্য) একাডেমিক পাঠ্যের সাথে সামঞ্জস্য। তল লাইনটি হ'ল ঘন ঘনবাদী এবং বায়সিয়ান হাইপোথিসিস পরীক্ষার মধ্যে প্রধান পার্থক্য হ'ল এমএপি গণনা করার জন্য পূর্বের অ্যাকাউন্টিং (কেবলমাত্র এমএলএর পরিবর্তে)।
চমত্কার

আমি যুক্ত করতে পারি যে জিএলএম এর সাথে প্রথম উদাহরণটির একটি গ্রাফিকাল উপস্থাপনা কি দুর্দান্ত এবং খুব আলোকিত হতে পারে, সম্ভবত একরকম উপকারের প্লট ব্যবহার করে ?
gaborous
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.