বেইস প্রাক্কলনকারী নির্বাচন বায়াস থেকে সুরক্ষিত


11

বায়েসের অনুমানকারী কি নির্বাচনের পক্ষপাতদুষ্ট থেকে সুরক্ষিত?

বেশিরভাগ কাগজপত্র যা উচ্চ মাত্রায় অনুমানের বিষয়ে আলোচনা করে, যেমন পুরো জিনোম সিকোয়েন্স ডেটা, প্রায়শই নির্বাচন পক্ষপাতের বিষয়টি উত্থাপন করবে। বাছাই পক্ষপাতদুটি এই সত্য থেকেই উদ্ভূত হয় যে, যদিও আমাদের কাছে হাজার হাজার সম্ভাব্য ভবিষ্যদ্বাণী রয়েছে মাত্র কয়েকজনকেই নির্বাচিত করা হবে এবং নির্বাচিত কয়েকটিতে অনুমান করা হয়। প্রক্রিয়াটি দুটি ধাপে চলে যায়: (1) ভবিষ্যদ্বাণীকারীদের একটি উপসেট নির্বাচন করুন (2) বাছাই করা সেটগুলিতে অনুমান সম্পাদন করুন, উদাহরণস্বরূপ, অনুমানের অনুপাতের অনুপাত। দাউদ তার 1994 এর প্যারাডক্স কাগজে নিরপেক্ষ অনুমানক এবং বেয়েস অনুমানকারীদের উপর দৃষ্টি নিবদ্ধ করেছিলেন। তিনি সবচেয়ে বড় প্রভাব নির্বাচন করতে সমস্যাটি সহজ করেন, যা চিকিত্সা প্রভাব হতে পারে। তারপরে তিনি বলেছেন, নিরপেক্ষ অনুমানকারীরা নির্বাচন পক্ষপাত দ্বারা প্রভাবিত হয়। তিনি উদাহরণটি ব্যবহার করেছেন: ধরে নিন তারপরে প্রতিটিZ i

জেডআমি~এন(δআমি,1),আমি=1,...,এন
জেডআমি জন্য । যাক , অনুমানকারী তবে পক্ষপাতদুষ্ট ( ইতিবাচক) জন্য \ সর্বোচ্চ \ {\ delta_1, \ delta_2, \ ldots, \ delta_N \} । এই বক্তব্যটি জেনসেনের অসমতার সাথে সহজেই প্রমাণিত হতে পারে। সুতরাং, আমরা যদি _ _ \ \ সর্বাধিক knew , বৃহত্তম ta ডেল্টা_আইয়ের সূচকটি জানতাম , তবে আমরা কেবলমাত্র Z_ {i _ \ \ সর্বোচ্চ} its এর অনুমানকারী হিসাবে ব্যবহার করব যা নিরপেক্ষ is তবে আমরা এটি জানি না বলে আমরা instead gamma_1 (\ mathbf {Z}) পরিবর্তে পক্ষপাতদুষ্ট হয়েছি (ইতিবাচক) ব্যবহার করি।জেড = ( জেড 1 , জেড 2 , , জেড এন ) টি γ 1 ( জেড ) = সর্বাধিক { জেড 1 , জেড 2 , , জেড এন } সর্বোচ্চ { δ 1 , δ 2 , , δ N } i সর্বোচ্চ δ আমি জেড আমি সর্বোচ্চ γ 1 ( টু Zδআমিজেড=(জেড1,জেড2,...,জেডএন)টি
γ1(জেড)=সর্বোচ্চ{জেড1,জেড2,...,জেডএন}
সর্বোচ্চ{δ1,δ2,...,δএন}আমিসর্বোচ্চδআমিজেডআমিসর্বোচ্চγ1(জেড)

এখানে চিত্র বর্ণনা লিখুন

তবে দাউদ, ইফ্রন এবং অন্যান্য লেখকরা উদ্বেগজনক বক্তব্যটি বায়েসের অনুমানকারী নির্বাচন পক্ষপাত থেকে সুরক্ষিত। এখন আমি পূর্বে করা হবে যদি বলতে , তারপর এর বায়েসের মূল্নির্ধারক দেওয়া হয় যেখানে , সাথে মানক ।δ ig ( ) δ i E { δ iZ i } = z i + dδআমিδআমি~()δআমিm(zi)=φ(zi-δi)g(δi)dδiφ()

{δআমি|জেডআমি}=z- রআমি+ +z- রআমিমি(z- রআমি)
মি(z- রআমি)=φ(z- রআমি-δআমি)(δআমি)δআমিφ()

আমরা নতুন মূল্নির্ধারক সংজ্ঞায়িত তাহলে হিসাবে যাই হোক না কেন আপনি অনুমান করার জন্য নির্বাচন সঙ্গে , নির্বাচনটি উপর ভিত্তি করে একই হবে এটি অনুসরণ করে কারণ তে । আমরা আরও জানি যে Z শূন্যের দিকে শব্দের সাথে , γ 2 ( জেড ) = সর্বোচ্চ { { δ 1 | জেড 1 } , { δ 2 | টু Z 2 } , ... , { δ এন | জেড এন } } , আমি δ আমি সর্বোচ্চ γ 1 ( জেড ) আমি γ 2 ( জেড ) γ 2 ( জেড )δআমিসর্বোচ্চ

γ2(জেড)=সর্বোচ্চ{{δ1|জেড1},{δ2|জেড2},...,{δএন|জেডএন}},
আমিδআমিসর্বোচ্চγ1(জেড)আমিγ2(জেড)γ2(জেড) E { δ iZ i } Z i dজেডআমি{δআমি|জেডআমি}জেডআমিZiz- রআমিমি(z- রআমি)যা ইতিবাচক পক্ষপাত কিছু হ্রাস করে । তবে আমরা কীভাবে উপসংহারে পৌঁছতে পারি যে বেয়েস অনুমানকারীগুলি নির্বাচন পক্ষপাতের বিরুদ্ধে সুরক্ষিত। আমি সত্যিই এটি পাই না।জেডআমি

1
আপনি সাহিত্যের একটি অংশে একটি দাবি উল্লেখ করছেন তা প্রদত্ত, আপনি দয়া করে একটি সম্পূর্ণ পরিস্থিতি এবং পৃষ্ঠার রেফারেন্স দিতে পারেন, যাতে আমরা এই দাবির সম্পূর্ণ প্রসঙ্গটি পড়তে পারি।
বেন - মনিকা পুনরায় ইনস্টল করুন

কোনও অনুমানকারীকে বেইস অনুমানের সর্বোচ্চ হিসাবে এখনও বেইস অনুমানকারী হিসাবে সংজ্ঞা দেওয়া হচ্ছে?
শি'আন

কাগজে উদাহরণ 1।
চেম্বারলাইন ফঞ্চা

উত্তর:


4

উপরে বর্ণিত হিসাবে, ইস্যুটি সূচী এবং মান, (আই, এ,), সাধারণ আরভিএসের একটি নমুনার বৃহত্তম গড়ের অঙ্কন অনুক্রমের সাথে দাঁড়িয়েছে। আমি দায়িদের উপস্থাপনায় যা অবাক করি তা হ'ল বায়েশিয়ান বিশ্লেষণ এতটা বায়েশিয়ান শোনাচ্ছে না। যদি পুরো নমুনা দেওয়া হয়, তবে কোনও বয়েশিয়ান পদ্ধতির আইটি অনুমান করা থেকে শুরু করে সম্পর্কিত গড় নির্ধারণের পরিবর্তে অনুমানের পদক্ষেপগুলি অনুসরণ না করে (i⁰, μ⁰) উপর একটি উত্তরোত্তর বিতরণ করা উচিত। এবং যদি প্রয়োজন হয় তবে অনুমানকারীদের একটি নির্দিষ্ট ক্ষতি ফাংশনের সংজ্ঞা থেকে আসা উচিত। পরিবর্তে, যখন নমুনার বৃহত্তম পয়েন্ট দেওয়া হয়, এবং কেবলমাত্র সেই বিন্দুতে, এর বিতরণ পরিবর্তন হয়, তাই কোনও বিবরণ প্রয়োজন হয় না এমন বিবৃতিটি নিয়ে আমি মোটামুটি বিস্মিত হই।

পূর্ববর্তী মডেলিংটি বরং বিস্ময়কর যে এই উপায়ে প্রিরিয়ারদের স্বাধীন সাধারণের পণ্যগুলির চেয়ে যৌথ হওয়া উচিত, কারণ এই উপায়গুলির তুলনা করা হয় এবং তাই তুলনীয়। উদাহরণস্বরূপ, একটি শ্রেণিবিন্যাসিক পূর্বটি আরও উপযুক্ত বলে মনে হয়, পুরো ডেটা থেকে অনুমান করার জন্য অবস্থান এবং স্কেল। উপায়গুলির মধ্যে একটি সংযোগ তৈরি করা হচ্ছে ... স্বতন্ত্র অনুচিত প্রিয়ারদের ব্যবহারের ক্ষেত্রে প্রাসঙ্গিক আপত্তিটি হ'ল সর্বাধিক গড় μ⁰ তারপরে একটি সু-সংজ্ঞায়িত পরিমাপ নেই। যাইহোক, আমি মনে করি না কিছু বনাম অন্য বনামের সমালোচনা এই "প্যারাডক্স" এর উপর প্রাসঙ্গিক আক্রমণ।


1
আমার কাছে মনে হয় যে প্রয়োজনীয় সমস্ত সুরক্ষাটি সমস্ত অজানা উপায়ে সংযুক্ত হওয়ার পূর্বে কোড করা উচিত। পূর্বের অর্থ যদি খুব অসম্ভব এর মধ্যে বৃহত্তর পার্থক্য করে তবে তা পার্সেন্টিয়ার এটিকে নিখুঁত করে তুললে তা প্রতিফলিত হবে।
ফ্র্যাঙ্ক হ্যারেল

@ শি'য়ান আপনি কীভাবে দেবেন তার একটি উদাহরণ দিতে পারেন ? (আমি,μ)
চেম্বারলাইন ফঞ্চা

@ ফ্র্যাঙ্ক হ্যারেল, উদাহরণস্বরূপ এবং । নিরপেক্ষ হল । বেইস হ'ল । যদি the বৃহত্তম হয় তবে , কারণ বেইস একঘেয়েমি । পূর্বেরটি যতটা তথ্যপূর্ণ হোক না কেন, এটি পরিবর্তন হবে না। যাইহোক, ইতিবাচক বায়েসের হ্রাস । তবে ভুলটি যদি বেছে নেওয়া হয় তবে বেইস অনুমানকারী এটি সংশোধন করতে পারবেন না।δআমি~এন(একটি,1)জেডআমি~এন(δআমি,1)δআমিজেডআমিδআমি(δআমি|জেডআমি)জেডআমি0জেডআমি(δআমি0|জেডআমি0)জেডআমি(δআমি0|জেডআমি0)জেডআমি0আমি0
চেম্বারলাইন ফঞ্চা

@ চেম্বারলাইনফোনচা: যখন এর একটি অগ্রাধিকার স্বতন্ত্র হয় তখন হয়। এবং মধ্যে একটি যৌথ পূর্ব তাদেরকে প্রকৃতপক্ষে নির্ভরশীল করে তোলে। δ i i μ i[δআমি|জেডআমি]δআমিআমিμআমি
শি'আন

এবং কোনও পূর্ববর্তী বায়েশিয়ান দৃষ্টিকোণ থেকে গ্রহণযোগ্য, উদাহরণস্বরূপ সূচকে অভিন্ন বিতরণ এবং এর পূর্বে একটি শ্রেণিবিন্যাস । μআমি
শি'আন

1

কিছুটা স্ব-স্বজ্ঞাত হলেও বিবৃতিটি সঠিক। ধরে এই গবেষণা জন্য, তারপর জন্য অবর সত্যিই । এই পাল্টা-স্বজ্ঞাত ঘটনাটি বয়েস (গোপন) থেকে প্রাথমিকভাবে থামার (যেমনটি খুব পাল্টা-স্বজ্ঞাতও) প্রতিরোধী হওয়ার সাথে কিছুটা মিলে যায়।μ 5 এন ( x 5 , σ 2 )আমি*=5μ5এন(এক্স5,σ2)

বায়েশিয়ান যুক্তি যদি এই জাতীয় পরীক্ষার জন্য (যদি এটি কয়েকবার পুনরাবৃত্তি করে তা কল্পনা করে) মিথ্যা সিদ্ধান্তে পৌঁছায় তবে সেরা জাতের জন্য কেবল ফলাফলই রাখা হত। ডেটা নির্বাচন হবে এবং বায়েশিয়ান পদ্ধতিগুলি পরিষ্কারভাবে (গোপন) ডেটা নির্বাচনের প্রতিরোধী নয়। আসলে কোনও পরিসংখ্যানের পদ্ধতি ডেটা নির্বাচনের প্রতিরোধী নয়।

যদি এই ধরনের নির্বাচন করা হয়ে থাকে তবে একটি সম্পূর্ণ বায়েশিয়ান যুক্তি এই নির্বাচনটিকে বিবেচনায় নেওয়া সহজেই মায়া সংশোধন করবে।

তবে "বায়েস অনুমানকারী নির্বাচন বায়াস প্রতিরোধক" বাক্যটি কিছুটা বিপজ্জনক। পরিস্থিতিগুলি সহজেই কল্পনা করা সহজ যেখানে "নির্বাচন" এর অর্থ অন্য কিছু, যেমন উদাহরণস্বরূপ ব্যাখ্যামূলক ভেরিয়েবল নির্বাচন বা ডেটা নির্বাচন selection বেয়েস এ সম্পর্কে স্পষ্টভাবে প্রতিরোধী নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.