একটি সসীম গাউসিয়ান মিশ্রণ এবং গাউসির মধ্যে দূরত্ব কত?


12

মনে করুন আমার কাছে জ্ঞাত ওজন, উপায় এবং মানক বিচ্যুতি নিয়ে চূড়ান্তভাবে অনেক গৌসিয়ানদের মিশ্রণ রয়েছে। উপায় সমান নয়। মিশ্রণের গড় এবং মানক বিচ্যুতি অবশ্যই গণনা করা যায়, যেহেতু মুহুর্তগুলি উপাদানগুলির মুহুর্তগুলির গড় গড়। মিশ্রণটি কোনও সাধারণ বিতরণ নয়, তবে এটি স্বাভাবিক থেকে কতটা দূরে?

গৌসিয়ানদের মিশ্রণটি একই গড় এবং বৈকল্পিকতার সাথে বনাম গাউসিয়ানকে 2 স্ট্যান্ডার্ড বিচ্যুতি দ্বারা পৃথক করা হয়

উপরের চিত্রটি গৌসিয়ান মিশ্রণের জন্য স্ট্যান্ডার্ড বিচ্যুতি (উপাদানগুলির) এবং একই গড় এবং বৈকল্পিকতার সাথে একক গাউসিয়ান দ্বারা পৃথক গৌসিয়ান মিশ্রণের সম্ভাবনা ঘনত্বগুলি দেখায় ।2

একই গড় এবং বৈকল্পিকতা সহ গৌসিয়ানদের মিশ্রণকে 1 স্ট্যান্ডার্ড বিচ্যুতি বনাম গাউসিয়ান দ্বারা পৃথক করা হয়েছে

এখানে উপায়গুলি স্ট্যান্ডার্ড বিচ্যুতি দ্বারা পৃথক করা হয়েছে এবং এটি মিশ্রণটি চোখের দ্বারা গাউসিয়ান থেকে আলাদা করা আরও শক্ত।1


অনুপ্রেরণা: আমি কিছু অলস লোকের সাথে এমন কিছু প্রকৃত বিতরণ সম্পর্কে একমত নই যা তারা মাপেনি যা তারা ধরে নিচ্ছে যে তারা সাধারণের কাছাকাছি কারণ এটি দুর্দান্ত হবে would আমিও অলস। আমি বিতরণগুলিও পরিমাপ করতে চাই না। আমি তাদের অনুমানগুলি অসঙ্গত বলতে বলতে সক্ষম হতে চাই, কারণ তারা বলছেন যে বিভিন্ন উপায়ে গৌসিয়ানদের একটি সীমাবদ্ধ মিশ্রণ একটি গাউসিয়ান যা সঠিক নয়। আমি কেবল এটি বলতে চাই না যে লেজের অ্যাসিম্পটোটিক আকৃতিটি ভুল কারণ এটি কেবলমাত্র অনুমান যা কেবলমাত্র কয়েকটি গড় বিচ্যুতির মধ্যে যুক্তিসঙ্গতভাবে সঠিক বলে মনে করা হয়। আমি বলতে সক্ষম হতে চাই যে উপাদানগুলি যদি সাধারণ বিতরণগুলির দ্বারা সুসংগত হয় তবে মিশ্রণটি নয়, এবং আমি এটি পরিমাণ প্রমাণ করতে সক্ষম হতে চাই।


আমি ব্যবহারের স্বাভাবিকতা থেকে সঠিক দূরত্বটি জানি না: সিডিএফ, দূরত্ব, আর্থ- মুভারের দূরত্ব, কেএল ডাইভারজেন্স ইত্যাদির মধ্যে পার্থক্যের আধিক্য আমি এইগুলির কোনওটির ক্ষেত্রে সীমানা পেয়ে খুশি হতে পারি, বা অন্যান্য ব্যবস্থা। মিশ্রণের মতো একই গড় এবং মানক বিচ্যুতি সহ গৌসির দূরত্ব বা যে কোনও গাউসির সাথে ন্যূনতম দূরত্ব জানতে পেরে আমি খুশি হব। যদি এটি সহায়তা করে তবে আপনি এই ক্ষেত্রে সীমাবদ্ধ রাখতে পারেন যে মিশ্রণটি গাউসিয়ানদের যাতে ছোট ওজন বেশি হয় ।L121/4


2
যদি মিশ্রণটি খুব স্বাভাবিকের খুব কাছাকাছি থাকে তবে সাধারণ আনুমানিক ব্যবহার করা অলসতা নয় এটি সরলকরণ এবং এটি একটি ভাল হতে পারে। তবে আপনার উদাহরণে আপনি এমন একটি মিশ্রণ দেখান যা কেন্দ্রের নিকটতম চেয়ে চ্যাপ্টা হয়, সবচেয়ে ভাল প্রায় সাধারণের তুলনায় তুলনায় মাঝখানে আরও বেশি ছড়িয়ে থাকে এবং লেজের মধ্যে আরও ছোট হয়। আমি মনে করি আপনি দুটি সিডিএফ এর মধ্যে এক ধরণের সংহত পার্থক্যটি দেখতে চাইবেন। কেএস পরিমাপ নয় কারণ ম্যাক্সিমু বিচ্ছিন্নতা খুব বড় নাও হতে পারে তবে কোনও অঞ্চলের গড় বিচ্ছিন্নতা তুলনামূলকভাবে বড় হতে পারে।
মাইকেল আর চেরনিক

আমরা কি ধরে নিতে পারি যে সাধারণ আনুমানিকের চেয়ে গাওসিয়ানদের মিশ্রণের জন্য পরিসংখ্যানগতভাবে উল্লেখযোগ্য প্রমাণ রয়েছে? আমাদের কেবল এই চিন্তা করতে হবে যে পার্থক্যটি ব্যবহারিক তাত্পর্যপূর্ণ কিনা পার্থক্যটি পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ হিসাবে পরিচিত। ম্যান্ডেলস অ্যান্ডারসন-ডার্লিং স্ট্যাটিস্টিকের মতো কোনও কিছুর প্রস্তাবনা যুক্তিযুক্ত জায়গা হিসাবে শুরু করবে।
ডিকরান মার্শুপিয়াল

@ ডিকরান মার্সুপিয়াল: জনসংখ্যা উপগোষ্ঠীতে বিভক্ত হয়ে গেছে যা বিভিন্ন উপায়ে বলে পরিচিত। উপাদানটির অর্থ উচ্চ নির্ভুলতার সাথে পরিচিত। উপাদানটির উপাদান এবং উপাদান স্ট্যান্ডার্ড বিচ্যুতির মধ্যে পার্থক্যগুলির মধ্যে পার্থক্য দেখা যায়, তবে আগ্রহের কিছু ক্ষেত্রে এবং মধ্যে হতে পারে , দুর্ভাগ্যবশত মোট বিতরণকে দ্বিপদ হতে পারে না to 1/22
ডগলাস জারে

3
মনে হচ্ছে আপনি সত্যিই কোনও মডেল নির্বাচনের প্রশ্ন জিজ্ঞাসা করছেন: মডেলকে কিছু ডেটা দেওয়া হলে, যখন কোনও মিশ্রণের তুলনায় একটি সাধারণ বিতরণ পছন্দ করা উচিত (বা আরও সাধারণভাবে, কেউ কীভাবে মিশ্রণের উপাদানগুলি বেছে নিতে পারেন)? এই জাতীয় প্রশ্নটিকে পুনরায় প্রত্যাখ্যান করা আপনাকে এই সাইটের কয়েকটি শতাধিক প্রশ্নের অ্যাক্সেস দেয় :-)।
হোয়বার

@ হুবার: সাধারণের দূরত্বটি তখন একক গাউসিয়ান থেকে মিশ্রণকে পৃথক করার লক্ষ্যে একটি পরীক্ষার (গড়) শক্তি হিসাবে প্রকাশ করা যেতে পারে।
শি'আন

উত্তর:


9

কেএল ডাইভারজেন্সটি প্রাকৃতিক হবে কারণ আপনার একটি প্রাকৃতিক বেস বিতরণ রয়েছে, একক গাউসিয়ান, যা থেকে আপনার মিশ্রণটি ডাইভারেজ করে। অন্যদিকে, দুটি গাউসিয়ান মিশ্রণের মধ্যে কেএল ডাইভারজেন্স (বা এর প্রতিসম 'দূরত্ব' ফর্ম), যার মধ্যে আপনার সমস্যাটি একটি বিশেষ ক্ষেত্রে, সাধারণভাবে অবিচ্ছিন্ন বলে মনে হয়। হার্শি এবং ওলসন (2007) সম্ভাব্য সহজতর সীমানা সরবরাহ করতে পারে এমন বৈকল্পিক পদ্ধতি সহ উপলভ্য অনুমানের যুক্তিসঙ্গত সংক্ষিপ্তসার মতো দেখাচ্ছে।

যাইহোক, যদি আপনি যদি গাউসিয়ান আসলেই একটি মিশ্রণ হয় এমন কিছু ধারণা করার অশুভ প্রতিক্রিয়া সম্পর্কে তর্ক করতে চান তবে আপনি যে পরিণতিতে আগ্রহী তা সম্পর্কে ভাল ধারণা থাকা ভাল - কেবল 'ভুল হওয়ার চেয়ে আরও নির্দিষ্ট কিছু' '(এটি @ মাইকেল-চেরনিকের বক্তব্য)। উদাহরণস্বরূপ, একটি পরীক্ষা, বা একটি বিরতি বা সামসুকের পরিণতি। মিশ্রণের দুটি সুস্পষ্ট প্রভাব হ'ল ওভারডিস্পেরেশন, এটি বেশ গ্যারান্টিযুক্ত এবং মাল্টিমোডালটি যা ম্যাক্সিমাইজারগুলিকে বিভ্রান্ত করবে।


1

আমাকে ভুল বিতরণের নির্দিষ্টকরণের পরিণতি বিবেচনা করে অনুসরণ করতে দিন। কেএল ডাইভারজেন্সের মতো দূরত্বের জেনেরিক পরিমাপের পরিবর্তে, আপনি "পার্থক্য" এর স্বনির্ধারিত পরিমাপের মূল্যায়ন করতে পারেন, জার্মানীর হাতে থাকা পরিণতিগুলি।

উদাহরণস্বরূপ, যদি বিতরণটি ঝুঁকি গণনার জন্য ব্যবহার করা হয়, উদাহরণস্বরূপ ব্যর্থতার সম্ভাবনা যথেষ্ট কম কিনা তা নির্ধারণ করার জন্য, তবে কেবলমাত্র জিনিসগুলির মধ্যে উপযুক্ত বিষয়গুলি চূড়ান্ত লেজের সম্ভাবনার গণনা। এটি মিলিয়ন-বিলিয়ন ডলারের প্রোগ্রামগুলির সিদ্ধান্তগুলির সাথে প্রাসঙ্গিক হতে পারে এবং জীবন এবং মৃত্যুর বিষয়গুলিকে জড়িত করে।

সাধারণ অনুমানটি সবচেয়ে বেশি ভুল হওয়ার সম্ভাবনা কোথায়? অনেক ক্ষেত্রে চরম লেজগুলিতে একমাত্র স্থান যা এই গুরুত্বপূর্ণ ঝুঁকি গণনার জন্য গুরুত্বপূর্ণ। উদাহরণস্বরূপ, যদি আপনার প্রকৃত বিতরণ একইরকম নরমালগুলির মিশ্রণ, তবে বিভিন্ন স্ট্যান্ডার্ড বিচ্যুতি হয়, তবে মিশ্রণ বিতরণের লেজগুলি সাধারণ বন্টনের লেজগুলির চেয়ে একই রকম এবং মানক বিচ্যুতির চেয়ে মোটা। চূড়ান্ত লেজের সম্ভাব্যতার জন্য এটি সহজেই বিশালতার পার্থক্যের (ঝুঁকির অবমূল্যায়ন) আদেশের ফলাফল করতে পারে।

সুতরাং, উদাহরণস্বরূপ, একটি গুরুত্বপূর্ণ স্তরের , পার্থক্যের প্রাসঙ্গিক পরিমাপটি হতে পারে । এই ক্ষেত্রে, চুক্তিটি বিতরণের বাকী অংশে কতটা ভাল তা বিবেচ্য নয়।UP(XMixture>U)P(XNormal>U)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.