অবিচ্ছিন্ন বিতরণ থেকে ডেটার একটি অনুকূল বিবেচনার নির্ধারণ করা


11

ধরুন আপনার কাছে ডেটা সেট রয়েছে ,Y1,...,Yn ঘনত্ব সহ অবিচ্ছিন্ন বিতরণ থেকে ওয়াই এন সমর্থিত যা জানা যায় না তবে বেশ বড় তাই কার্নেলের ঘনত্ব (উদাহরণস্বরূপ) অনুমান, , বেশ নিখুঁত. একটি নির্দিষ্ট অ্যাপ্লিকেশনের জন্য আমার নিরীক্ষিত তথ্যকে একটি অন্তর্নির্মিত গণ ফাংশন সহ একটি নতুন ডেটা সেট set জন্য সীমাবদ্ধ সংখ্যার বিভাগে রূপান্তর করতে হবে ।[ 0 , 1 ] এন পি ( Y ) জেড 1 , , জেড এন জি ( জেড )p(y)[0,1]np^(y)Z1,...,Zng(z)

একটি সাধারণ উদাহরণটি যখন এবং যখন । এক্ষেত্রে প্ররোচিত ভর কর্ম হবেওয়াই আমি1 / 2 জেড আমি = 1 ওয়াই আমি > 1 / 2Zi=0Yi1/2Zi=1Yi>1/2

g^(0)=01/2p^(y)dy,   g^(1)=1/21p^(y)dy

এখানে দুটি "টিউনিং প্যারামিটার" প্রান্তিকের সংখ্যা, এবং প্রান্তিকের দৈর্ঘ্যের ভেক্টর । Mass দ্বারা প্ররোচিত গণ ফাংশনটি চিহ্নিত করুন ।( মি - 1 ) λ মিটার , λ ( Y )m(m1)λg^m,λ(y)

আমি এমন একটি পদ্ধতি চাই যা উত্তর দেয়, উদাহরণস্বরূপ, " সবচেয়ে ভাল পছন্দ কী যাতে দলের সংখ্যা বাড়িয়ে (এবং সেখানে অনুকূল বেছে নেওয়া ) একটি নগণ্য উন্নতি পেতে পারে?" । আমি মনে করি সম্ভবত একটি পরীক্ষার পরিসংখ্যান তৈরি করা যেতে পারে (সম্ভবত কেএল ডাইভারজেনের পার্থক্যের সাথে বা অনুরূপ কিছু) যার বিতরণটি উত্পন্ন হতে পারে। কোন ধারণা বা প্রাসঙ্গিক সাহিত্য?এম + 1 λm,λm+1λ

সম্পাদনা: আমি অবিচ্ছিন্নভাবে পরিবর্তনশীলগুলির সাময়িকভাবে পরিমাপের স্থানকে পৃথক করে রেখেছি এবং অস্থায়ী মার্কোভ চেইনটি অস্থায়ী নির্ভরতার মডেল হিসাবে ব্যবহার করছি। স্পষ্টতই, পৃথক রাষ্ট্রের মার্কভ চেইনগুলি পরিচালনা করা অনেক সহজ এবং এটিই আমার প্রেরণা। পর্যবেক্ষণ করা তথ্য শতাংশ। আমি বর্তমানে একটি অ্যাডহক বিচক্ষণতা ব্যবহার করছি যা আমার কাছে খুব ভাল দেখাচ্ছে তবে আমি মনে করি এটি একটি আকর্ষণীয় সমস্যা যেখানে একটি আনুষ্ঠানিক (এবং সাধারণ) সমাধান সম্ভব।

সম্পাদনা 2: প্রকৃতপক্ষে কেএল ডাইভারজেন্সকে হ্রাস করা তথ্যটিকে মোটেও বিবেচনা না করার সমতুল্য হবে, সুতরাং এই ধারণাটি সম্পূর্ণরূপে বহির্ভূত। আমি সেই অনুযায়ী শরীর সম্পাদনা করেছি।


1
বেশিরভাগ ক্ষেত্রে অনুসরণ-এর অ্যাপ্লিকেশনগুলির প্রয়োজনীয়তা যে কোনও সমাধানের সার্থকতা নির্ধারণ করবে। সম্ভবত, আমাদের কিছু নির্দেশনা দেওয়ার জন্য, আপনি সে সম্পর্কে আরও বলতে পারেন।
whuber

প্রথমত, সংজ্ঞায়িত আপনার দ্বারা কি বোঝাতে চেয়েছেন তুচ্ছ । অফ হ্যান্ড, এটি হার-বিকৃতি সমস্যার সাথে সম্পর্কিত বলে মনে হচ্ছে । কভার & টমাস টেক্সট যেমন বিষয় একটা চমৎকার পাঠযোগ্য ভূমিকা প্রদান করে।
কার্ডিনাল

আমি পরামিতি (প্রান্তিকের জন্য) সহ একটি মডেলের মতো স্তরের সাথে বিবেচনার বিবেচনা করি । এই সেটিংয়ে আমি যখন নগণ্য বলি তখন আমি একটি পরিসংখ্যানগত দিক থেকে "অতিরিক্ত প্যারামিটার যোগ করার পক্ষে মূল্যহীন" না। k - 1kk1
ম্যাক্রো

আমি নিশ্চিত নই যে বিচক্ষণতা আসলে একটি ভাল পদক্ষেপ। আপনার পর্যবেক্ষণের মূল জায়গাতে বিযুক্ত মানগুলি যে সীমানা তৈরি করে সেগুলি আপনি সাধারণ করতে সক্ষম হবেন না।
বায়ারজ

উত্তর:


3

আমি কিছুক্ষণ আগে এই সমস্যার সাথে আমি যে সমাধানটি নিয়ে এসেছি সেগুলি ভাগ করতে চলেছি - এটি কোনও আনুষ্ঠানিক পরিসংখ্যানগত পরীক্ষা নয় তবে এটি একটি দরকারী হিউরিস্টিক সরবরাহ করতে পারে।


সাধারণ ক্ষেত্রে যেখানে আপনি ক্রমাগত পর্যবেক্ষণ আছে বিবেচনা করুন ; সাধারণতার ক্ষতি ছাড়াই ধরুন প্রতিটি পর্যবেক্ষণের নমুনা স্থান হ'ল বিরতি [ 0 , 1 ] । একটি শ্রেণিবদ্ধকরণ প্রকল্পটি বিভিন্ন বিভাগ, এম এবং অবস্থানের প্রান্তিকের উপর নির্ভর করে যা বিভাগগুলিকে বিভক্ত করে, 0 < λ 1 < λ 2 < < λ m - 1 < 1Y1,Y2,...,Yn[0,1]m0<λ1<λ2<<λm1<1

দ্বারা শ্রেণীবদ্ধ সংস্করণটি উল্লেখ করুন , যেখানে । মূল ডেটাগুলিকে শ্রেণিতে বিভাজন হিসাবে ডেটার বিচক্ষণতার কথা , of এর প্রকরণটি একটি নির্দিষ্ট মূল্যের জন্য, গ্রুপের মধ্যে এবং মধ্যে পার্থক্যের সংমিশ্রণ হিসাবে ভাবা যেতে পারে :Yiλ = { λ 1 , λ 2 , , λ এম - 1 } ওয়াই আমি এম , λZi(m,λ)λ={λ1,λ2,,λm1}Yim,λ

var(Yi)=var(E(Yi|Zi(m,λ)))+E(var(Yi|Zi(m,λ))).

যদি সেখানে গ্রুপ ভ্যারিয়েন্স মধ্যে অপেক্ষাকৃত অল্প দ্বারা সংখ্যায় একটি প্রদত্ত শ্রেণীবদ্ধকরণ সমজাতীয় গ্রুপ উৎপাদন এ সফল হয়। অতএব , আমরা একটি মিতব্যায়ী গোষ্ঠী যে সফর তারতম্য সবচেয়ে চাইতে থেকে। সময়ের বিশেষ করে, আমরা নির্বাচন করতে চান যে অতিরিক্ত মাত্রা যোগ করে, আমরা উল্লেখযোগ্যভাবে গোষ্ঠী সমসত্ত্বতা মধ্যে জুড়বেন না তাই। সাথে এই মন হয়, আমরা অনুকূল সংজ্ঞায়িত একটি নির্দিষ্ট মানের জন্য হতেY i v a r ( E ( Y i | Z i ( m , λ ) ) m λ mE(var(Yi|Zi(m,λ))Yivar(E(Yi|Zi(m,λ))mλm

λm=argminλE(var(Yi|Zi(m,λ)))

কি পছন্দ পর্যাপ্ত তা নির্ধারণের জন্য মোটামুটি ডায়াগনস্টিকটি হ'ল ক্রিয়া হিসাবে - এই ট্রাজেক্টোরিটি একঘেয়েভাবে অ-বর্ধমান এবং এটি তীব্র হ্রাস পাওয়ার পরে আপনি দেখতে পাবেন যে আপনি আরও বিভাগ যুক্ত করে তুলনামূলকভাবে কম নির্ভুলতা অর্জন করছেন। এই হিউরিস্টিক আত্মার ক্ষেত্রেও একই রকম, " স্ক্রি প্লট " কীভাবে অনেকগুলি মূল উপাদানগুলি তারতম্যের "যথেষ্ট" ব্যাখ্যা করে তা দেখতে কখনও কখনও ব্যবহৃত হয়।( বনাম একটি ( ওয়াই আমি | টু Z আমি ( মি , λ মি ) ) ) মিmE(var(Yi|Zi(m,λm)))m

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.