গুরুত্বের নমুনা কী?


22

আমি রিইনফোর্সমেন্ট লার্নিং শেখার চেষ্টা করছি এবং এই বিষয়টি আমার কাছে সত্যিই বিভ্রান্তিকর। আমি পরিসংখ্যানগুলির একটি ভূমিকা নিয়েছি, তবে আমি কেবল এই বিষয়টি স্বজ্ঞাতভাবে বুঝতে পারি নি।

উত্তর:


15

সুদের বন্টন থেকে প্যারামিটারের আরও ভাল অনুমান আরও সহজেই অর্জন করতে আগ্রহের বন্টন থেকে আলাদা কোনও বিতরণ থেকে গুরুত্বপূর্ণ নমুনা স্যাম্পলিং । সাধারণত এটি একই নমুনা আকারের সাথে মূল বিতরণ থেকে সরাসরি নমুনা সংগ্রহের চেয়ে কম বৈকল্পিকের সাথে পরামিতির অনুমান সরবরাহ করবে।

এটি বিভিন্ন প্রসঙ্গে প্রয়োগ করা হয়। বিভিন্ন বিতরণ থেকে সাধারণ নমুনা প্রয়োগের মাধ্যমে আবেদন (গুরুত্বপূর্ণ অঞ্চল) দ্বারা নির্ধারিত সুদের বিতরণের অংশে আরও নমুনা নেওয়ার অনুমতি দেয়

একটি উদাহরণ হতে পারে যে আপনার আগ্রহের বন্টন থেকে বিশুদ্ধ এলোমেলো নমুনা সরবরাহের চেয়ে বিতরণের লেজগুলি থেকে আরও নমুনা রয়েছে এমন একটি নমুনা থাকতে চান।

Wikipedia নিবন্ধটি যে আমি এই বিষয় উপর দেখেছি খুব বিমূর্ত হয়। এটি বিভিন্ন নির্দিষ্ট উদাহরণ তাকান ভাল। তবে এটিতে বায়েসিয়ান নেটওয়ার্কগুলির মতো আকর্ষণীয় অ্যাপ্লিকেশনগুলির লিঙ্ক অন্তর্ভুক্ত নয়

1940 এবং 1950 এর দশকে গুরুত্বের নমুনার একটি উদাহরণ হ'ল একটি বৈচিত্র্য হ্রাস কৌশল (মন্টে কার্লো পদ্ধতির একটি রূপ)। উদাহরণস্বরূপ , হ্যামারসেলি এবং হ্যান্ডসকম্বের মন্টে কার্লো মেথডস বইটি 1964 সালে একটি মথুয়েন মনোগ্রাফ / চ্যাপম্যান এবং হল হিসাবে প্রকাশিত এবং 1966 সালে এবং পরে অন্যান্য প্রকাশকদের দ্বারা পুনরায় মুদ্রিত হয় দেখুন। বইয়ের 5.4 অনুচ্ছেদে গুরুত্বপূর্ণ স্যাম্পলিং অন্তর্ভুক্ত।


2
এটি যুক্ত করতে: আরএল-তে আপনি নীতিতে সাধারণত স্যাম্পলিংয়ের উপর গুরুত্ব আরোপ করেন: যেমন প্রকৃত নীতি যে আপনি প্রকৃতপক্ষে নমুনা করতে চান তার পরিবর্তে এক্সপ্লোরেশন পলিসি থেকে ক্রিয়াগুলির নমুনা তৈরি করুন
ড্যাভিঞ্চি

3
এই উত্তর ব্যাখ্যাতে গুরুত্ব স্যাম্পলিং দ্বারা ভাল শুরু করে, কিন্তু আমি এটা আসলে কি গুরুত্ব স্যাম্পলিং এর প্রশ্নের উত্তর কখনো এটি হতাশ হয়েছিলেন হয় : এটা কিভাবে কাজ করে?
whuber

@ শুভ আমার এখানে লক্ষ্যটি ছিল একটি বিভ্রান্ত ওপিকে ধারণাটি ব্যাখ্যা করা এবং তাকে কিছু সাহিত্যের দিকে নির্দেশ করা। এটি একটি বড় বিষয় এবং আপাতদৃষ্টিতে বিভিন্ন অ্যাপ্লিকেশনগুলিতে ব্যবহৃত হয়। অন্যরা আমার চেয়ে আরও সহজ শর্তে বিশদটি ব্যাখ্যা করতে সক্ষম হতে পারেন। আমি জানি যে আপনি যখন কোনও প্রশ্নের উত্তর দেওয়ার সিদ্ধান্ত নেবেন আপনি পুরো দড়ি এবং চমৎকার গ্রাফ সরবরাহ করেন, সরল ভাষা ব্যবহার করে প্রযুক্তিগত বিশদটি দেখুন। এই পোস্টগুলি প্রায় সর্বদা সম্প্রদায়কে তার স্বচ্ছতা এবং সম্পূর্ণতার সাথে সন্তুষ্ট করে এবং আমি সাহস করে বলতে পারি যে কমপক্ষে কিছুটা হলেও ওপিকে সন্তুষ্ট করে। আপনার পরামর্শ অনুসারে সমীকরণের সাথে কয়েকটি বাক্যই যথেষ্ট।
মাইকেল আর চেরনিক

কেবল অন্য উত্সগুলিতে ইঙ্গিত করা বা লিঙ্ক সরবরাহ করার চেয়ে সম্প্রদায়ের পক্ষে প্রশ্নের উত্তরের মধ্যে রাখা আরও ভাল। আমি কেবল অনুভব করেছি যে আমি যা করেছি তা পর্যাপ্ত ছিল এবং যে ওপি একটি পরিসংখ্যান নবী হিসাবে স্বীকার করেছেন তাদের প্রথমে কিছুটা চেষ্টা করা উচিত।
মাইকেল আর চেরনিক

5
তোমার একটা কথা আছে আমি অবাক হই, যদিও আরও একটি বা দুটি বাক্যে এটি সম্ভব হতে পারে - কোনও গণিত, কোনও গ্রাফ, খুব কমই কোনও অতিরিক্ত কাজ - জিজ্ঞাসিত প্রশ্নের উত্তর সরবরাহ করতে। এই ক্ষেত্রে বর্ণনাকে জোর দিতে হবে যে একজন প্রত্যাশাটি অনুমান করে চলেছে (কেবল কোনও "প্যারামিটার" নয়), তবে সম্ভবত এটি উল্লেখ করুন যে প্রত্যাশা যেহেতু মান এবং সম্ভাবনার একটি গুণফলের সমষ্টি, তাই সম্ভাব্যতা পরিবর্তন করে একজন একই ফলাফল লাভ করে ( এমন কোনও বিতরণ যা থেকে নমুনা করা সহজ) এবং এর জন্য ক্ষতিপূরণ মানগুলি সামঞ্জস্য করে।
whuber

33

ইম্পরিয়েন্স স্যাম্পলিং হ'ল একটি সিমুলেশন বা মন্টে কার্লো পদ্ধতি যা সংহতগুলি আনুমানিক করার উদ্দেশ্যে। "স্যাম্পলিং" শব্দটি কিছুটা বিভ্রান্তিকর কারণ এটি কোনও প্রদত্ত বিতরণ থেকে নমুনা সরবরাহ করার ইচ্ছা করে না।

গুরুত্বের নমুনা দেওয়ার পিছনে স্বজ্ঞাততা হ'ল a মতো একটি সু-সংজ্ঞায়িত ইন্টিগ্রাল বিস্তৃত পরিসরের প্রত্যাশা হিসাবে প্রকাশ করা যেতে পারে সম্ভাব্যতা ডিস্ট্রিবিউশন: যেখানে ঘনত্ব উল্লেখ করে একটি সম্ভাব্যতা বিতরণের ও দ্বারা নির্ধারিত হয় এবং । (দ্রষ্টব্য যে সাধারণত থেকে পৃথক থাকে ) প্রকৃতপক্ষে, the পছন্দটি দিকে নিয়ে যায় এবংI = E f [ H ( X ) ] = X H ( x ) f ( x )

I=Xh(x)dx
f h h f H ( ) h ( ) H ( x ) = h ( x )
I=Ef[H(X)]=XH(x)f(x)dx
fHhfH()h() H(x)f(x)=h(x)I=Ef[H(X)]-ff(x)>0h(x)0-f
H(x)=h(x)f(x)
H(x)f(x)=h(x)I=Ef[H(X)] এর সাপোর্টে কিছু সীমাবদ্ধতা অধীনে , যার অর্থ যখন । সুতরাং, ডাব্লু। হুবার তাঁর মন্তব্যে যেমন উল্লেখ করেছেন, প্রত্যাশা হিসাবে অখণ্ডতার উপস্থাপনে কোনও মিল নেই তবে এর বিপরীতে এ জাতীয় উপস্থাপনাগুলির অসীম বিন্যাস রয়েছে, যার মধ্যে কয়েকটি অন্যের চেয়ে তুলনামূলকভাবে একবার মানদণ্ডের চেয়ে ভাল তাদের গ্রহণ করা হয়। উদাহরণস্বরূপ, মাইকেল চেরনিক অনুমানকারীটির বৈচিত্র্য হ্রাস করার জন্য নির্বাচনের উল্লেখ করেছেন ।ff(x)>0h(x)0f

এই প্রাথমিক সম্পত্তিটি বোঝার পরে, ধারণাটির বাস্তবায়নটি হ'ল অন্যান্য মন্টি কার্লো পদ্ধতির মতো বড় সংখ্যাগুলির আইনের উপর নির্ভর করা, অর্থাৎ [একটি ছদ্ম-এলোমেলো জেনারেটরের মাধ্যমে] একটি আইআইডি নমুনা অনুকরণ করা থেকে বিতরণ করা এবং পড়তা ব্যবহার করতে যাআমি = 1(x1,,xn)f

I^=1ni=1nH(xi)
  1. of এর নিরপেক্ষ অনুমানকI
  2. প্রায় অবশ্যই to তে রূপান্তরিত হয়I

বিতরণের পছন্দ উপর নির্ভর করে , উপরোক্ত মূল্নির্ধারক বা সসীম ভ্যারিয়েন্স নাও থাকতে পারে পারে। যাইহোক, সবসময় পছন্দ অস্তিত্ব করে একটি সসীম ভ্যারিয়েন্স এবং এমনকি একটি ইচ্ছামত ছোট ভ্যারিয়েন্স (সেই পছন্দগুলি যদিও বাস্তবে অনুপলব্ধ হতে পারে) জন্য অনুমতি দেয়। আর এছাড়াও পছন্দ অস্তিত্ব যে গুরুত্ব স্যাম্পলিং মূল্নির্ধারক করতে একটি অত্যন্ত দরিদ্র পড়তা। চ্যাটার্জি এবং ডায়াকনিসের সাম্প্রতিক একটি গবেষণাপত্রটি কীভাবে অসীম বৈকল্পিকতার সাথে গুরুত্বপূর্ণ নমুনাগুলির তুলনা করতে পারে তা অধ্যয়ন করলেও এর মধ্যে সমস্ত বিকল্প অন্তর্ভুক্ত রয়েছে the নীচের ছবি থেকে নেওয়া হয়েছেআমিআমি আমিfI^ffI^Iআমার কাগজ সম্পর্কে ব্লগ আলোচনা এবং অসীম বৈকল্পিক অনুমানের দুর্বল রূপান্তর চিত্রিত করে।

গুরুত্ব বিতরণের সাথে গুরুত্বের নমুনা একটি Exp (1) বিতরণ লক্ষ্য বন্টন একটি Exp (1/10) বিতরণ, এবং, h (x) = x function এর কার্যকারিতা $  ইন্টিগ্রালের আসল মান হ'ল 10 ডলার $

গুরুত্ব বিতরণের সাথে গুরুত্বের নমুনা একটি এক্সপ্রেস (1) বিতরণ লক্ষ্য বিতরণ একটি এক্সপ (1/10) বিতরণ, এবং ফাংশন । ইন্টিগ্রালের আসল মান ।10h(x)=x10

[নীচে আমাদের বই মন্টি কার্লো স্ট্যাটিস্টিকাল পদ্ধতিগুলি থেকে পুনরুত্পাদন করা হয়েছে ]]

আইনজীবীরা Ripley (1987) শো থেকে নিম্নলিখিত উদাহরণে কেন এটা আসলে (মূল) চেয়ে বন্টন অপরের থেকে উৎপন্ন যে বছরের বাবদ বিতরণ অবিচ্ছেদ্য প্রদর্শনে আগ্রহের interest বা অন্য কথায় প্রদত্ত ঘনত্বের বিরুদ্ধে প্রত্যাশা হিসাবে অখণ্ডের প্রতিনিধিত্ব সংশোধন করা।X h ( x ) f ( x )f

Xh(x)f(x)dx

উদাহরণ (কচির লেজের সম্ভাব্যতা) ধরুন যে আগ্রহের পরিমাণটি সম্ভাবনা, , যে একটি ভেরিয়েবল চেয়ে বড় , অর্থাৎ, যখন মূল্যায়ন করা হয় অভিজ্ঞতাগত গড় নমুনা , এই অনুমানের বৈকল্পিক হল ( থেকে সমান )।সি ( 0 , 1 ) 2 পি = + 2pC(0,1)2পি পি 1 = 1

p=2+1π(1+x2)dx.
p
p^1=1mj=1mIXj>2
X1,,Xm C(0,1)p(1p)/m0.127/mp=0.15

গড় থেকে যেহেতু, এর প্রতিসম প্রকৃতি বিবেচনা করে এই প্রকরণটি হ্রাস করা যেতে পারে এর ভেরিয়েন্স সমান ।C(0,1)

p^2=12mj=1mI|Xj|>2
p(12p)/2m0.052/m

এই পদ্ধতির (আপেক্ষিক) অদক্ষতা আগ্রহের ডোমেনের বাইরে মান উত্পন্নকরণের কারণে, , যা কিছুটা অর্থে সান্নিধ্যের জন্য অপ্রাসঙ্গিক । [এটি মাইকেল চেরনিকের সাথে লেজ অঞ্চল অনুমানের উল্লেখ করেছে]] যদি লেখা থাকে , উপরের অবিচ্ছেদ্য এর প্রত্যাশা হিসাবে বিবেচনা করা যেতে পারে , যেখানে । জন্য মূল্যায়নের একটি বিকল্প পদ্ধতি তাই for এর জন্য[2,+)pp

p=12021π(1+x2)dx,
h(X)=2/π(1+X2)XU[0,2]p
p^3=121mj=1mh(Uj)
UjU[0,2]। ভ্যারিয়েন্স হয় এবং যন্ত্রাংশ শো দ্বারা একটি ইন্টিগ্রেশন এটি সমান । অধিকন্তু, যেহেতু হিসাবে লেখা যেতে পারে এই অবিচ্ছেদ্যটিকে বেশি of এর প্রত্যাশা হিসাবে দেখা যেতে পারে উপর অভিন্ন বিতরণের বিরুদ্ধে এবং আরেকটি মূল্যায়ন হয় যখন । অংশগুলির দ্বারা একই একীকরণ দেখায় যে of এর বৈকল্পিকp^3(E[h2]E[h]2)/m0.0285/mp
p=01/2y2π(1+y2)dy,
14h(Y)=1/2π(1+Y2)[0,1/2]p
p^4=14mj=1mh(Yj)
YjU[0,1/2]p^4তারপরে ।0.95104/m

সাথে তুলনা করে, দ্বারা আনা বৈকল্পিক হ্রাস order , যা বিশেষত বোঝায় যে এই মূল্যায়নের জন্য প্রয়োজন একই নির্ভুলতা অর্জনের জন্য চেয়ে গুণ কম সিমুলেশন । P 410-3p^1p^4103 পৃঃ 1100032p^1


5
সবাইকে প্রশংসা করতে পারে এমনভাবে গুরুত্বের নমুনা তুলে ধরে সমস্যায় যাওয়ার জন্য @ শি'ই ধন্যবাদ, বিল হুবারের অনুরোধটিকে সন্তুষ্ট করার চেয়ে আমি আরও বেশি মনে করি। +1
মাইকেল আর চেরনিক 4'17

2
আমি লক্ষ করতে চাই যে প্রাথমিকভাবে এই পোস্টটি ধরে রাখা হয়েছিল এবং বেশ কয়েকটি লোকের অবদানের জন্য ধন্যবাদ ছিল। আমরা একটি তথ্যমূলক থ্রেড নিয়ে এসেছি।
মাইকেল আর চেরনিক

5
খ্রিস্টান, আমি আমার ধন্যবাদ বাড়াতে এবং বিশেষাধিকারের অনুভূতি প্রকাশ করতে চাই যে আপনি আমাদের সাথে এই জাতীয় চমৎকার উপাদান সক্রিয়ভাবে ভাগ করে নিচ্ছেন।
whuber

4
আমি কেবল শীয়ানকে আপনাকে ধন্যবাদ জানাতে চাই যিনি আমার উত্তরটি উন্নত করতে কিছু সম্পাদনা করতে পেরেছিলেন যদিও সে তার নিজের একটি উত্তর দিয়েছিল।
মাইকেল আর চেরনিক

3
এটি স্ট্যাটাসস্টেক্সেক্সচেঞ্জের সেরা পোস্টগুলির মধ্যে একটি হতে হবে। ভাগ করে নেওয়ার জন্য ধন্যবাদ!
দোহমতেব
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.