আমি রিইনফোর্সমেন্ট লার্নিং শেখার চেষ্টা করছি এবং এই বিষয়টি আমার কাছে সত্যিই বিভ্রান্তিকর। আমি পরিসংখ্যানগুলির একটি ভূমিকা নিয়েছি, তবে আমি কেবল এই বিষয়টি স্বজ্ঞাতভাবে বুঝতে পারি নি।
আমি রিইনফোর্সমেন্ট লার্নিং শেখার চেষ্টা করছি এবং এই বিষয়টি আমার কাছে সত্যিই বিভ্রান্তিকর। আমি পরিসংখ্যানগুলির একটি ভূমিকা নিয়েছি, তবে আমি কেবল এই বিষয়টি স্বজ্ঞাতভাবে বুঝতে পারি নি।
উত্তর:
সুদের বন্টন থেকে প্যারামিটারের আরও ভাল অনুমান আরও সহজেই অর্জন করতে আগ্রহের বন্টন থেকে আলাদা কোনও বিতরণ থেকে গুরুত্বপূর্ণ নমুনা স্যাম্পলিং । সাধারণত এটি একই নমুনা আকারের সাথে মূল বিতরণ থেকে সরাসরি নমুনা সংগ্রহের চেয়ে কম বৈকল্পিকের সাথে পরামিতির অনুমান সরবরাহ করবে।
এটি বিভিন্ন প্রসঙ্গে প্রয়োগ করা হয়। বিভিন্ন বিতরণ থেকে সাধারণ নমুনা প্রয়োগের মাধ্যমে আবেদন (গুরুত্বপূর্ণ অঞ্চল) দ্বারা নির্ধারিত সুদের বিতরণের অংশে আরও নমুনা নেওয়ার অনুমতি দেয় ।
একটি উদাহরণ হতে পারে যে আপনার আগ্রহের বন্টন থেকে বিশুদ্ধ এলোমেলো নমুনা সরবরাহের চেয়ে বিতরণের লেজগুলি থেকে আরও নমুনা রয়েছে এমন একটি নমুনা থাকতে চান।
Wikipedia নিবন্ধটি যে আমি এই বিষয় উপর দেখেছি খুব বিমূর্ত হয়। এটি বিভিন্ন নির্দিষ্ট উদাহরণ তাকান ভাল। তবে এটিতে বায়েসিয়ান নেটওয়ার্কগুলির মতো আকর্ষণীয় অ্যাপ্লিকেশনগুলির লিঙ্ক অন্তর্ভুক্ত নয় ।
1940 এবং 1950 এর দশকে গুরুত্বের নমুনার একটি উদাহরণ হ'ল একটি বৈচিত্র্য হ্রাস কৌশল (মন্টে কার্লো পদ্ধতির একটি রূপ)। উদাহরণস্বরূপ , হ্যামারসেলি এবং হ্যান্ডসকম্বের মন্টে কার্লো মেথডস বইটি 1964 সালে একটি মথুয়েন মনোগ্রাফ / চ্যাপম্যান এবং হল হিসাবে প্রকাশিত এবং 1966 সালে এবং পরে অন্যান্য প্রকাশকদের দ্বারা পুনরায় মুদ্রিত হয় দেখুন। বইয়ের 5.4 অনুচ্ছেদে গুরুত্বপূর্ণ স্যাম্পলিং অন্তর্ভুক্ত।
ইম্পরিয়েন্স স্যাম্পলিং হ'ল একটি সিমুলেশন বা মন্টে কার্লো পদ্ধতি যা সংহতগুলি আনুমানিক করার উদ্দেশ্যে। "স্যাম্পলিং" শব্দটি কিছুটা বিভ্রান্তিকর কারণ এটি কোনও প্রদত্ত বিতরণ থেকে নমুনা সরবরাহ করার ইচ্ছা করে না।
গুরুত্বের নমুনা দেওয়ার পিছনে স্বজ্ঞাততা হ'ল a মতো একটি সু-সংজ্ঞায়িত ইন্টিগ্রাল বিস্তৃত পরিসরের প্রত্যাশা হিসাবে প্রকাশ করা যেতে পারে সম্ভাব্যতা ডিস্ট্রিবিউশন: যেখানে ঘনত্ব উল্লেখ করে একটি সম্ভাব্যতা বিতরণের ও দ্বারা নির্ধারিত হয় এবং । (দ্রষ্টব্য যে সাধারণত থেকে পৃথক থাকে ) প্রকৃতপক্ষে, the পছন্দটি দিকে নিয়ে যায় এবংI = E f [ H ( X ) ] = ∫ X H ( x ) f ( x )
এই প্রাথমিক সম্পত্তিটি বোঝার পরে, ধারণাটির বাস্তবায়নটি হ'ল অন্যান্য মন্টি কার্লো পদ্ধতির মতো বড় সংখ্যাগুলির আইনের উপর নির্ভর করা, অর্থাৎ [একটি ছদ্ম-এলোমেলো জেনারেটরের মাধ্যমে] একটি আইআইডি নমুনা অনুকরণ করা থেকে বিতরণ করা এবং পড়তা ব্যবহার করতে যাচ আমি = 1
বিতরণের পছন্দ উপর নির্ভর করে , উপরোক্ত মূল্নির্ধারক বা সসীম ভ্যারিয়েন্স নাও থাকতে পারে পারে। যাইহোক, সবসময় পছন্দ অস্তিত্ব করে একটি সসীম ভ্যারিয়েন্স এবং এমনকি একটি ইচ্ছামত ছোট ভ্যারিয়েন্স (সেই পছন্দগুলি যদিও বাস্তবে অনুপলব্ধ হতে পারে) জন্য অনুমতি দেয়। আর এছাড়াও পছন্দ অস্তিত্ব যে গুরুত্ব স্যাম্পলিং মূল্নির্ধারক করতে একটি অত্যন্ত দরিদ্র পড়তা। চ্যাটার্জি এবং ডায়াকনিসের সাম্প্রতিক একটি গবেষণাপত্রটি কীভাবে অসীম বৈকল্পিকতার সাথে গুরুত্বপূর্ণ নমুনাগুলির তুলনা করতে পারে তা অধ্যয়ন করলেও এর মধ্যে সমস্ত বিকল্প অন্তর্ভুক্ত রয়েছে the নীচের ছবি থেকে নেওয়া হয়েছেআমি চ চ আমি আমিআমার কাগজ সম্পর্কে ব্লগ আলোচনা এবং অসীম বৈকল্পিক অনুমানের দুর্বল রূপান্তর চিত্রিত করে।
গুরুত্ব বিতরণের সাথে গুরুত্বের নমুনা একটি এক্সপ্রেস (1) বিতরণ লক্ষ্য বিতরণ একটি এক্সপ (1/10) বিতরণ, এবং ফাংশন । ইন্টিগ্রালের আসল মান ।10
[নীচে আমাদের বই মন্টি কার্লো স্ট্যাটিস্টিকাল পদ্ধতিগুলি থেকে পুনরুত্পাদন করা হয়েছে ]]
আইনজীবীরা Ripley (1987) শো থেকে নিম্নলিখিত উদাহরণে কেন এটা আসলে (মূল) চেয়ে বন্টন অপরের থেকে উৎপন্ন যে বছরের বাবদ বিতরণ অবিচ্ছেদ্য প্রদর্শনে আগ্রহের interest বা অন্য কথায় প্রদত্ত ঘনত্বের বিরুদ্ধে প্রত্যাশা হিসাবে অখণ্ডের প্রতিনিধিত্ব সংশোধন করা।∫ X h ( x ) f ( x )
উদাহরণ (কচির লেজের সম্ভাব্যতা) ধরুন যে আগ্রহের পরিমাণটি সম্ভাবনা, , যে একটি ভেরিয়েবল চেয়ে বড় , অর্থাৎ, যখন মূল্যায়ন করা হয় অভিজ্ঞতাগত গড় নমুনা , এই অনুমানের বৈকল্পিক হল ( থেকে সমান )।সি ( 0 , 1 ) 2 পি = ∫ + ∞ 2পি পি 1 = 1
গড় থেকে যেহেতু, এর প্রতিসম প্রকৃতি বিবেচনা করে এই প্রকরণটি হ্রাস করা যেতে পারে এর ভেরিয়েন্স সমান ।
এই পদ্ধতির (আপেক্ষিক) অদক্ষতা আগ্রহের ডোমেনের বাইরে মান উত্পন্নকরণের কারণে, , যা কিছুটা অর্থে সান্নিধ্যের জন্য অপ্রাসঙ্গিক । [এটি মাইকেল চেরনিকের সাথে লেজ অঞ্চল অনুমানের উল্লেখ করেছে]] যদি লেখা থাকে , উপরের অবিচ্ছেদ্য এর প্রত্যাশা হিসাবে বিবেচনা করা যেতে পারে , যেখানে । জন্য মূল্যায়নের একটি বিকল্প পদ্ধতি তাই for এর জন্য
সাথে তুলনা করে, দ্বারা আনা বৈকল্পিক হ্রাস order , যা বিশেষত বোঝায় যে এই মূল্যায়নের জন্য প্রয়োজন একই নির্ভুলতা অর্জনের জন্য চেয়ে গুণ কম সিমুলেশন । P 410-3√ পৃঃ 1▸