গণনা পরিসংখ্যান এলোমেলো সংখ্যা জেনারেশনের কিছু গুরুত্বপূর্ণ ব্যবহার কি?


15

গণনা সংক্রান্ত পরিসংখ্যানগুলিতে এলোমেলো সংখ্যা জেনারেটর (আরএনজি) কীভাবে এবং কেন গুরুত্বপূর্ণ?

আমি বুঝতে পারি যে অনুমানের প্রতি পক্ষপাতিত্ব এড়াতে অনেক পরিসংখ্যান পরীক্ষার জন্য নমুনাগুলি বেছে নেওয়ার সময় এলোমেলোতা গুরুত্বপূর্ণ, তবে গণনা সংক্রান্ত পরিসংখ্যানের অন্যান্য ক্ষেত্রগুলি যেখানে এলোমেলো সংখ্যা জেনারেটর গুরুত্বপূর্ণ?


4
ঘনিষ্ঠভাবে সম্পর্কিত: stats.stackexchange.com/q/135665/35989
টিম

1
তুমি কি জিজ্ঞাসা করছ? আপনার প্রশ্নটি আসলে খুব একটা বোঝায় না।
কার্ল উইথহফট

2
যে অঞ্চলগুলিতে তারা গুরুত্বপূর্ণ নয় তাদের জন্য জিজ্ঞাসা করা ভাল better এটি সম্ভবত একটি সংক্ষিপ্ত তালিকা হতে হবে।
জন কোলেম্যান

2
প্রশ্নটি বিস্তৃত তবে শিরোনামটি আকর্ষণীয় এবং ম্যাথিউয়ের উত্তরটি একটি সুন্দর ওভারভিউ। আমি আবার খুলতে ভোট দিয়েছি!
বানোয়েট সানচেজ

3
এটি প্রচলিত এসই স্ট্যান্ডার্ডগুলি দ্বারা স্পষ্টতই বিস্তৃত, এবং একটি 'বড় তালিকা' প্রশ্নের পরিমাণে যা প্রচুর পরিমাণে ছোট্ট, সবে বিস্তৃত উত্তরগুলি প্রায়শই ইতিমধ্যে সরবরাহ করা সদৃশ উত্তরগুলি সরবরাহ করে। যাইহোক, এখানে কিছু আসল মূল্য বলে মনে হচ্ছে। এটি সমঝোতা এবং সুরক্ষিত হওয়ার জন্য একটি আপস করা। ভবিষ্যতে, উত্তরগুলি যে কোনও বিবরণ ছাড়াই & / অথবা ইতিমধ্যে উল্লিখিত সদৃশ ব্যবহারগুলির কিছু উল্লেখ করেছে সেগুলি অবিলম্বে এবং মন্তব্য ছাড়াই মুছে ফেলা হবে।
গুং - মনিকা পুনরায়

উত্তর:


17

এর অনেকগুলি, উদাহরণ রয়েছে। তালিকাভুক্ত করার জন্য অনেক বেশি, এবং সম্পূর্ণরূপে যে কেউ কারও পক্ষে জানা থাকতে পারে (সম্ভবত @ হুবুহু ছাড়াও, যাকে কখনই অবমূল্যায়ন করা উচিত নয়)।

যেমন আপনি উল্লেখ করেছেন, নিয়ন্ত্রিত পরীক্ষাগুলিতে আমরা চিকিত্সা এবং নিয়ন্ত্রণ গ্রুপগুলিতে এলোমেলোভাবে বিভাজন করে পক্ষপাতের নমুনা এড়ানো করি।

ইন বুটস্ট্র্যাপিং আমরা এলোমেলোভাবে একটি নির্দিষ্ট নমুনা থেকে প্রতিস্থাপন সঙ্গে স্যাম্পলিং দ্বারা একটি জনসংখ্যা থেকে পুনরাবৃত্তি স্যাম্পলিং আনুমানিক। এটি আমাদের অন্যান্য জিনিসগুলির সাথে আমাদের অনুমানের বৈচিত্রটি অনুমান করতে দেয়।

ইন ক্রস বৈধতা আমরা এলোমেলোভাবে টুকরা মধ্যে আমাদের তথ্য পার্টিশনিং এবং র্যান্ডম প্রশিক্ষণ একত্রিতকরনের এবং সেট পরীক্ষার দ্বারা একটি অনুমান নমুনা পথভ্রষ্টতা থেকে অনুমান।

ইন বিন্যাস পরীক্ষামূলক আমরা নাল হাইপোথিসিস অধীনে নমুনা র্যান্ডম একাধিক বিন্যাসন ব্যবহার করেন, পরিস্থিতিতে বিভিন্ন nonparametric হাইপোথিসিস পরীক্ষা সঞ্চালন করতে সক্ষম হবেন।

ইন ব্যাগিং আমরা বারবার প্রশিক্ষণ ডেটার বুটস্ট্র্যাপ নমুনার উপর প্রাক্কলন করণ, এবং তারপর ফলাফল গড় দ্বারা একটি অনুমান ভ্যারিয়েন্স নিয়ন্ত্রণ করে।

ইন র্যান্ডম বন আরো আমরা এছাড়াও এলোমেলোভাবে যে সিদ্ধান্ত বিন্দু এ উপলব্ধ ভবিষ্যতবক্তা থেকে স্যাম্পলিং দ্বারা একটি অনুমান ভ্যারিয়েন্স নিয়ন্ত্রণ করে।

ইন সিমুলেশন আমরা হইয়া মডেল জিজ্ঞাসা এলোমেলোভাবে নতুন ডেটা সেট যা আমরা প্রশিক্ষণ পরীক্ষার তথ্য তুলনা করতে পারবেন, একটি মডেল হইয়া এবং অনুমানের সাহায্য বৈধকরণ তৈরি করতে।

ইন মার্কভ চেইন মন্টে কার্লো সম্ভাব্য ফলাফল (এই উদাহরণস্বরূপ @Ben Bolker ধন্যবাদ) একটি মার্কভ চেইন ব্যবহারের স্থান অন্বেষণ করে একটি ডিস্ট্রিবিউশন থেকে নমুনা আমরা।

এগুলি হ'ল সাধারণ, দৈনন্দিন অ্যাপ্লিকেশন যা তাত্ক্ষণিক মনে আসে। যদি আমি গভীর খনন করি তবে আমি সম্ভবত সেই তালিকার দৈর্ঘ্য দ্বিগুণ করতে পারতাম। এলোমেলোতা উভয়ই অধ্যয়নের একটি গুরুত্বপূর্ণ অবজেক্ট এবং নিয়ন্ত্রণের একটি গুরুত্বপূর্ণ সরঞ্জাম।


এটি সমস্ত সত্য তবে মূল সমস্যাটির সমাধান করে না: কোনও পিআরএনজি ফলস্বরূপ কাঠামো বা অনুক্রমের অনুক্রমের সাথে ক্রম অনুসারে সিমুলেশনগুলি ব্যর্থ হতে পারে।
কার্ল উইথহফট

3
উল্লেখযোগ্য জিনিসগুলির মধ্যে একটি হ'ল বিপুল সংখ্যক এলোমেলো বা সিউডোর্যান্ডম সংখ্যার উত্পাদন করার গণনা এবং মেমরির ব্যয়। পরিসংখ্যানগুলিতে আরএনজি-র কিছু অ্যাপ্লিকেশনগুলির জন্য কয়েকশ থেকে লক্ষ লক্ষ এলোমেলো সংখ্যার প্রয়োজন হয়, তবে কারও কারও কাছে অনেক পরিমাণের অনেকগুলি অর্ডার প্রয়োজন যা এই উভয় ব্যয় বহন করে।
অ্যালেক্সিস

5

এটি সমস্ত সত্য তবে মূল সমস্যাটির সমাধান করে না: অনুক্রমের যে কোনও ধরণের ফলাফল কাঠামো বা অনুমানযোগ্যতার সাথে একটি পিআরএনজি সিমুলেশনগুলিকে ব্যর্থ করে দেবে। কার্ল উইথহফট 31 জানুয়ারী 15:51 এ

যদি এটি আপনার উদ্বেগ হয় তবে সম্ভবত প্রশ্নের শিরোনামটি "মন্টে কার্লো ফলাফলের উপর আরএনজির পছন্দের প্রভাব" বা এর মতো কিছুতে পরিবর্তন করা উচিত। এই ক্ষেত্রে, এসই ক্রস বৈধকরণের উপর ইতিমধ্যে বিবেচিত , এখানে কিছু দিকনির্দেশ রয়েছে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.