অনুকরণ বিতরণ

আমি ক্যাপাসিটি প্ল্যানিং অ্যাসাইনমেন্টে কাজ করছি এবং আমি কয়েকটি বই পড়েছি। এটি বিশেষত বিতরণ সম্পর্কে। আমি আর ব্যবহার করি

আমার ডেটা বিতরণ কী তা চিহ্নিত করার জন্য প্রস্তাবিত পদ্ধতির কী? এটি শনাক্ত করার কোনও পরিসংখ্যানিক পদ্ধতি আছে?

আমার এই চিত্রটি আছে

সম্ভাব্য পদ্ধতি: বিশ্লেষণ, সিদ্ধান্তের গাছ এবং অনুকরণ

আর ব্যবহার করে উপলব্ধ সিমুলেশন পদ্ধতির কী কী? এখানে তাত্পর্য হিসাবে একটি নির্দিষ্ট বিতরণের জন্য ডেটা উত্পন্ন করতে চাই। আমি জাভা এর সাথে সংহত করতে চাইলে আর-জাভা কি সঠিক পদ্ধতির?
আমি যখন কোনও নির্দিষ্ট বিতরণের জন্য ডেটা পাইপ করি তখন প্রভাব (সিপিইউ ব্যবহার ইত্যাদি) এর কী কী বিতরণে আসবে তার পূর্বাভাস দেওয়ার কোনও উপায় আছে? ডেটা নির্দিষ্ট বিতরণ প্রেরণ বিভিন্ন প্রভাব কি?

এটিকে শুরুর প্রশ্ন হিসাবে বিবেচনা করুন। এই জাতীয় সিমুলেশনগুলির সাথে সম্পর্কিত এমন কোনও বই বা উপাদান রয়েছে কি?

আমি নিশ্চিত নই যে আমার বিতরণটি স্বাভাবিক বা ঘৃণ্য হয় ইত্যাদি যদি এটি দেখতে পায় তবে ব্যাখ্যা বা পরবর্তী পদক্ষেপগুলি কী হওয়া উচিত? এটি আমাকে কী করতে দেয়? প্রেডিক্সন? আশা করি এই প্রশ্নটি পরিষ্কার হয়ে গেছে।

তাত্পর্যপূর্ণ বিলম্বগুলি নীল গুন্থারের আমার ক্যাপাসিটি প্ল্যানিং বই অনুসারে সারি সারি ওঠানামা প্ররোচিত করবে। সুতরাং আমি জানি যে একটি পয়েন্ট।

distributions simulation

— মোহন রাধাকৃষ্ণান
সূত্র

আপনি যদি মনে করেন আপনার চিত্রটি গুরুত্বপূর্ণ, তবে আপনার ছবির মান উন্নত করার চেষ্টা করা উচিত ...

— অক্টোবরের

আমি একটি সুন্দর প্রশ্ন করার জন্য এটি যত্ন নেওয়ার প্রশংসা করি। আমার মতে আপনার পয়েন্ট ২ (যা আমার ধারণা 3 টি হওয়া উচিত) এর স্পষ্টতা দরকার, অথবা আপনি এটিকে স্ট্যাক ওভারফ্লোতেও স্থানান্তর করতে পারেন।

— gui11aume

আমার মনে হয় আমার শেষ প্রশ্নটি এখানে। ধরা যাক আমি আমার ডেটা বিতরণ সনাক্ত করি। এটা কি আমি ভবিষ্যদ্বাণী করি যে ভবিষ্যতে বিতরণগুলি এই সম্ভাবনাটি অনুসরণ করবে? আমি এখানে বিশ্লেষণের অংশটি অনুপস্থিত। আমি জানি যে একটি বাক্স-হুইস্কার প্লট সহজেই কোয়ার্টাইলগুলি দেখায় যা আমি বুঝতে পারি। আমি কোনও বিতরণের ইউটিলিটি পাই না। ভবিষ্যদ্বাণী করার জন্য আমার তদন্ত করতে হবে এই বিতরণের বৈশিষ্ট্যগুলি থাকতে পারে।

— মোহন রাধাকৃষ্ণন

@ ক্রোম মানটি নিম্নমানের থাকলে আপনার ব্রাউজারে পৃষ্ঠাটি প্রশস্ত করুন: বিশদটি এখানে রয়েছে। বিটিডাব্লু, এই চিত্রগুলি অবশ্যই কিছু ক্রিস্টাল বল ডকুমেন্টেশনের হতে হবে।

— whuber

@ ভুবার: আসলে, আমি চেষ্টাও করিনি! মন্তব্যের জন্য দুঃখিত।

— ocram

আমি আর এর সাথে সিমুলেশনগুলি সম্পর্কে আপনার পয়েন্টটি উত্তর দেব কারণ এটিই আমার পরিচিত। আর এর অনেকগুলি বিল্টিন বিতরণ রয়েছে যা আপনি অনুকরণ করতে পারেন। নামকরণের লজিকগুলি হ'ল disনামটি বন্টন অনুকরণ করতে হবে rdis।

নীচে আমি প্রায়শই ব্যবহার করি

# Some continuous distributions.
?rnorm
?runif
?rgamma
?rlnorm
?rweibull
?rexp
?rt
# Some discrete distributions.
?rpoiss
?rbinom
?rnbinom
?rgeom
?rhyper

আর এর সাথে ফিটিং বিতরণে কিছু পরিপূরণ পেতে পারেন ।

সংযোজন: বিতরণ এবং তাদের অন্তর্ভুক্ত প্যাকেজগুলির একটি বিস্তৃত তালিকা সহ একটি লিঙ্ক সরবরাহ করার জন্য @ jthetzel কে ধন্যবাদ ।

তবে অপেক্ষা করুন, আরও রয়েছে: ঠিক আছে, @ হুশিয়ারের মন্তব্য অনুসরণ করে আমি অন্য বিষয়গুলিকে সম্বোধন করার চেষ্টা করব। পয়েন্ট 1 সম্পর্কিত, আমি কখনও কখনও সদ্ব্যবহারে ফিট হই না। পরিবর্তে আমি সর্বদা সিগন্যালটির উত্স সম্পর্কে চিন্তা করি, যেমন ঘটনার কারণ হয়, সেখানে কী প্রাকৃতিক প্রতিসাম্য তৈরি হয় যা এটি তৈরি করে ইত্যাদি etc. েকে দেওয়ার জন্য আপনার বেশ কয়েকটি বইয়ের অধ্যায় প্রয়োজন তাই আমি কেবল দুটি উদাহরণ দেব give

যদি ডেটা গণনা করা হয় এবং কোনও উচ্চতর সীমা না থাকে তবে আমি একটি পইসন চেষ্টা করি। পাইসন ভেরিয়েবলগুলি একটি টাইম উইন্ডোর সময় ক্রমান্বয়ে স্বতন্ত্র গণনা হিসাবে ব্যাখ্যা করা যেতে পারে যা একটি খুব সাধারণ কাঠামো। আমি বিতরণ ফিট করে এবং দেখতে (প্রায়শই দৃষ্টিভঙ্গি) হয় যে প্রকরণটি ভালভাবে বর্ণিত হয়েছে। বেশিরভাগ ক্ষেত্রে, নমুনার বৈকল্পিকতা অনেক বেশি, এক্ষেত্রে আমি নেতিবাচক দ্বিপদী ব্যবহার করি। নেগেটিভ বাইনোমিয়ালকে বিভিন্ন ভেরিয়েবলের সাথে পায়সনের মিশ্রণ হিসাবে ব্যাখ্যা করা যেতে পারে যা আরও সাধারণ, তাই এটি সাধারণত নমুনার সাথে খুব ভাল ফিট করে।
যদি আমি মনে করি যে ডেটাগুলি গড়ের চারপাশে প্রতিসাম্যযুক্ত, অর্থাৎ বিচ্যুতিগুলি ইতিবাচক বা নেতিবাচক হওয়ার সম্ভাবনা রয়েছে তবে আমি কোনও গাউসিয়ানকে ফিট করার চেষ্টা করি। আমি তখন পরীক্ষা করে দেখি (আবার দৃষ্টি দিয়ে) অনেক বিদেশী আছে কিনা, অর্থাত্ ডেটা পয়েন্টগুলি গড় থেকে খুব দূরে। যদি সেখানে থাকে তবে আমি পরিবর্তে একটি শিক্ষার্থীর টি ব্যবহার করি। শিক্ষার্থীর টি বিতরণকে বিভিন্ন রূপের গাউসের মিশ্রণ হিসাবে ব্যাখ্যা করা যেতে পারে, যা আবার খুব সাধারণ।

এই উদাহরণগুলিতে, আমি যখন দৃষ্টিভঙ্গি বলি, তার অর্থ আমি একটি কিউকিউ প্লট ব্যবহার করি

পয়েন্ট 3, বেশ কয়েকটি বইয়ের অধ্যায়গুলিরও প্রাপ্য। অন্যের পরিবর্তে বিতরণ ব্যবহারের প্রভাব সীমাহীন। সুতরাং এটি সব কিছু না করে পরিবর্তে, আমি উপরের দুটি উদাহরণ চালিয়ে যাব।

আমার প্রথম দিনগুলিতে, আমি জানতাম না যে নেতিবাচক দ্বিপদী একটি অর্থপূর্ণ ব্যাখ্যা করতে পারে তাই আমি পয়সনকে সর্বদা ব্যবহার করি (কারণ আমি মানবিক পদগুলিতে প্যারামিটারগুলি ব্যাখ্যা করতে সক্ষম হতে চাই)। খুব প্রায়শই, আপনি যখন পইসন ব্যবহার করেন, আপনি গড়টি সুন্দরভাবে ফিট করেন তবে আপনি বৈকল্পিকাকে অবমূল্যায়ন করেন। এর অর্থ হল যে আপনি আপনার নমুনার চূড়ান্ত মানগুলি পুনরুত্পাদন করতে অক্ষম এবং আপনি প্রকৃতপক্ষে না হওয়া অবস্থায় আপনি বহিরাগতদের (ডেটা পয়েন্টগুলির অন্যান্য পয়েন্টগুলির মতো একই বিতরণ নেই) হিসাবে মূল্যবোধ বিবেচনা করবেন।
আবার আমার প্রথম দিনগুলিতে, আমি জানতাম না যে স্টুডেন্টের টি এরও একটি অর্থপূর্ণ ব্যাখ্যা রয়েছে এবং আমি গাউসিকে সব সময় ব্যবহার করব। একই ঘটনা ঘটেছে। আমি গড় এবং তারতম্যটি ভালভাবে ফিট করব, তবে আমি এখনও বহিরাগতদের ক্যাপচার করব না কারণ প্রায় সমস্ত ডেটা পয়েন্টগুলি গড়ের 3 টি স্ট্যান্ডার্ড বিচ্যুতির মধ্যে বলে মনে করা হচ্ছে। একই জিনিসটি ঘটেছিল, আমি উপসংহারে পৌঁছেছি যে কিছু পয়েন্টগুলি "অসাধারণ" ছিল, যদিও বাস্তবে তা ছিল না।

— gui11aume
সূত্র

একটি নোট gui11aume এর উত্তর যোগ করতে আছে: আর ডিস্ট্রিবিউশন এর সাথে সম্পর্কিত কাজকর্মের জন্য একটি "ঘ, পি, প্রশ্ন, r" বা বাক্য গঠন উদাহরণস্বরূপ হয়, dnorm, pnorm, qnorm, এবং rnormঘনত্ব, ক্রমবর্ধমান বণ্টনের ফাংশনের (সিডিএফ), সিডিএফ বিপরীত হয়, এবং যথাযথভাবে সাধারণ বিতরণের জন্য র্যান্ডম ভ্যারিয়েট জেনারেটর কাজ করে। উপলভ্য বিতরণের বিস্তৃত তালিকার জন্য সম্ভাব্যতা বন্টন টাস্ক ভিউটি দেখুন ।

— jthetzel

হ্যাঁ, অনেক ধন্যবাদ (+1)। আমি দীর্ঘদিন ধরে এই জাতীয় তালিকার সন্ধান করছিলাম। আমি এটি উত্তরে রেখেছি যাতে এটি আরও দৃশ্যমান হয়।

— gui11aume

এই বিতরণগুলির একটি তৃতীয়াংশ কী তা আমি আপনাকেও বলতে পারি না। আরও অনেক কিছু শিখতে হবে ...। +1, তবে আসুন বাকি প্রশ্নটি ভুলে যাবেন না, যা মৌলিক (তবে সম্ভবত কিছুটা বিস্তৃত): বন্টনের পছন্দগুলি সিমুলেশনে কী প্রভাব ফেলবে? কীভাবে এই পছন্দগুলি করা উচিত?

— হোবার

@ শুভ আমি কিউ ওঠানামাগুলিতে বিলম্বের ঘনিষ্ঠভাবে বিতরণের প্রভাব যুক্ত করেছি। পড়ুন। সিপি বা সারিবদ্ধ বই।

— মোহন রাধাকৃষ্ণন

আমি আর এর সাথে ফিটিং বিতরণগুলি পড়েছি এবং একবার কিউকিউ প্লট ব্যবহার করেছি। সর্বাধিক সম্ভাবনার অনুমান গণিতের প্রকাশের সাথে শুরু হয় নমুনা ডেটার সম্ভাবনা ফাংশন হিসাবে পরিচিত .. আলগাভাবে বলতে গেলে, ডেটা সংকলনের সম্ভাব্যতা নির্বাচিত সম্ভাব্যতা মডেলকে প্রদত্ত নির্দিষ্ট সেট ডেটা প্রাপ্তির সম্ভাবনা। এর অর্থ কি গণনা করার কোনও উপায় আছে যে বিতরণ আবার ঘটতে পারে? এটি প্রমাণ করতে কতটি পরিমাপ প্রয়োজন?

— মোহন রাধাকৃষ্ণন

অনুকরণ বিতরণ

মন্তব্য

ফিট প্রযুক্তির ভালতা আমি জুড়ে এসেছি