অনুকরণ বিতরণ


9

আমি ক্যাপাসিটি প্ল্যানিং অ্যাসাইনমেন্টে কাজ করছি এবং আমি কয়েকটি বই পড়েছি। এটি বিশেষত বিতরণ সম্পর্কে। আমি আর ব্যবহার করি

  1. আমার ডেটা বিতরণ কী তা চিহ্নিত করার জন্য প্রস্তাবিত পদ্ধতির কী? এটি শনাক্ত করার কোনও পরিসংখ্যানিক পদ্ধতি আছে?

আমার এই চিত্রটি আছে

সম্ভাব্য পদ্ধতি: বিশ্লেষণ, সিদ্ধান্তের গাছ এবং অনুকরণ

  1. আর ব্যবহার করে উপলব্ধ সিমুলেশন পদ্ধতির কী কী? এখানে তাত্পর্য হিসাবে একটি নির্দিষ্ট বিতরণের জন্য ডেটা উত্পন্ন করতে চাই। আমি জাভা এর সাথে সংহত করতে চাইলে আর-জাভা কি সঠিক পদ্ধতির?

  2. আমি যখন কোনও নির্দিষ্ট বিতরণের জন্য ডেটা পাইপ করি তখন প্রভাব (সিপিইউ ব্যবহার ইত্যাদি) এর কী কী বিতরণে আসবে তার পূর্বাভাস দেওয়ার কোনও উপায় আছে? ডেটা নির্দিষ্ট বিতরণ প্রেরণ বিভিন্ন প্রভাব কি?

এটিকে শুরুর প্রশ্ন হিসাবে বিবেচনা করুন। এই জাতীয় সিমুলেশনগুলির সাথে সম্পর্কিত এমন কোনও বই বা উপাদান রয়েছে কি?

মন্তব্য

এই চিত্রটি http://people.stern.nyu.edu/adamodar/pdfiles/papers/probabilistic.pdf এর শেষ প্রান্ত থেকে ।

ফিট প্রযুক্তির ভালতা আমি জুড়ে এসেছি

সদ্ব্যবহারের মূল্যায়ন

  1. চি-ছক
  2. Kolmogorov-Smirnov,
  3. অ্যান্ডারসন-ডার্লিং পরিসংখ্যানের ঘনত্ব, সিডিএফ, পিপি এবং কিউকিউ প্লট

আমি নিশ্চিত নই যে আমার বিতরণটি স্বাভাবিক বা ঘৃণ্য হয় ইত্যাদি যদি এটি দেখতে পায় তবে ব্যাখ্যা বা পরবর্তী পদক্ষেপগুলি কী হওয়া উচিত? এটি আমাকে কী করতে দেয়? প্রেডিক্সন? আশা করি এই প্রশ্নটি পরিষ্কার হয়ে গেছে।

তাত্পর্যপূর্ণ বিলম্বগুলি নীল গুন্থারের আমার ক্যাপাসিটি প্ল্যানিং বই অনুসারে সারি সারি ওঠানামা প্ররোচিত করবে। সুতরাং আমি জানি যে একটি পয়েন্ট।


আপনি যদি মনে করেন আপনার চিত্রটি গুরুত্বপূর্ণ, তবে আপনার ছবির মান উন্নত করার চেষ্টা করা উচিত ...
অক্টোবরের

আমি একটি সুন্দর প্রশ্ন করার জন্য এটি যত্ন নেওয়ার প্রশংসা করি। আমার মতে আপনার পয়েন্ট ২ (যা আমার ধারণা 3 টি হওয়া উচিত) এর স্পষ্টতা দরকার, অথবা আপনি এটিকে স্ট্যাক ওভারফ্লোতেও স্থানান্তর করতে পারেন।
gui11aume

1
আমার মনে হয় আমার শেষ প্রশ্নটি এখানে। ধরা যাক আমি আমার ডেটা বিতরণ সনাক্ত করি। এটা কি আমি ভবিষ্যদ্বাণী করি যে ভবিষ্যতে বিতরণগুলি এই সম্ভাবনাটি অনুসরণ করবে? আমি এখানে বিশ্লেষণের অংশটি অনুপস্থিত। আমি জানি যে একটি বাক্স-হুইস্কার প্লট সহজেই কোয়ার্টাইলগুলি দেখায় যা আমি বুঝতে পারি। আমি কোনও বিতরণের ইউটিলিটি পাই না। ভবিষ্যদ্বাণী করার জন্য আমার তদন্ত করতে হবে এই বিতরণের বৈশিষ্ট্যগুলি থাকতে পারে।
মোহন রাধাকৃষ্ণন

@ ক্রোম মানটি নিম্নমানের থাকলে আপনার ব্রাউজারে পৃষ্ঠাটি প্রশস্ত করুন: বিশদটি এখানে রয়েছে। বিটিডাব্লু, এই চিত্রগুলি অবশ্যই কিছু ক্রিস্টাল বল ডকুমেন্টেশনের হতে হবে।
whuber

@ ভুবার: আসলে, আমি চেষ্টাও করিনি! মন্তব্যের জন্য দুঃখিত।
ocram

উত্তর:


7

আমি আর এর সাথে সিমুলেশনগুলি সম্পর্কে আপনার পয়েন্টটি উত্তর দেব কারণ এটিই আমার পরিচিত। আর এর অনেকগুলি বিল্টিন বিতরণ রয়েছে যা আপনি অনুকরণ করতে পারেন। নামকরণের লজিকগুলি হ'ল disনামটি বন্টন অনুকরণ করতে হবে rdis

নীচে আমি প্রায়শই ব্যবহার করি

# Some continuous distributions.
?rnorm
?runif
?rgamma
?rlnorm
?rweibull
?rexp
?rt
# Some discrete distributions.
?rpoiss
?rbinom
?rnbinom
?rgeom
?rhyper

আর এর সাথে ফিটিং বিতরণে কিছু পরিপূরণ পেতে পারেন ।

সংযোজন: বিতরণ এবং তাদের অন্তর্ভুক্ত প্যাকেজগুলির একটি বিস্তৃত তালিকা সহ একটি লিঙ্ক সরবরাহ করার জন্য @ jthetzel কে ধন্যবাদ ।

তবে অপেক্ষা করুন, আরও রয়েছে: ঠিক আছে, @ হুশিয়ারের মন্তব্য অনুসরণ করে আমি অন্য বিষয়গুলিকে সম্বোধন করার চেষ্টা করব। পয়েন্ট 1 সম্পর্কিত, আমি কখনও কখনও সদ্ব্যবহারে ফিট হই না। পরিবর্তে আমি সর্বদা সিগন্যালটির উত্স সম্পর্কে চিন্তা করি, যেমন ঘটনার কারণ হয়, সেখানে কী প্রাকৃতিক প্রতিসাম্য তৈরি হয় যা এটি তৈরি করে ইত্যাদি etc. েকে দেওয়ার জন্য আপনার বেশ কয়েকটি বইয়ের অধ্যায় প্রয়োজন তাই আমি কেবল দুটি উদাহরণ দেব give

  1. যদি ডেটা গণনা করা হয় এবং কোনও উচ্চতর সীমা না থাকে তবে আমি একটি পইসন চেষ্টা করি। পাইসন ভেরিয়েবলগুলি একটি টাইম উইন্ডোর সময় ক্রমান্বয়ে স্বতন্ত্র গণনা হিসাবে ব্যাখ্যা করা যেতে পারে যা একটি খুব সাধারণ কাঠামো। আমি বিতরণ ফিট করে এবং দেখতে (প্রায়শই দৃষ্টিভঙ্গি) হয় যে প্রকরণটি ভালভাবে বর্ণিত হয়েছে। বেশিরভাগ ক্ষেত্রে, নমুনার বৈকল্পিকতা অনেক বেশি, এক্ষেত্রে আমি নেতিবাচক দ্বিপদী ব্যবহার করি। নেগেটিভ বাইনোমিয়ালকে বিভিন্ন ভেরিয়েবলের সাথে পায়সনের মিশ্রণ হিসাবে ব্যাখ্যা করা যেতে পারে যা আরও সাধারণ, তাই এটি সাধারণত নমুনার সাথে খুব ভাল ফিট করে।

  2. যদি আমি মনে করি যে ডেটাগুলি গড়ের চারপাশে প্রতিসাম্যযুক্ত, অর্থাৎ বিচ্যুতিগুলি ইতিবাচক বা নেতিবাচক হওয়ার সম্ভাবনা রয়েছে তবে আমি কোনও গাউসিয়ানকে ফিট করার চেষ্টা করি। আমি তখন পরীক্ষা করে দেখি (আবার দৃষ্টি দিয়ে) অনেক বিদেশী আছে কিনা, অর্থাত্ ডেটা পয়েন্টগুলি গড় থেকে খুব দূরে। যদি সেখানে থাকে তবে আমি পরিবর্তে একটি শিক্ষার্থীর টি ব্যবহার করি। শিক্ষার্থীর টি বিতরণকে বিভিন্ন রূপের গাউসের মিশ্রণ হিসাবে ব্যাখ্যা করা যেতে পারে, যা আবার খুব সাধারণ।

এই উদাহরণগুলিতে, আমি যখন দৃষ্টিভঙ্গি বলি, তার অর্থ আমি একটি কিউকিউ প্লট ব্যবহার করি

পয়েন্ট 3, বেশ কয়েকটি বইয়ের অধ্যায়গুলিরও প্রাপ্য। অন্যের পরিবর্তে বিতরণ ব্যবহারের প্রভাব সীমাহীন। সুতরাং এটি সব কিছু না করে পরিবর্তে, আমি উপরের দুটি উদাহরণ চালিয়ে যাব।

  1. আমার প্রথম দিনগুলিতে, আমি জানতাম না যে নেতিবাচক দ্বিপদী একটি অর্থপূর্ণ ব্যাখ্যা করতে পারে তাই আমি পয়সনকে সর্বদা ব্যবহার করি (কারণ আমি মানবিক পদগুলিতে প্যারামিটারগুলি ব্যাখ্যা করতে সক্ষম হতে চাই)। খুব প্রায়শই, আপনি যখন পইসন ব্যবহার করেন, আপনি গড়টি সুন্দরভাবে ফিট করেন তবে আপনি বৈকল্পিকাকে অবমূল্যায়ন করেন। এর অর্থ হল যে আপনি আপনার নমুনার চূড়ান্ত মানগুলি পুনরুত্পাদন করতে অক্ষম এবং আপনি প্রকৃতপক্ষে না হওয়া অবস্থায় আপনি বহিরাগতদের (ডেটা পয়েন্টগুলির অন্যান্য পয়েন্টগুলির মতো একই বিতরণ নেই) হিসাবে মূল্যবোধ বিবেচনা করবেন।

  2. আবার আমার প্রথম দিনগুলিতে, আমি জানতাম না যে স্টুডেন্টের টি এরও একটি অর্থপূর্ণ ব্যাখ্যা রয়েছে এবং আমি গাউসিকে সব সময় ব্যবহার করব। একই ঘটনা ঘটেছে। আমি গড় এবং তারতম্যটি ভালভাবে ফিট করব, তবে আমি এখনও বহিরাগতদের ক্যাপচার করব না কারণ প্রায় সমস্ত ডেটা পয়েন্টগুলি গড়ের 3 টি স্ট্যান্ডার্ড বিচ্যুতির মধ্যে বলে মনে করা হচ্ছে। একই জিনিসটি ঘটেছিল, আমি উপসংহারে পৌঁছেছি যে কিছু পয়েন্টগুলি "অসাধারণ" ছিল, যদিও বাস্তবে তা ছিল না।


2
একটি নোট gui11aume এর উত্তর যোগ করতে আছে: আর ডিস্ট্রিবিউশন এর সাথে সম্পর্কিত কাজকর্মের জন্য একটি "ঘ, পি, প্রশ্ন, r" বা বাক্য গঠন উদাহরণস্বরূপ হয়, dnorm, pnorm, qnorm, এবং rnormঘনত্ব, ক্রমবর্ধমান বণ্টনের ফাংশনের (সিডিএফ), সিডিএফ বিপরীত হয়, এবং যথাযথভাবে সাধারণ বিতরণের জন্য র্যান্ডম ভ্যারিয়েট জেনারেটর কাজ করে। উপলভ্য বিতরণের বিস্তৃত তালিকার জন্য সম্ভাব্যতা বন্টন টাস্ক ভিউটি দেখুন ।
jthetzel

হ্যাঁ, অনেক ধন্যবাদ (+1)। আমি দীর্ঘদিন ধরে এই জাতীয় তালিকার সন্ধান করছিলাম। আমি এটি উত্তরে রেখেছি যাতে এটি আরও দৃশ্যমান হয়।
gui11aume

1
এই বিতরণগুলির একটি তৃতীয়াংশ কী তা আমি আপনাকেও বলতে পারি না। আরও অনেক কিছু শিখতে হবে ...। +1, তবে আসুন বাকি প্রশ্নটি ভুলে যাবেন না, যা মৌলিক (তবে সম্ভবত কিছুটা বিস্তৃত): বন্টনের পছন্দগুলি সিমুলেশনে কী প্রভাব ফেলবে? কীভাবে এই পছন্দগুলি করা উচিত?
হোবার

@ শুভ আমি কিউ ওঠানামাগুলিতে বিলম্বের ঘনিষ্ঠভাবে বিতরণের প্রভাব যুক্ত করেছি। পড়ুন। সিপি বা সারিবদ্ধ বই।
মোহন রাধাকৃষ্ণন

আমি আর এর সাথে ফিটিং বিতরণগুলি পড়েছি এবং একবার কিউকিউ প্লট ব্যবহার করেছি। সর্বাধিক সম্ভাবনার অনুমান গণিতের প্রকাশের সাথে শুরু হয় নমুনা ডেটার সম্ভাবনা ফাংশন হিসাবে পরিচিত .. আলগাভাবে বলতে গেলে, ডেটা সংকলনের সম্ভাব্যতা নির্বাচিত সম্ভাব্যতা মডেলকে প্রদত্ত নির্দিষ্ট সেট ডেটা প্রাপ্তির সম্ভাবনা। এর অর্থ কি গণনা করার কোনও উপায় আছে যে বিতরণ আবার ঘটতে পারে? এটি প্রমাণ করতে কতটি পরিমাপ প্রয়োজন?
মোহন রাধাকৃষ্ণন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.