কিছু পরিসংখ্যান সুনির্দিষ্ট সহায়তা সন্ধানের জন্য গণিত থেকে আমার প্রশ্ন পোস্ট করা ক্রস করুন ।
আমি একটি শারীরিক প্রক্রিয়া ডেটা তৈরির অধ্যয়ন করছি যা অ-নেতিবাচক মানগুলির সাথে দুটি মাত্রায় দুর্দান্তভাবে প্রজেক্ট করে। প্রতিটি প্রক্রিয়াতে - পয়েন্টগুলির একটি (প্রস্তাবিত) ট্র্যাক থাকে - নীচের চিত্রটি দেখুন।
নমুনা ট্র্যাকগুলি নীল, একটি ঝামেলার ধরণের ট্র্যাক সবুজ হাতে আঁকানো হয়েছে, এবং উদ্বেগের অঞ্চলটি লাল রঙে আঁকা:
প্রতিটি ট্র্যাক একটি স্বাধীন পরীক্ষার ফলাফল। কয়েক মিলিয়ন বছর ধরে বিশ মিলিয়ন পরীক্ষা-নিরীক্ষা করা হয়েছে, তবে কেবলমাত্র দু'হাজার থেকে আমরা এই বৈশিষ্ট্যটি প্রদর্শন করি যা আমরা ট্র্যাক হিসাবে পরিকল্পনা করি। আমরা কেবল পরীক্ষাগুলি নিয়েই উদ্বিগ্ন যা কোনও ট্র্যাক উত্পন্ন করে, তাই আমাদের ডেটা সেটটি (প্রায়) দুই হাজার ট্র্যাক।
এটা একটা ট্র্যাক উদ্বেগের অঞ্চল প্রবেশ করতে, এবং আমরা অনুক্রম প্রত্যাশায় আছি সম্ভব মধ্যে গানগুলি তা করার। এই সংখ্যাটি অনুমান করা এখনই প্রশ্ন:
উদ্বেগের অঞ্চলে একটি স্বেচ্ছাসেবক ট্র্যাক প্রবেশের সম্ভাবনাটি আমরা কীভাবে গণনা করতে পারি?
উদ্বেগের অঞ্চলে প্রবেশ করে এমন ট্র্যাকগুলি কতবার উত্পন্ন হয় তা দেখার জন্য দ্রুত পরীক্ষা-নিরীক্ষা চালানো সম্ভব নয়, সুতরাং আমাদের উপলভ্য ডেটা থেকে এক্সট্রোপোলেট করা দরকার।
আমরা প্রদত্ত উদাহরণস্বরূপ মানগুলির জন্য উপযুক্ত করে , তবে এটি গ্রিন ট্র্যাকের মতো ডেটা যথেষ্ট পরিমাণে হ্যান্ডেল করে না - উভয় মাত্রা একটি মডেল থাকা প্রয়োজন বলে মনে হয়।
আমরা প্রতিটি ট্র্যাক থেকে উদ্বেগের অঞ্চলে ন্যূনতম দূরত্ব ফিট করেছি, তবে আমরা আপত্তিহীনভাবে এটি ন্যায়সঙ্গত ফলাফল আনছে।
1) এক্সট্রাপোলেশনের জন্য এই ধরণের ডেটাতে বিতরণ মাপার কোনও জ্ঞাত উপায় আছে কি?
-অথবা-
2) ট্র্যাক উত্পন্ন করার জন্য একটি মডেল তৈরি করতে এই ডেটা ব্যবহার করার কোনও সুস্পষ্ট উপায় আছে? উদাহরণস্বরূপ, বড় জায়গার পয়েন্ট হিসাবে ট্র্যাকগুলিতে মূল উপাদান বিশ্লেষণ ব্যবহার করুন, তারপরে সেই উপাদানগুলিতে প্রবর্তিত ট্র্যাকগুলিতে একটি বিতরণ (পিয়ারসন?) ফিট করুন।