স্থানিক ডেটা ফিটিং বিতরণ


10

কিছু পরিসংখ্যান সুনির্দিষ্ট সহায়তা সন্ধানের জন্য গণিত থেকে আমার প্রশ্ন পোস্ট করা ক্রস করুন ।

আমি একটি শারীরিক প্রক্রিয়া ডেটা তৈরির অধ্যয়ন করছি যা অ-নেতিবাচক মানগুলির সাথে দুটি মাত্রায় দুর্দান্তভাবে প্রজেক্ট করে। প্রতিটি প্রক্রিয়াতে - পয়েন্টগুলির একটি (প্রস্তাবিত) ট্র্যাক থাকে - নীচের চিত্রটি দেখুন।এক্সY

নমুনা ট্র্যাকগুলি নীল, একটি ঝামেলার ধরণের ট্র্যাক সবুজ হাতে আঁকানো হয়েছে, এবং উদ্বেগের অঞ্চলটি লাল রঙে আঁকা: ট্র্যাক এবং উদ্বেগের অঞ্চল

প্রতিটি ট্র্যাক একটি স্বাধীন পরীক্ষার ফলাফল। কয়েক মিলিয়ন বছর ধরে বিশ মিলিয়ন পরীক্ষা-নিরীক্ষা করা হয়েছে, তবে কেবলমাত্র দু'হাজার থেকে আমরা এই বৈশিষ্ট্যটি প্রদর্শন করি যা আমরা ট্র্যাক হিসাবে পরিকল্পনা করি। আমরা কেবল পরীক্ষাগুলি নিয়েই উদ্বিগ্ন যা কোনও ট্র্যাক উত্পন্ন করে, তাই আমাদের ডেটা সেটটি (প্রায়) দুই হাজার ট্র্যাক।

এটা একটা ট্র্যাক উদ্বেগের অঞ্চল প্রবেশ করতে, এবং আমরা অনুক্রম প্রত্যাশায় আছি সম্ভব মধ্যে গানগুলি তা করার। এই সংখ্যাটি অনুমান করা এখনই প্রশ্ন:1104

উদ্বেগের অঞ্চলে একটি স্বেচ্ছাসেবক ট্র্যাক প্রবেশের সম্ভাবনাটি আমরা কীভাবে গণনা করতে পারি?

উদ্বেগের অঞ্চলে প্রবেশ করে এমন ট্র্যাকগুলি কতবার উত্পন্ন হয় তা দেখার জন্য দ্রুত পরীক্ষা-নিরীক্ষা চালানো সম্ভব নয়, সুতরাং আমাদের উপলভ্য ডেটা থেকে এক্সট্রোপোলেট করা দরকার।

আমরা প্রদত্ত উদাহরণস্বরূপ মানগুলির জন্য উপযুক্ত করে , তবে এটি গ্রিন ট্র্যাকের মতো ডেটা যথেষ্ট পরিমাণে হ্যান্ডেল করে না - উভয় মাত্রা একটি মডেল থাকা প্রয়োজন বলে মনে হয়।এক্সY200

আমরা প্রতিটি ট্র্যাক থেকে উদ্বেগের অঞ্চলে ন্যূনতম দূরত্ব ফিট করেছি, তবে আমরা আপত্তিহীনভাবে এটি ন্যায়সঙ্গত ফলাফল আনছে।

1) এক্সট্রাপোলেশনের জন্য এই ধরণের ডেটাতে বিতরণ মাপার কোনও জ্ঞাত উপায় আছে কি?

-অথবা-

2) ট্র্যাক উত্পন্ন করার জন্য একটি মডেল তৈরি করতে এই ডেটা ব্যবহার করার কোনও সুস্পষ্ট উপায় আছে? উদাহরণস্বরূপ, বড় জায়গার পয়েন্ট হিসাবে ট্র্যাকগুলিতে মূল উপাদান বিশ্লেষণ ব্যবহার করুন, তারপরে সেই উপাদানগুলিতে প্রবর্তিত ট্র্যাকগুলিতে একটি বিতরণ (পিয়ারসন?) ফিট করুন।


1
আমি অবশ্যই নির্দিষ্ট প্রক্রিয়া সম্পর্কে আরও তথ্য দেব না, তবে ডেটা কীভাবে সংগ্রহ করা হয় তা নিয়ে কথা বলতে আমি প্রশ্নটি আপডেট করব।
জেফ স্নাইডার

1
আমি আরও কংক্রিট চেষ্টা করার জন্য ভাষা আপডেট করেছি। কল্পনা করুন যে আমরা একটি খোলা উপরের মেঝে উইন্ডোতে নুড়ি নিক্ষেপ করছি, এবং আমরা কেবল যত্ন করি যে জানালার মধ্য দিয়ে যে নুড়িগুলি theুকে যায় তার অভ্যন্তরের মেঝেতে ounce আমরা লক্ষ লক্ষ নুড়ি ফেলেছি, এবং প্রায় 2000 উইন্ডো দিয়ে গেছে। যখন একটি নুড়ি উইন্ডো দিয়ে যায় আমরা তল জুড়ে এর অগ্রগতির একটি ট্র্যাক আঁকি। উইন্ডোটি দিয়ে একটি নুড়ি পাথর দেওয়া হল, আমরা অনুমান করতে চাই যে এটি উদ্বেগের অঞ্চলটির মধ্য দিয়ে যায়।
জেফ স্নাইডার

উত্তর:


1

দেখে মনে হচ্ছে আপনি ট্র্যাকগুলির গঠন অনুকরণ করতে চান এবং তারপরে মন্টে কার্লো সিমুলেশনটি পরিচালনা করতে চান যে কতগুলি ট্র্যাকগুলি লাল অঞ্চলে পড়ে। এটি করার জন্য, আমি প্রথমে লাইনগুলিকে দুটি ফাংশনে রূপান্তর করব, একটি দিকনির্দেশ এবং অন্যটি দূরত্বটিকে একটি ট্র্যাকের পরবর্তী বিন্দুতে to এখন আপনি এই দুটি ফাংশনের সাথে যুক্ত সম্ভাব্যতা বন্টন অধ্যয়ন করতে পারেন। উদাহরণস্বরূপ, আপনি দেখতে পাবেন যে ভ্রমণ করা দূরত্ব একটি নির্দিষ্ট বিতরণকে অনুসরণ করে (সাবধানতা অবলম্বন করুন যে সময়ের সাথে সাথে বিতরণটি পরিবর্তন না হয়)। সময়ের সাথে সাথে যদি কোনও পরিবর্তনশীল পরিবর্তিত হয় তবে আপনাকে সময় সিরিজ বিশ্লেষণে ডেলাতে হবে (আমার ক্ষেত্র নয়, দুঃখিত)।

আরেকটি ধারণা যা মনে আসে তা হ'ল, যেহেতু xy তে চলাচল করার দিকটি বেশিরভাগ ট্র্যাকগুলিতে ধীরে ধীরে পরিবর্তিত হয়, আপনি ট্র্যাকগুলির জন্য সময় পরিবর্তনের সময় পরিবর্তন পরিবর্তন পরীক্ষা করে আরও ভাল করতে পারেন।

প্রদত্ত দিকনির্দেশনা সহ কোনও প্রদত্ত এক্স কো-অর্ডিনেটে শুরু হওয়া ট্র্যাকের সম্ভাবনাও আপনাকে अनुमान করতে হবে। ফলস্বরূপ পিডিএফটি মসৃণ করতে আপনি কার্নেল ঘনত্বের প্রাক্কলনটি ব্যবহার করে বিবেচনা করতে পারেন বা যদি এটি কোনও বিতরণ অনুসরণ করে বলে মনে হয় যেখানে বিশ্লেষণাত্মক মডেল রয়েছে তবে প্রত্যাশা সর্বাধিকীকরণ ডেটাতে এই বিতরণটি ফিট করতে পারে।

মন্টি কার্লো সিম্যুলেশনগুলি ট্র্যাকগুলির আকারগুলি অনুকরণ করার জন্য এই বিতরণগুলি থেকে এলোমেলো নমুনা আঁকবে would তারপরে আপনাকে প্রচুর সংখ্যক ট্র্যাকের সিমুলেট করতে হবে এবং দেখুন যে এই ট্র্যাকগুলি কতক্ষণ লাল অঞ্চলে যায়। এটি কয়েক হাজার বা কয়েক মিলিয়ন ট্র্যাক হতে পারে, আপনি আরও ট্র্যাক যুক্ত করার সাথে সাথে বিতরণ কখন বন্ধ হবে তা পরীক্ষা করতে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.