আমি একটি নির্দিষ্ট ধরণের পুনরাবৃত্তি পরিমাপের ডেটার সর্বাধিক উপযুক্ত বৈশিষ্ট্যযুক্ত বিতরণ সন্ধান করার চেষ্টা করছি।
মূলত, ভূতত্ত্বের আমার শাখায়, আমরা প্রায়শই কোনও ঘটনা ঘটেছিল তা জানতে (নমুনা তাপমাত্রার নীচে শৈলটি শীতল হয়ে যায়) স্যাম্পলগুলি (শিলার অংশগুলি) থেকে খনিজগুলির রেডিওমেট্রিক ডেটিং ব্যবহার করি। সাধারণত, প্রতিটি নমুনা থেকে বেশ কয়েকটি (3-10) পরিমাপ করা হবে। তারপরে, গড় এবং মানক বিচ্যুতি নেওয়া হয়। এটি ভূতত্ত্ব, সুতরাং নমুনার শীতল বয়সগুলি পরিস্থিতি অনুসারে থেকে বছর পর্যন্ত স্কেল করতে পারে ।
যাইহোক, আমার বিশ্বাস করার কারণ আছে যে পরিমাপগুলি গাউসিয়ান নয়: 'আউটলিয়ার্স', তা নির্বিচারে ঘোষণা করা হয়, বা কিছু মাপদণ্ডের মাধ্যমে যেমন পিয়ার্সের মাপদণ্ড [রস, 2003] বা ডিকসনের কিউ-পরীক্ষা [ডিন এবং ডিকসন, 1951] মোটামুটি সাধারণ (30-এ 1 বলুন) এবং এগুলি প্রায় সবসময়ই পুরানো হয় যা বোঝায় যে এই পরিমাপগুলি চরিত্রগতভাবে সঠিকভাবে স্কিউড। খনিজ সংক্রান্ত অমেধ্যগুলির সাথে এটি করার জন্য সুস্পষ্ট কারণ রয়েছে।
অতএব, যদি আমি আরও ভাল বিতরণ পেতে পারি যা ফ্যাট লেজ এবং স্কিউ অন্তর্ভুক্ত করে, আমি মনে করি যে আমরা আরও অর্থবহ অবস্থান এবং স্কেল প্যারামিটারগুলি তৈরি করতে পারি, এবং এত তাড়াতাড়ি বিদেশীদের সরবরাহ করতে হবে না। উদাহরণস্বরূপ যদি এটি দেখানো যেতে পারে যে এই ধরণের পরিমাপগুলি লগনরমাল, বা লগ-ল্যাপ্লেসিয়ান বা যা কিছু হয় তবে সর্বাধিক সম্ভাবনার আরও উপযুক্ত ব্যবস্থা এবং চেয়ে বেশি ব্যবহার করা যেতে পারে যা অ-শক্তিশালী এবং সম্ভবত ক্ষেত্রে পক্ষপাতদুষ্ট are পদ্ধতিগতভাবে ডান স্কিউ ডেটা।
আমি ভাবছি এটি করার সর্বোত্তম উপায়টি কী। এখনও অবধি, আমার কাছে প্রায় 600 টি নমুনা সহ একটি ডেটাবেস রয়েছে এবং 2-10-10 (বা তাই) প্রতি নমুনার প্রতিলিপি করা হয়। আমি প্রতিটি গড় বা মধ্য দিয়ে ভাগ করে নমুনাগুলিকে সাধারণকরণের চেষ্টা করেছি এবং তারপরে সাধারণ তথ্যগুলির হিস্টোগ্রামগুলি দেখেছি। এটি যুক্তিসঙ্গত ফলাফল উত্পন্ন করে, এবং মনে হয় যে ডেটাটি বৈশিষ্ট্যগতভাবে লগ-ল্যাপলাসিয়ান:
তবে, আমি নিশ্চিত নই যে এটি সম্পর্কে যাবার উপযুক্ত উপায় কিনা, বা যদি আমি অবগত না থাকি এমন সতর্কতাগুলি আমার ফলাফলকে পক্ষপাতদুষ্ট করে দিতে পারে তবে তারা এ জাতীয় চেহারা দেখায়। কারও কি এই ধরণের জিনিস নিয়ে অভিজ্ঞতা আছে এবং সেরা অনুশীলনগুলি জানেন?