কেন্দ্র-সেন্সর করা সাধারণ নমুনাগুলির বৈকল্পিক অনুমান করা


11

আমার সাধারণত বিতরণ করা প্রক্রিয়া রয়েছে যা থেকে আমি ছোট নমুনা পাই ( এন সাধারণত 10-30) যা ভেরিয়েন্সটি অনুমান করতে আমি ব্যবহার করতে চাই। তবে প্রায়শই নমুনাগুলি একসাথে এত কাছাকাছি থাকে যে আমরা কেন্দ্রের কাছাকাছি পৃথক পয়েন্টগুলি পরিমাপ করতে পারি না।

আমার এই অস্পষ্ট ধারণাটি রয়েছে যে আমাদের অর্ডার করা নমুনাগুলি ব্যবহার করে একটি দক্ষ অনুমানকারী তৈরি করতে সক্ষম হওয়া উচিত: উদাহরণস্বরূপ, যদি আমি জানি যে স্যাম্পলটিতে 20 পয়েন্ট রয়েছে, এবং 10 টি পৃথক পৃথকভাবে পরিমাপ করার জন্য খুব শক্তভাবে কেন্দ্রের কাছে ক্লাস্টার করা হয়েছে তবে আমার পৃথক পরিমাপ রয়েছে উভয় পুচ্ছের উপর, প্রক্রিয়া বৈকল্পিক যা এই জাতীয় নমুনাগুলির অনুকূল ব্যবহার করে তা নির্ধারণের জন্য কি কোনও মান / সূত্রীয় পদ্ধতি রয়েছে?

(দ্রষ্টব্য, আমি মনে করি না যে আমি কেবল কেন্দ্রের গড় ওজন করতে পারি example উদাহরণস্বরূপ, 7 টি নমুনা শক্তভাবে ক্লাস্টার করা সম্ভব যখন অন্য তিনটি অসামান্যভাবে একপাশে আঁকানো থাকে তবে যথেষ্ট পরিমাণে বন্ধ করে আমরা এটি বলতে পারি না যে আরও ক্লান্তিকর একক নমুনা ছাড়াই) ।)

উত্তরটি জটিল হলে আমার কী গবেষণা করা উচিত সে সম্পর্কে কোনও টিপস প্রশংসা করবে। উদাহরণস্বরূপ, এটি কি একটি আদেশ-পরিসংখ্যান সমস্যা? একটি সূত্রীয় উত্তর হতে পারে, বা এটি একটি গণনামূলক সমস্যা?

আপডেট হওয়া বিশদ: অ্যাপ্লিকেশনটি হ'ল শুটিং লক্ষ্যগুলি বিশ্লেষণ। একটি একক অন্তর্নিহিত নমুনা হ'ল লক্ষ্যের একক শটের প্রভাব ( x, y ) এর বিন্দু । অন্তর্নিহিত প্রক্রিয়াটির প্রতিসাম্য দ্বিচারিত স্বাভাবিক বিতরণ রয়েছে তবে অক্ষগুলির মধ্যে কোনও সম্পর্ক নেই, তাই আমরা normal x } এবং { y } নমুনাগুলি একই সাধারণ বিতরণ থেকে স্বতন্ত্র ড্র হিসাবে বিবেচনা করতে সক্ষম । (আমরা এটিও বলতে পারি যে অন্তর্নিহিত প্রক্রিয়াটি রায়লেইগ-বিতরণকৃত, তবে আমরা নমুনা রায়লেগ বৈচিত্রগুলি পরিমাপ করতে পারি না কারণ আমরা প্রক্রিয়াটির "সত্য" কেন্দ্রের স্থানাঙ্কগুলির বিষয়ে কিছু হতে পারি না, যা ছোট এন এর জন্য উল্লেখযোগ্য হতে পারে নমুনা কেন্দ্র থেকে দূরে ( , ˉ y ))x¯y¯

আমাদের একটি লক্ষ্য দেওয়া হয়েছে এবং এতে গুলিবিদ্ধ সংখ্যা। সমস্যাটি হ'ল এন >> 3 এর জন্য সুনির্দিষ্ট বন্দুকগুলি সাধারণত একটি "র‌্যাগড হোল" অঙ্কিত করবে যা পৃথক শট দ্বারা ঘিরে রয়েছে। আমরা গর্তের এক্স - এবং y- প্রস্থ পর্যবেক্ষণ করতে পারি , তবে আমরা জানি না কোথায় গর্তে অ-স্বতন্ত্র শট প্রভাবিত হয়েছিল।

আরও সমস্যাযুক্ত লক্ষ্যমাত্রার কয়েকটি উদাহরণ এখানে রয়েছে:

[এন = 10 সহ নমুনা লক্ষ্য]

এন = 100 সহ নমুনা লক্ষ্য

(মঞ্জুর, একটি আদর্শ বিশ্বে আমরা প্রতিটি শটের পরে লক্ষ্যগুলি পরিবর্তন / স্যুইচ করব এবং তারপরে বিশ্লেষণের জন্য নমুনাগুলিকে একত্রিত করব There অনেকগুলি কারণ রয়েছে যা প্রায়শই ব্যবহারিক নয়, যদিও এটি সম্ভব হলে সম্পন্ন হয় ))

xi

সমাধান আমি বিশ্বাস করি সবচেয়ে সহজ পদ্ধিতি হল হতে হবে প্রস্থের একটি কেন্দ্রীয় ব্যবধান সঙ্গে, স্বাভাবিক থেকে এক-মাত্রিক নমুনার একটি সেট এই কমাতে সহজতর W > , যেখানে প্রজেক্টাইল ব্যাস, ধারণকারী < এন "সেন্সর" নমুনা।


(1) সাধারণ বিতরণটি কি অনুমান বা এর সমর্থনে আপনার কাছে ভাল প্রমাণ রয়েছে? (২) কেন্দ্রের কাছের ডেটা সঠিকভাবে গণনা করতে না পারার সমস্যাটি কি? (এই স্বাভাবিক অর্থ "সেন্সর," যা যে আপনি থেকে আলাদা হতে হবে পারেন সেই তথ্য গণনা কিন্তু আপনি শুধু জানি যে তাদের মান নির্দিষ্ট সময় অন্তর মধ্যে থাকা।)
whuber

@ শুভ: হ্যাঁ, প্রক্রিয়াটি সাধারণত বিতরণ করা আমাদের কাছে মৌলিক এবং অভিজ্ঞতামূলক প্রমাণ উভয়ই রয়েছে। এবং হ্যাঁ আমরা মোট গ্রুপের পয়েন্টগুলির সঠিক গণনা জানি , এবং আমরা অন্তর (গুলি) পর্যবেক্ষণ করতে পারি যেখানে পৃথক মান নির্ধারণের জন্য অনেক বেশি নমুনা থাকে।
ফুটওয়েট

ধন্যবাদ, এটি সহায়ক। অনিশ্চয়তার প্রকৃতি এখনও অস্পষ্ট, এবং এর জন্য একটি ভাল মডেল একটি ভাল সমাধানকে অনুপ্রাণিত করতে পারে। আপনি সম্ভবত কোনও চিত্র বা উদাহরণ সরবরাহ করতে পারেন বা পরিমাপের প্রক্রিয়াটি আরও কিছুটা বিশদে বর্ণনা করতে পারেন?
হোবার

@ শুভ: আপডেট হয়েছে। এটি যদি সহায়তা করে তবে আমি কিছু বাস্তব নমুনায় লিঙ্ক পোস্ট করার কাজও করব।
ফুটওয়েট

xi,(μ,σ2)σiB(xi,r)rB(x,r)rx

উত্তর:


2

এটি একটি আকর্ষণীয় সমস্যা। প্রথমত, আমি একটি সাধারণ বন্টনের ধারণা গ্রহণ করব না। মনে হচ্ছে আপনি যা খুঁজছেন তা বিচ্ছুরণের কিছু অনুমান যা আপনি অনেকগুলি বিভিন্ন শ্যুটার বা বন্দুক বা গোলাবারুদ বা যে কোনও কিছুতে মোটামুটি প্রয়োগ করেন।

আমি এটিকে ঘুরিয়ে দেওয়ার চেষ্টা করব। আপনি 10 টি পৃথক গর্ত (10 শট ধরে ধরে) না দেখলে সমস্ত গুলি গুলি ঠিক কোথায় গিয়েছিল তা আপনি জানেন না। কিন্তু আপনি জানেন যে তারা কোথায় যায় নি। আপনি যদি কোনও বিতরণ শুরু করতে চান তবে বয়েশিয়ান পরিসংখ্যান ধরে ধরে বিতরণকে সীমাবদ্ধ করতে এটি ব্যবহার করা যেতে পারে।

একটি ধারণা যা এখানে সর্বোত্তম হতে পারে তা হল গাণিতিকভাবে এটি করার চেষ্টা করা বন্ধ করে দেওয়া এবং এটির মতো বুদ্ধিমান কিছু করা। সংযোগযুক্ত অঞ্চল হতে শট চিহ্নিত করতে লক্ষ্য নিন এবং একটি চিত্র প্রক্রিয়াকরণ রুটিন চালান। এর গড় এবং দ্বিতীয় মুহূর্তটি পরিমাপ করুন এবং এগুলি একটি অনুমানকারী। আপনি যদি আরও খানিকটা এগিয়ে যেতে চান এবং এটিকে গাউসাইজ করার চেষ্টা করেন তবে আপনি একটি ক্রমাঙ্কন ফ্যাক্টরটি পেতে সাধারণ মন্টি কার্লো পরীক্ষা চালিয়ে যেতে পারেন।


আমাকে আরও কিছু ব্যাখ্যা করুন। ধরা যাক আপনার 10 টি শট রয়েছে এবং সেখানে 6 টি স্পষ্ট গর্ত রয়েছে যেখানে আপনি জানেন যে বুলেটগুলি কোথায় গেছে। প্রথমে এই পয়েন্টগুলি নিন এবং সেগুলি গাউসির প্রস্থকে সীমাবদ্ধ করতে ব্যবহার করুন। স্বাভাবিক রুটিন অনুসরণ করে এই constrains গসিয়ান সিগমা সিগমা (কিছু পরিচিত বন্টন যাবে। Cs.ubc.ca/~murphyk/Papers/bayesGauss.pdf
Dave31415

এখন, একবার আপনি এটি সম্পন্ন করার পরে, আপনি 4 টি বুলেটগুলি বিবেচনা করতে চান যা নতুন গর্ত করে নি। বুলেটগুলি স্বতন্ত্র হওয়ার কারণে এই নতুন সম্ভাবনাটি (গাউসিয়ান সিগ্মায়) কেবল বহুগুণে বাড়ানো যায়। সুতরাং মূলত 4 টি বুলেটের প্রতিটিটির জন্য, আপনি সম্ভবত কোনও নতুন গর্ত তৈরি করবেন না এমন সম্ভাবনাটি দিয়ে গুণ করতে চান।
ডেভ31415

মন্টি কার্লো দিয়ে এটি করার একটি সহজ উপায় হ'ল আপনার সীমাবদ্ধ বিতরণ থেকে সিগমার একটি সেট আঁকতে এবং এই সিগমা ব্যবহার করে, নতুন গর্ত না করার সম্ভাবনা গণনা করুন। সুতরাং এ থেকে অনেকগুলি সিমুলেটেড শট আঁকুন এবং ভগ্নাংশটি নতুন গর্ত তৈরি করে না তা গণনা করুন। এটি তখন সম্ভাবনা আপডেট করার জন্য ব্যবহার করা যেতে পারে। তারপরে পরের দিকে যান এবং একই কাজ করুন। এখন আপনার চূড়ান্ত সম্ভাবনা আছে।
ডেভ31415

শেষ মন্তব্য। ব্যবহারিক দৃষ্টিকোণ থেকে, সিগমার প্রাক্কলনটি এতটা প্রভাবিত হওয়া উচিত নয় যেখানে আপনি অজানা বুলেটগুলি ধরেছিলেন যতক্ষণ না আপনি ধরে নিয়েছেন যে তারা পূর্বের ছিদ্রগুলির মধ্য দিয়ে গেছে। এটি বেশিরভাগ ক্ষেত্রেই সীমাবদ্ধ থাকবে যা আপনি দেখতে পাচ্ছেন যে প্রান্তটি সংজ্ঞায়িত করা হয়েছে। কারণ কেন্দ্র থেকে দু'বার দূরে একটি গর্ত দিয়ে বুলে যাওয়ার সম্ভাবনা খুব কম। এমনকি কোনও অপরিশোধিত মন্টি কার্লো আপনাকে অনুকূল অনুমানের খুব কাছে এনে দেবে।
ডেভ31415

যদি আমরা একটি সাধারণ (বা অন্য) বিতরণকে দৃ don't়ভাবে না বলে মনে করি তবে সেন্সরড অঞ্চলে কী চলছে তার উপরের বা নীচে আবদ্ধ করা ছাড়া আমরা আরও কিছু বলতে পারি না বলেই মনে হয়। 1-মাত্রিক ক্ষেত্রে যেখানে আমরা এন শটগুলি বৈকল্পিকের উপর একটি নিম্ন-সীমাটি সেন্সর করেছিলাম তা ধরে নেওয়া হয় যে তারা সবগুলি একই সাথে অভ্যন্তরীণ বিন্দুটির সাথে ঘনিষ্ঠভাবে আঘাত করে, এবং (গড়টি অভ্যন্তরীণে কেন্দ্রিক বলে ধরে নেওয়া হয়) একটি উপরের-আবদ্ধটি হবে ধরে নিন যে সেন্সর করা পয়েন্টগুলি সমানভাবে অভ্যন্তরের পরিধিতে বিতরণ করা হয়েছে। তবে আমরা যদি অনুমান করি যে অন্তর্নিহিত প্রক্রিয়াটি স্বাভাবিক হয় তবে আমাদের মনে হয় আমাদের আরও ভাল কিছু করা উচিত।
ফুটওয়েট

0

অন্য সাফল্য বিন্দু থেকে, কেউ এটিকে স্থানীয় পরিসংখ্যানের ক্ষেত্রের আলোকে দেখতে পেত, যা মেট্রিকের একটি ভাণ্ডার তৈরি করেছে, যার অনেকগুলি টুলবক্সে স্থাপন করা হয়েছে (উদাহরণস্বরূপ, https://www.google.com /url?sa=t&source=web&rct=j&ei=SG31U5j4BormsASc5IHgCw&url=http://resources.arcgis.com/en/help/main/10.1/005p/005p00000002000000.htm&cd=13&ved=0CE4QFjAM&usg=AFQjCNFw9AkAa-wo1rgNmx53eclQEIT1pA&sig2=PN4D5e6tyN65fLWhwIFOYA )।

উইকিপিডিয়া (লিঙ্ক: http://en.m.wikedia.org/wiki/Spatial_descripttive_statistics ) স্থানিক কেন্দ্রীয় প্রবণতা এবং স্থানিক বিচ্ছুরণের ব্যবস্থা হিসাবে এই জাতীয় ধারণাগুলি নিয়ে আলোচনা করার জন্য একটি ভাল সূচনা পৃষ্ঠা রয়েছে। পরবর্তী উইকিপিডিয়া উদ্ধৃত:

"বেশিরভাগ অ্যাপ্লিকেশনগুলির জন্য, স্থানিক বিচ্ছুরণকে এমনভাবে পরিমাপ করা উচিত যা ঘূর্ণন এবং প্রতিবিম্বের জন্য অবিচ্ছিন্ন। পয়েন্টের স্থানাঙ্কের কোভরিয়েন্স ম্যাট্রিক্স ব্যবহার করে পয়েন্ট সেটগুলির জন্য স্থানিক বিস্তারের বেশ কয়েকটি সহজ পদক্ষেপ সংজ্ঞায়িত করা যায়। ট্রেস, নির্ধারক , এবং কোভরিয়েন্স ম্যাট্রিক্সের বৃহত্তম ইগন্যাল্যুয়ু স্থানিক বিচ্ছুরণের ব্যবস্থা হিসাবে ব্যবহার করা যেতে পারে the কোভরিয়েন্স ম্যাট্রিক্সের উপর ভিত্তি করে নয় এমন স্থানিক বিস্তারের একটি পরিমাপ নিকটবর্তী প্রতিবেশীদের মধ্যে গড় দূরত্ব [[1] "

সম্পর্কিত ধারণাগুলির মধ্যে স্থানগত একজাতীয়তা, রিপলির কে এবং এল ফাংশন এবং সম্ভবত বুলেট ক্লাস্টারগুলির বিশ্লেষণের জন্য সবচেয়ে প্রাসঙ্গিক, গুচ্ছ জনগোষ্ঠীর মধ্যে উপ-জনগোষ্ঠীর গুচ্ছকরণের জন্য কুজিক – এডওয়ার্ডস পরীক্ষা অন্তর্ভুক্ত রয়েছে। পরবর্তী পরীক্ষাটি নিয়ন্ত্রণ সংখ্যার সাথে তুলনামূলকভাবে ("নিকটতম-প্রতিবেশী" বিশ্লেষণ করে পরিসংখ্যান সারণির জন্য) ব্যবহার করা হয়, যা বর্তমান প্রসঙ্গে ক্লাস্টারিং প্রদর্শন না করে শ্রেণিবদ্ধ করা প্রকৃত পর্যবেক্ষণ লক্ষ্যগুলির উপর ভিত্তি করে হতে পারে, বা তাত্ত্বিক সিমুলেশন প্রতি, রায়লেহে বিতরণ বলুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.