গড় কার্নেল ঘনত্বের মানচিত্রকে সমর্থন করতে কীভাবে ত্রুটি মানচিত্র তৈরি করবেন?


10

আমি একই স্থানিক সীমার মধ্যে স্ট্যাক করা পয়েন্টগুলিতে কেডিএ চালিয়ে একটি গড় কার্নেল ঘনত্বের মানচিত্র তৈরি করেছি। উদাহরণস্বরূপ, বলুন যে আমাদের কাছে তিনটি একই আকার এবং আকারের বিভিন্ন বন ফাঁকিতে চারা উপস্থাপন করে তিনটি পয়েন্টের শেফফিল রয়েছে। আমি প্রতিটি পয়েন্ট শেফিল ফাইলের জন্য একটি কেডিপি চালাতাম। ডি-ই থেকে আউটপুট তারপর অর্ডার উদাহরণস্বরূপ, আর্ক এর রাস্টার ক্যালকুলেটর গড় নিরূপণ করার জন্য স্থানিক ব্যাপ্তি উপর ভিত্তি করে স্তুপীকৃত করা হয়েছে: Float(("KDE1"+"KDE2"+"KDE3")/3)। এখানে চূড়ান্ত পণ্য:

এখানে চিত্র বর্ণনা লিখুন

এখন আমি গড়ের কে-ডি-ই-এর সাথে সম্পর্কিত ত্রুটিটি চিত্রিত করে একটি মানচিত্র তৈরি করতে আগ্রহী। হটস্পটগুলির সাথে কত ত্রুটি যুক্ত হয়েছে তা দৃশ্যত চিত্রিত করতে ত্রুটি মানচিত্রটি ব্যবহার করার আশা করি (উদাহরণস্বরূপ, এসডাব্লু হটস্পটটি এক ফাঁকে থাকা পয়েন্টের কারণে পুরোপুরি কারণে?)। গড়পড়তা হওয়া কে-পি-এসের সাথে যুক্ত ত্রুটির একটি মানচিত্র তৈরি করার বিষয়ে আমি কীভাবে যেতে পারি? এমএসই কি এই ক্ষেত্রে ত্রুটির সবচেয়ে উপযুক্ত পরিমাপ হবে?


3
এটি খুব আকর্ষণীয় বিশ্লেষণ। "স্ট্যান্ডার্ড ত্রুটি" বলতে কী বোঝ? "গড়" স্তর থেকে প্রতিটি ঘনত্বের মানচিত্রের কোনও ধরণের বিচ্যুতি (পার্থক্য)?
ল্যান্ডস্কেপ বিশ্লেষণ

মন্তব্যগুলি সম্বলিত করতে @ ল্যান্ডস্কেপ বিশ্লেষণ পোস্ট সম্পাদিত। হ্যাঁ, আমি ভাবছি যে এমএসই অনুমান এই ক্ষেত্রে সবচেয়ে উপযুক্ত হতে পারে। মূলত, প্রতিটি কে। আর্কজিআইএস এবং / অথবা স্ক্রিপ্টিং ব্যবহার করে কীভাবে এই সমস্ত একসাথে রাখা যায় তা সম্পর্কে আমি নিশ্চিত নই।
হারুন

উত্তর:


8

একটি ক্যাভেট

যখন ডেটাতে কোনও সিস্টেমেটিক ত্রুটি না থাকে তখন একটি নমুনাযুক্ত ত্রুটি নমুনাযুক্ত ডেটা থেকে অনিশ্চয়তা অনুমান করার একটি কার্যকর উপায় এই ধারণাটি এই প্রসঙ্গে সন্দেহজনক বৈধতার কারণ, (ক) কেপিএ মানচিত্রের স্থানীয়ভাবে নির্দিষ্ট ত্রুটি থাকতে পারে যা স্তরগুলির মধ্যে নিয়মিতভাবে অব্যাহত থাকতে পারে এবং (খ) কার্নেল ব্যাসার্ধের বা (বা "ব্যান্ডউইথের বাছাইয়ের কারণে অনিশ্চয়তার সম্ভাব্য বিশাল উপাদান) থাকতে পারে ") এই মানচিত্রের যে কোনও একটি প্রদত্ত সংগ্রহে মোটেও প্রতিফলিত হবে না।

কিছু পছন্দ

তবুও, সম্পর্কিত, সংযুক্ত ("স্ট্যাকড") মানচিত্রের সংগ্রহের মধ্যে পরিবর্তনের চিত্রিত করা একটি দুর্দান্ত ধারণা - যদি আপনি কেবল বর্ণিত সীমাবদ্ধতার কথা মনে করেন তবে। স্থানীয় পরিবর্তনশীলতার কয়েকটি ব্যবস্থা এই সেটিংটিতে প্রাকৃতিক হবে, যার মধ্যে রয়েছে:

  • পরিসর মূল্যবোধের, হয় additively প্রকাশ (সর্বোচ্চ মাইনাস ন্যূনতম) অথবা multiplicatively (সর্বোচ্চ দ্বারা বিভক্ত সর্বনিম্ন)।

  • ভ্যারিয়েন্স বা স্ট্যানডার্ড ডেভিয়েশন মূল্যবোধের। এর গুণক সংস্করণটি হ'ল মানগুলির লগারিদমের ভিন্নতা বা স্ট্যান্ডার্ড বিচ্যুতি ।

  • আন্তঃখণ্ড পরিসীমা (বা তৃতীয় থেকে প্রথম চতুর্ভুজের অনুপাত) এর মতো বিচ্ছুরণের একটি শক্তিশালী অনুমানক ।

বহু ক্ষেত্রে, ঘনত্বের জন্য গুণগত পদক্ষেপগুলি আরও উপযুক্ত হতে পারে, কারণ একর প্রতি ১০০ এবং ১০১ টি গাছের মধ্যে পার্থক্য অপ্রয়োজনীয় হতে পারে যেখানে একর প্রতি ২ এবং ১ টি গাছের মধ্যে পার্থক্য তুলনামূলকভাবে গুরুত্বপূর্ণ হতে পারে। উভয়ই 101 - 100 = 2 - 1 = 1 এর সমান (অ্যাডিটিভ) ব্যাপ্তি প্রদর্শন করে তবে তাদের গুণমানের 1.01 এবং 2.00 এর পরিমাণগুলি যথেষ্ট পার্থক্য করে। (লক্ষ্য করুন যে একটি গুণিত পরিসীমা সর্বদা 1 ছাড়িয়ে যায়, সুতরাং ২.০০ ১.০১ এর চেয়ে ১ শ'গুণ বেশি)

গুনতি

এই ব্যবস্থাগুলি গণনা করার জন্য স্থানীয় পরিসংখ্যানের কিছু ফর্ম প্রয়োজন সেল পরিসংখ্যান স্থানিক বিশ্লেষণ কার্যকারিতা ভেরিয়ানস, রেঞ্জ, এবং স্ট্যান্ডার্ড ডেভিয়েশন গণনা হবে। স্থানীয় কোয়ান্টাইলগুলি র‌্যাঙ্কের সাথে পাওয়া যাবে । কোনটি ব্যবহার করতে হয় তা নিয়ে উদ্বিগ্ন হওয়ার পরিবর্তে চতুর্ভুজগুলির নিকটে সুবিধাজনকগুলি বেছে নিন। তাদের সন্ধান করতে, স্ট্যাকের গ্রিডের সংখ্যা হ'ল এন । মিডিয়ানের (n + 1) / 2 এর একটি পদ রয়েছে - যা পুরো সংখ্যা নাও হতে পারে, এটি এন / 2 এবং এন / 2 + 1 র‌্যাঙ্কের গড় দিয়ে গণনা করা উচিত, যার মধ্যে দুটিই মধ্যমটির আনুমানিক হবে। চতুর্ভুজটিকে আনুমানিক করতে, তারপরে, কাছাকাছি পুরো সংখ্যাটিতে গোল (এন + 1) / 2 লিখুন, তারপরে আবার 1 যুক্ত করুন এবং 2 দিয়ে ভাগ করুন this এই সংখ্যাটি আর হতে দিন । ব্যবহারR এবং এন +1 - R ক্যুয়ারটাইলস পদমর্যাদার জন্য।

উদাহরণস্বরূপ, যদি স্ট্যাকটির এন = 6 গ্রিড থাকে, (এন + 1) / 2 গোলাকার ডাউন 3 এবং (3 + 1) / 2 = 2 এর কোনও বৃত্তাকার প্রয়োজন হয় না। ব্যবহারের R = 2 এবং = 6 + 1 টি - 2 = 5 পদমর্যাদার জন্য। কার্যত, এই পদ্ধতিটি প্রতিটি ঘরে প্রতিটি ছয় মানের দ্বিতীয় সর্বনিম্ন ( r = 2) এবং দ্বিতীয় সর্বোচ্চ ( r = 5) মান প্রদান করবে। আপনি তাদের পার্থক্য বা তাদের অনুপাত মানচিত্র করতে পারেন।


2
আমি কল্পনা করব যে প্রকরণের সহগটি এই প্রসঙ্গে কার্যকর হবে।
জেফ্রি ইভান্স

1
@ জেফ্রে আপনাকেও ধন্যবাদ, এটিও বিবেচনাযোগ্য। (স্থানীয়) গড় গ্রিড দ্বারা (স্থানীয়) স্ট্যান্ডার্ড বিচ্যুতি গ্রিডকে ভাগ করে সিভি প্রাপ্ত হয়। আমি এটি উল্লেখ করিনি, তবে এই জাতীয় গুণগত সংক্ষিপ্তসারগুলির জন্য, যেখানে ডিনোমিনেটর (গড় বা ন্যূনতম, ক্ষেত্রে যেমন হতে পারে) শূন্যের কাছাকাছি অবস্থিত mas কার্নেলগুলি অনুমানের ক্ষেত্রে সংখ্যাসূচক ত্রুটিযুক্ত এবং ক্ষুদ্র ভুলগুলির ব্যতীত অন্য কিছুই প্রতিফলিত করবে।
whuber

@ হুবুহু, আপনি কি আপনার প্রথম অনুচ্ছেদে (ক) বিস্তারিত বর্ণনা করতে পারেন? উদাহরণস্বরূপ, আপনি কি ডেটা সংগ্রহের কৌশলগুলির ত্রুটিগুলি উল্লেখ করছেন যা প্রতিটি বনের ফাঁক ধরেই চলতে পারে (এবং সেইজন্য পদ্ধতিগতভাবে প্রতিটি কে.ডি. রাস্টারগুলিতে নিজেকে প্রকাশ করে), বা ফোকাল ফাংশন বাস্তবায়নের সাথে যুক্ত ত্রুটিগুলি ?
ম্যানিজি

@ শুভ চারদিকে দুর্দান্ত ধারণা - অনেক ধন্যবাদ!
হারুন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.