ক্রপিং ইন্টারপোলেশনের জন্য ন্যূনতম সংখ্যা


19

ক্রিগিং পদ্ধতিটি ব্যবহার করে এটি বিভক্ত করার অনুরোধের সাথে আমি নমুনার সংখ্যার সাথে কিছু ডেটা পেয়েছি।
কিছু তদন্তের পরে দেখা গেছে যে ক্রিগিংয়ের ফলাফল (ডিফল্ট প্যারামিটার সহ আর্কজিআইএস জিওস্টাটিস্টিকাল অ্যানালিস্টে সঞ্চালিত) সন্তোষজনক নয়। ইন্টারপোলটেড মানগুলি পরিমাপের (বিশেষত শীর্ষগুলি) থেকে অনেক বেশি পৃথক এবং পৃষ্ঠটি নির্ভরযোগ্য বলে মনে হয় না। এই চিত্রটি এখানে: এখানে চিত্র বর্ণনা লিখুন
আমি মনে করি যে প্রধান সমস্যাটি হ'ল নমুনার অপর্যাপ্ত সংখ্যা।

নির্ভরযোগ্য ফলাফল পেতে আমাদের কতগুলি পয়েন্ট ব্যবহার করা উচিত?
বা ক্রিগিং পদ্ধতি এই জাতীয় বৈচিত্র্যের জন্য উপযুক্ত নয়?


আপনি বলেছিলেন যে "যদিও লোকেরা সাফল্যের সাথে সাতটি তথ্য পয়েন্টকে মেরে ফেলেছে (১৯৮০ এর দশকের শেষদিকে মার্কিন ইপিএ দ্বারা প্রকাশিত রবার্ট জার্নিগান একটি মনোগ্রাফে) ..."। তবে আমি এই নিবন্ধটি খুঁজে পাচ্ছি না। আপনি এই নিবন্ধটির জন্য একটি মুক্ত ঠিকানা দিতে পারেন? আপনাকে ধন্যবাদ ...
আবিলিশি

উত্তর:


30

আপনি যখন "ডিফল্ট মানগুলি" ব্যবহার করেন আপনি সত্যিকার অর্থে ক্রিগিং করেন না, আপনি কেবল ক্রিগিং অ্যালগরিদম প্রয়োগ করছেন - যা আপনি পেয়েছেন যেমন এই ডেটা ব্যবহার করার সময় খুব খারাপ।

(আমি একটি সংক্ষিপ্ত ভাড়ার জন্য একটি সাবানবক্সে পদক্ষেপ নেব: আমার মতে, একটি কম্পিউটার প্রোগ্রামের সাথে খারাপ ফলাফল পাওয়ার দ্রুততম উপায় হল এর ডিফল্ট পরামিতিগুলি গ্রহণ করা Arc আরকিজিআইএস সবচেয়ে খারাপ ধরণের ফলাফল পাওয়ার জন্য সবচেয়ে ধনী, সবচেয়ে শক্তিশালী পরিবেশ this উপায়। নৈতিকটি গুরুত্বপূর্ণ কাজের জন্য সফ্টওয়্যারটি ব্যবহার না করে যতক্ষণ না আপনি এটি কীভাবে নিয়ন্ত্রণ করবেন তা বুঝতে পারবেন না now এখন সোপবক্স থেকে নিচে ...)

কাজের জন্য ক্রিগিংয়ের জন্য আপনাকে "ভেরোগ্রাফি" নামে পরিচিত তথ্যের একটি নিবিড় প্রাথমিক পরিসংখ্যান বিশ্লেষণ করতে হবে। চূড়ান্তভাবে এটি কীভাবে সম্পাদন করে তা আপনার ভূ-তাত্ত্বিক দক্ষতার পাশাপাশি ডেটাগুলির উপর নির্ভর করে। ( জার্নেল অ্যান্ড হুইজব্রেগটসের সেমিনাল মাইনিং জিওস্ট্যাটাস্টিকস এবং ইয়ুভান প্যানাটিয়ার লিখেছেন ভারিওইন সহ ভেরোগ্রাফি সম্পর্কে সম্পূর্ণ বই লেখা হয়েছে ।) যদিও মার্কিন যুক্তরাষ্ট্রে ইপিএ দ্বারা প্রকাশিত রবার্ট জেরিগান একটি মনোগ্রাফে জনগণ সাফল্যের সাথে সাতটি তথ্য পয়েন্ট হিসাবে সফলভাবে হত্যা করেছে। 1980 এর দশকের শেষ), এবং নীতিগতভাবে আপনি শুধু দুই বা তিন পয়েন্ট (আমি করেছেন সেগুলি ব্যবহার করে krige করতে এই কাজ অ্যালগরিদম প্রকট ) সাহিত্য সীমার মধ্যে চলতি নিয়ম 100 পয়েন্ট এবং 20 পয়েন্ট কমপক্ষে থেকে ঐক্যমত্য 30 পয়েন্টের কাছাকাছি বলে মনে হচ্ছে

আপনার ক্ষেত্রে - যদিও আপনি ডেটা বর্ণনা না করেছেন - আপনার কিছু স্পষ্ট সমস্যা রয়েছে, যার মধ্যে অত্যন্ত স্কিউড বিতরণ এবং স্থিরতার প্রমাণের স্বতন্ত্র অভাব রয়েছে। এগুলির জন্য বিশেষ পরিসংখ্যানগত চিকিত্সা বা ক্রিগিংয়ের বিশেষ ফর্মগুলির প্রয়োজন (যেমন একটি স্থানিক জেনারেলাইজড লিনিয়ার মডেল)। আপনার কাছে প্রচুর পরিমাণে ডেটা না হওয়া পর্যন্ত এই জাতীয় ডেটা ক্রিগ করার সময় আপনি ভাল ফলাফল পাবেন না।

কিংবদন্তিটি পরামর্শ দেয় আপনি সম্ভবত ডেটা ইন্টারপোল্টের পরিবর্তে ঘনত্ব গ্রিড তৈরি করার চেষ্টা করছেন : যদিও দুটি পদ্ধতির ফলাফল একই রকম হতে পারে তবে তারা স্বতন্ত্রভাবে বিভিন্ন জিনিস করেন এবং স্বতন্ত্রভাবে আলাদা ব্যাখ্যা করতে পারেন। আপনি যখন কিছু হাইপোটিটিকাল অবিচ্ছিন্ন পৃষ্ঠ থেকে নমুনা হিসাবে বিবেচনা করা হয় তখন আপনি বিভক্ত হন । ইন্টারপোলেশন স্যাম্পলড মানগুলির পূর্বাভাস দেয়। মানক উদাহরণগুলির মধ্যে উচ্চতা পরিমাপ (যা পৃথিবীর পৃষ্ঠের নমুনা দেয়) এবং তাপমাত্রা পরিমাপ (যা "তাপমাত্রার ক্ষেত্রের নমুনা") অন্তর্ভুক্ত করে। আপনি যখন পরিমাণ সম্পর্কে সম্পূর্ণ তথ্য পাবেন তখন আপনি একটি ঘনত্ব গণনা করুনকোনও কিছুর এবং আপনি প্রতি ইউনিট ক্ষেত্রের পরিমাণের একটি স্মুথ সংস্করণ উপস্থাপন করতে চান। (বিভক্তির বিপরীতে, পূর্বাভাস দেওয়ার জন্য কোনও নমুনাবিহীন মূল্যবোধের অস্তিত্ব নেই।) আদর্শ উদাহরণটি একটি জনসংখ্যার ঘনত্ব: ডেটা কোনও অঞ্চলের সমস্ত ব্যক্তির গণনা ; আউটপুট জনসংখ্যার ঘনত্বের মানচিত্র।


6
দুর্দান্ত উত্তর @ শুভ তবে, পয়েন্টের সর্বনিম্ন সংখ্যাটিও আংশিকভাবে স্থানিক ডোমেনের পরিমাণ এবং পূর্বাভাসের কাঙ্ক্ষিত শস্যের উপর নির্ভর করে না? যদি আপনি এটি কোনও নমুনা ইস্যুতে ছড়িয়ে দেন তবে এটি জনসংখ্যা ক্যাপচার এবং নমুনায় স্থানিক পরিবর্তনের প্রশ্নে পরিণত হয়।
জেফ্রি ইভান্স

@ জেফ্রে এটি আংশিক ক্ষেত্রে। দুটি পরিমাণে তথ্যের পরিমাণ বহন করে: ক্রিগিং পূর্বাভাসের বৈকল্পিক (যা স্থানিক ডোমেন জুড়ে পরিবর্তিত হয়) এবং নির্ভুলতা যার সাহায্যে ভেরোগ্রামটি অনুমান করা যায়। পরেরটি প্রায়শই উপেক্ষা করা হয়, বিশেষত ক্রিগিংয়ের traditionalতিহ্যবাহী চিকিত্সাগুলিতে: এটি ঘরে হাতির মতো। আপনি যদি সঠিক ভেরোগ্রামটি জানেন এবং এটির একটি ছোট নগদ / সিল অনুপাত এবং স্থানিক ডোমেনের পরিমাণের তুলনায় বৃহত্তর পরিসীমা রয়েছে তবে আপনি উল্লেখযোগ্যভাবে কয়েকটি ডেটা দিয়ে ক্রিজ করতে পারেন, বিশেষত যদি তারা যথাযথভাবে ডেটা মানগুলির পুরো পরিসীমা নমুনা করে থাকে।
হোয়বার

3
আমি দৃ convinced়ভাবে বিশ্বাস করি যে ক্রিগিং ব্যবহার করা যে কারও একটি ভাল জিওস্ট্যাটাস্টিক কোর্সের প্রয়োজন বা একটি শক্ত জিআইএস / পরিসংখ্যান ব্যাকগ্রাউন্ড থাকা উচিত have সেমিভারিওগ্রামকে কীভাবে সঠিকভাবে মডেল করবেন তা ঝুঁকিতে কিছু দক্ষতার প্রয়োজন।
মাইক টি

1
আমার যে থাম্বের নিয়মটি চেষ্টা করা হয়েছিল: সর্বশক্তিমান ক্রিগিংয়ের জন্য 30 পয়েন্ট এবং দ্বিদ্বিদ্বায়ের জন্য 100 পয়েন্ট।
jareks

1

দুটি পৃথক প্রশ্ন রয়েছে, প্রথমটি ভেরোগ্রামের মূল্যায়ন / মডেলিংয়ে ব্যবহার করার জন্য ডেটা অবস্থানের সংখ্যা এবং দ্বিতীয়ত ক্রিগিং সমীকরণগুলিতে কোনও অ-ডেটা স্থানে মানকে আলাদা করতে (বা গড় মান অনুমান করার জন্য) ব্যবহারের জন্য ডেটা অবস্থানের সংখ্যা একটি অঞ্চল জুড়ে)। ধরে নেওয়া যাক আপনি চলন্ত অনুসন্ধানের প্রতিবেশী ব্যবহার করছেন, আশেপাশের 15-20 টিরও বেশি ডেটা অবস্থানগুলি ফলাফলকে হ্রাস করতে পারে কারণ (1) কেবল অনুসন্ধানের প্রতিবেশীর নিকটস্থ ডেটা অবস্থানগুলিতে শূন্য-ওজন থাকবে না, (2) আরও ডেটা সহ উল্টানো ম্যাট্রিক্সের আকারের অবস্থান বৃহত্তর এবং একটি অসুস্থ শর্তযুক্ত ম্যাট্রিক্স বৃদ্ধির সম্ভাবনা। ক্রিগিংয়ের জন্য প্রয়োজনীয় ডেটা লোকেশনের সংখ্যার উপর ভিত্তি করে সংযোগ স্থাপনের সংখ্যা এবং এই পয়েন্টগুলির স্থানিক নিদর্শন এবং ডেটা অবস্থানগুলির উপর নির্ভর করে। সংক্ষেপে,

ভেরোগ্রামটি নির্ধারণ / মডেলিংয়ের ক্ষেত্রে এটি খুব আলাদা সমস্যা, উদাহরণস্বরূপ দেখুন

1991, মায়ার্স, ডিই, প্রথম ইন্টারের প্রসিডিংয়েস ভারিওগ্রাম অনুমানের উপর। কনফারেন্স। তাত্ক্ষণিকবাজার। কমপি।, সিসমে, তুরস্ক,

30 মার্চ -২ এপ্রিল 1987, দ্বিতীয় খণ্ড, আমেরিকান সায়েন্সেস প্রেস, 261-281

1987, এ। ওয়ারিক এবং ডিই মায়ার্স, ভারিওগ্রাম গণনার জন্য জলসম্পদ গবেষণা গবেষণার জন্য স্যাম্পলিং লোকেশনের অপ্টিমাইজেশন 23, 496-500

এগুলি www.u.arizona.edu/~donalm এ ডাউনলোড করা যায়

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.