ভৌগোলিকভাবে ওজনযুক্ত রিগ্রেশন বিশ্লেষণে নাল মান


12

আমার কয়েকটি ব্যাখ্যামূলক ভেরিয়েবলের কয়েকটি বহুভুজের জন্য কয়েকটি নাল মান রয়েছে।

ভৌগলিকভাবে ওয়েটড রিগ্রেশন অ্যানালাইসিস এগুলি পরিচালনা করতে পারে, বা আমার পুরো বহুভুজ এবং সমস্ত ডেটা (সেই নির্দিষ্ট বহুভুজের জন্য নির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবল) মুছে ফেলা উচিত?


এই নালগুলি কী উপস্থাপন করে? যে একটি মান প্রযোজ্য নয় বা এটি বিদ্যমান আছে তবে অজানা? যদি পরেরটি হয় তবে কেন এটি অজানা? (মুখ্য উদ্বেগটি হ'ল মান অজানা হওয়ার কারণটি কোনওভাবেই মানটির সাথে সম্পর্কিত কিনা; উদাহরণস্বরূপ, আপনি যদি জলবিদ্যুত অধ্যয়ন করছেন এবং জমি আবরণকে ব্যাখ্যামূলক ভেরিয়েবল হিসাবে ব্যবহার করছেন, তবে বন্যার কারণে যদি জমি আবরণটি অজানা থাকে, এটি গুরুত্বপূর্ণ তথ্য এবং অর্থ কেবল নিখোঁজ হওয়া মানের চেয়ে অনেক বেশি))
হুবুহু

1
ধন্যবাদ হুঁশিয়ারি, কিছু নাল এমন ডেটা উপস্থাপন করে যা গোপনীয়তার জন্য ছোট ছোট ইউনিটগুলির কারণে বাদ দেওয়া হয়েছিল, অন্যরা সহজলভ্য ছিল না তবে অন্যান্য বর্ণগুলিকে প্রভাবিতকারী ব্যাখ্যাযোগ্য ভেরিয়েবলের ফলাফল হিসাবে নয়। আমার সত্য শূন্য মান রয়েছে যার দ্বারা শূন্যটি সেই নির্দিষ্ট বহুভুজের জন্য কোনও ইভেন্ট / হারের প্রতিনিধিত্ব করে না এবং আমার কিছু নাল মানও রয়েছে যেখানে ডেটা অনুপস্থিত। যেহেতু আমার কাছে প্রায় 29 টি বর্ণনামূলক ভেরিয়েবলগুলি শুরু হয়, যদি আমি বহুভুজগুলি বের করি যেখানে নখগুলিযুক্ত সারিগুলির জন্য, আমি 279 এর মধ্যে 8 বহুভুজ হারাচ্ছি এবং আমি আশা করছি যে আমার এটির দরকার নেই। ধন্যবাদ!
আই হার্ট

আমি নিখোঁজ সম্পর্কে আপনার কাছে তথ্য এবং তত্ত্ব আছে খুশি। আপনি এই ছোট ইউনিটগুলি সম্পর্কে কিছুটা সতর্ক হতে চাইবেন, কারণ যে কোনও ভেরিয়েবলের মানগুলি সম্ভবত এটির অঞ্চলের আকারের সাথে সম্পর্কিত হতে পারে, যার ফলে নিখোঁজ হওয়ার আদলে একটি সম্ভাব্য পক্ষপাত তৈরি করে।
whuber

2
আপনি ভেরিয়েবলগুলির উপস্থিতি নির্দেশ করতে এবং সমস্ত সাধারণ নাল ফলাফলকে একটি সাধারণ মান দিয়ে এনকোড করে নালগুলি অন্তর্ভুক্ত করতে পারেন (কোন মানটি আপনি পছন্দ করেন তা আসলে কিছু যায় আসে না)। আপনার প্রতিটি ভেরিয়েবলের জন্য একটি পৃথক সূচক প্রয়োজন হবে যাতে কোনও নাল থাকে। আপনি যাই করুন না কেন, কেবল শূন্যগুলি (বা অন্য কোনও ধ্রুবক) দ্বারা নালগুলি প্রতিস্থাপন করবেন না! শূন্যের অর্থ শূন্যের চেয়ে সম্পূর্ণ আলাদা something
হোবার

1
@ হুবুহু মনে হচ্ছে আপনার মন্তব্যে এই বিষয়ে একটি উত্তর লেখার জন্য পর্যাপ্ত পরিমাণ থাকতে পারে।
পলিজিও

উত্তর:


1

আপনি আশেপাশের ডেটা থেকে 'নাল' মানগুলি অনুমান করার চেষ্টা করতে পারেন। এটি তাদের ছেড়ে দেওয়ার চেয়ে ভাল হবে, কারণ এইভাবে আপনি ডেটা হারাবেন না। অবশ্যই মূল্যবোধগুলি কীভাবে অনুমান করা যায় সে সম্পর্কে আপনাকে অবশ্যই যত্নবান হতে হবে। কারণ যদি আপনার অনুমান পক্ষপাতদুষ্ট হয় তবে আপনার মডেলটিও হবে।

আরও দেখুন: http://handbook.cochch.org.org/chapter_16/16_1_2_ জেনারেল_প্রিন্সিপালস_দের জন্য_চিকিত্সা_সহ_মিশিং_ডাটা htm

এবং:

সতর্ক করা:

শেফফাইলগুলি যখনই ব্যবহার করবেন তখন মনে রাখবেন যে তারা নাল মান সংরক্ষণ করতে পারে না। সরঞ্জাম বা অন্যান্য পদ্ধতিগুলি যা ননশ্যাপফিল ইনপুটগুলি থেকে শেফফিল তৈরি করে, ফলস্বরূপ নাল মানগুলিকে শূন্য হিসাবে বা কিছু খুব ছোট নেতিবাচক সংখ্যা হিসাবে সংরক্ষণ করতে পারে (-DBL_MAX = -1.7976931348623158e + 308)। এটি অপ্রত্যাশিত ফলাফল হতে পারে। এছাড়াও দেখুন: শেফফিল আউটপুট জন্য জিওপ্রসেসিং বিবেচনা। ( http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weided-regression.htm )

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.